Το Anthropic ξεκλειδώνει το Claude 3 – «Είναι καλύτερο από το ChatGPT και το Gemini»

Η νεοσύστατη εταιρεία τεχνητής νοημοσύνης Anthropic κυκλοφόρησε το Claude 3, την τελευταία έκδοση του μεγάλου γλωσσικού της μοντέλου (LLM), το οποίο ισχυρίζεται ότι είναι πιο ισχυρό από το GPT-4 της OpenAI.

Το Claude 3 ανακοινώθηκε τη Δευτέρα και διατίθεται σε τρία διαφορετικά μεγέθη: Opus, Sonnet και Haiku. Το Opus είναι το πιο ισχυρό από τα τρία και είναι διαθέσιμο σε προγραμματιστές και χρήστες μέσω του API της Anthropic και της συνδρομής Claude Pro. Το Sonnet είναι προσβάσιμο από προγραμματιστές μέσω ενός API και επί του παρόντος τροφοδοτεί το δωρεάν web chatbot της Anthropic. Το μικρότερο μοντέλο, το Haiku, δεν είναι ακόμη διαθέσιμο.

Σε ακαδημαϊκά τεστ αναφοράς – που αξιολογούν την ικανότητα των LLMs να διατηρούν κοινές γνώσεις, να λύνουν μαθηματικά προβλήματα, να δημιουργούν κώδικα και να επιδεικνύουν ικανότητες συλλογισμού – το Opus σημείωσε υψηλότερη βαθμολογία από το GPT-4 του OpenAI και το Gemini Ultra της Google, αναφέρει η Anthropic. Ο προγραμματιστής έφτασε στο σημείο να υπερηφανεύεται ότι το Opus “παρουσιάζει σχεδόν ανθρώπινα επίπεδα κατανόησης και ευχέρειας σε σύνθετες εργασίες, οδηγώντας τα σύνορα της γενικής νοημοσύνης”.

Εν τω μεταξύ, τα Sonnet και Haiku είναι πιο ισχυρά από το προηγούμενο μοντέλο GPT-3.5 της OpenAI, αλλά λιγότερο ικανά από τα μοντέλα Gemini Ultra και Pro της Google.

Η Anthropic εξήγησε ότι το παράθυρο πλαισίου – το ποσό της εισόδου που μπορεί να επεξεργαστεί ταυτόχρονα – θα είναι αρχικά 200K tokens, αλλά είναι ικανό να φτάσει μέχρι και ένα εκατομμύριο tokens.

Το Opus είναι ακριβό και έχει σχεδιαστεί για χρήστες που επιθυμούν να χρησιμοποιήσουν την τεχνητή νοημοσύνη για εργασίες που απαιτούν κορυφαία επίπεδα κατανόησης και παραγωγής δεδομένων – όπως η επιστημονική έρευνα ή η ανάλυση μεγάλων, πολύπλοκων αναφορών. Κοστίζει 15 δολάρια για την επεξεργασία μιας προτροπής εισόδου που εκτείνεται σε ένα εκατομμύριο tokens και 75 δολάρια για τη δημιουργία ενός εκατομμυρίου tokens για έξοδο. Συγκριτικά, η OpenAI χρεώνει μεταξύ 10 και 30 δολαρίων για την επεξεργασία και τη δημιουργία ενός εκατομμυρίου tokens στο μοντέλο GPT-4 Turbo.

Το Sonnet απευθύνεται σε mainstream επιχειρηματικούς χρήστες που χρειάζονται ένα ικανό αλλά γρήγορο μοντέλο που μπορεί να κάνει πράγματα όπως αναζήτηση και ανάκτηση πληροφοριών, συγγραφή κειμένου μάρκετινγκ ή παραγωγή κώδικα. Έχει βελτιστοποιηθεί για εφαρμογές μεγάλης κλίμακας και κοστίζει 3 και 15 δολάρια για τον χειρισμό ενός εκατομμυρίου tokens στην είσοδο και την έξοδο, αντίστοιχα. Το Haiku θα είναι ακόμη φθηνότερο, με κόστος 0,25 δολάρια και 1,25 δολάρια για την επεξεργασία και την παραγωγή ενός εκατομμυρίου tokens. Θα πρέπει να είναι χρήσιμο για πράγματα όπως ο συντονισμός περιεχομένου, η γλωσσική μετάφραση ή η εξυπηρέτηση πελατών.

Η Amazon ανακοίνωσε ότι θα φιλοξενήσει τα μοντέλα Claude 3 της Anthropic στην πλατφόρμα νέφους Bedrock: το Sonnet άμεσα, και τα Opus και Haiku κάποια στιγμή σύντομα. Παρόμοια είναι η συνθήκη και για το Vertex AI Model Garden του Google Cloud: Το Sonnet είναι διαθέσιμο σήμερα σε ιδιωτική προεπισκόπηση, με πρόσβαση API και στα τρία μοντέλα να έρχεται σύντομα.

Το Claude 3 είναι επίσης λιγότερο επιφυλακτικό από τον προκάτοχό του. Η Claude 2.1 συχνά αρνούνταν να συμμορφωθεί με προτροπές που δεν ήταν απαραίτητα επιβλαβείς – όπως οι αιτήσεις για τη συγγραφή μιας φανταστικής ιστορίας. Η ανακοίνωση του προγραμματιστή διαβεβαίωνε τους χρήστες: “Έχουμε σημειώσει σημαντική πρόοδο σε αυτόν τον τομέα: Τα Opus, Sonnet και Haiku είναι σημαντικά λιγότερο πιθανό να αρνηθούν να απαντήσουν σε προτροπές που αγγίζουν τα όρια των προστατευτικών κιγκλιδωμάτων του συστήματος από ό,τι οι προηγούμενες γενιές μοντέλων”.

Εννοιολογική απεικόνιση προσώπου AI

Το μεγαλύτερο πρόβλημα που ταλαιπωρεί τα LLM, ωστόσο, είναι η τάση τους να παράγουν ανακριβείς πληροφορίες ή να επινοούν κατευθείαν πράγματα με τέτοια αυτοπεποίθηση που οι χρήστες μπορεί κάλλιστα να τα πιστέψουν. Τα λάθη -που αναφέρονται ως παραισθήσεις- καθιστούν δύσκολη την εμπιστοσύνη στα αποτελέσματα του λογισμικού τεχνητής νοημοσύνης, πόσο μάλλον την παροχή μεγαλύτερης αυτονομίας στους υπολογιστές σε εργασίες.

Η Anthropic υποσχέθηκε ότι το Opus προσφέρει “διπλάσια βελτίωση” στην ακρίβεια σε σύγκριση με το Claude 2.1, και θα εισαγάγει μια λειτουργία που θα παραθέτει τις πηγές στις εκροές που παράγονται από τα τελευταία μοντέλα της για να τις επιθεωρούν οι χρήστες. Αυτό είναι παρόμοιο με, ας πούμε, το Google Gemini, το οποίο επίσης αναφέρει από πού πήρε τις πληροφορίες του σε ορισμένες από τις απαντήσεις του σε προτροπές.

“Δεν πιστεύουμε ότι η νοημοσύνη των μοντέλων βρίσκεται κοντά στα όριά της και σκοπεύουμε να κυκλοφορήσουμε συχνές ενημερώσεις για την οικογένεια μοντέλων Claude 3 τους επόμενους μήνες. Είμαστε επίσης ενθουσιασμένοι που θα κυκλοφορήσουμε μια σειρά χαρακτηριστικών για να ενισχύσουμε τις δυνατότητες των μοντέλων μας, ιδιαίτερα για περιπτώσεις χρήσης σε επιχειρήσεις και εφαρμογές μεγάλης κλίμακας”, καταλήγει η ανακοίνωση της Anthropic.

Must read

Related Articles