Η Anthropic αναπτύσσει ένα νέο μοντέλο AI, γνωστό ως Claude Mythos ή Capybara, που η ίδια η εταιρεία χαρακτηρίζει ως «το πιο ισχυρό που έχουμε κατασκευάσει ποτέ». Η ύπαρξή του αποκαλύφθηκε από διαρροή δεδομένων, όταν προσχέδια blog posts βρέθηκαν σε μη ασφαλή, δημόσια προσβάσιμο αποθηκευτικό χώρο. Το μοντέλο δεν έχει κυκλοφορήσει ακόμα στο ευρύ κοινό — εν μέρει γιατί η Anthropic ανησυχεί σοβαρά για τις κυβερνοασφαλείς επιπτώσεις του.
Η Anthropic δεν σχεδίαζε να ανακοινώσει το νέο της μοντέλο έτσι. Ένα ανθρώπινο λάθος στη διαχείριση του συστήματος δημοσίευσης περιεχομένου άφησε εκτεθειμένα σχεδόν 3.000 ψηφιακά αρχεία σε έναν δημόσια προσβάσιμο αποθηκευτικό χώρο — ανάμεσά τους ένα προσχέδιο blog post που περιέγραφε λεπτομερώς ένα μοντέλο AI που δεν έχει ακόμα κυκλοφορήσει. Το εντόπισαν ερευνητές κυβερνοασφάλειας και το αποκάλυψε το Fortune. Η Anthropic έκλεισε την πρόσβαση μόλις ενημερώθηκε.
Το μοντέλο αναφέρεται με δύο ονόματα στα διαρρεύσαντα έγγραφα: Claude Mythos και Capybara. Η εταιρεία φαίνεται να χρησιμοποιεί το «Capybara» ως εμπορική ονομασία για μια νέα κατηγορία μοντέλων — μεγαλύτερη και πιο ισχυρή από τα υπάρχοντα Opus, που μέχρι τώρα ήταν η κορυφαία σειρά της. Το «Mythos» φαίνεται να είναι το εσωτερικό όνομα για το συγκεκριμένο μοντέλο αυτής της κατηγορίας. Σε δήλωσή της, η Anthropic επιβεβαίωσε ότι αναπτύσσει και δοκιμάζει ένα νέο μοντέλο με «σημαντικές βελτιώσεις στη λογική, τον προγραμματισμό και την κυβερνοασφάλεια», χαρακτηρίζοντάς το «βήμα αλλαγής» σε σχέση με ό,τι έχει κυκλοφορήσει ως τώρα.
Αυτό που κάνει το Mythos ιδιαίτερα ενδιαφέρον — και ταυτόχρονα ανησυχητικό — είναι η σχέση του με την κυβερνοασφάλεια. Σύμφωνα με το διαρρεύσαν κείμενο, το μοντέλο είναι «μακράν μπροστά από οποιοδήποτε άλλο AI σε κυβερνοδυνατότητες» και μπορεί να εντοπίζει και να εκμεταλλεύεται αδυναμίες σε κώδικα με τρόπο που ξεπερνά τις αμυντικές δυνατότητες των σημερινών συστημάτων. Η Anthropic το λέει ξεκάθαρα: ανησυχεί ότι το μοντέλο θα μπορούσε να χρησιμοποιηθεί για μαζικές κυβερνοεπιθέσεις. Γι’ αυτό και η κυκλοφορία του ξεκινά με περιορισμένη πρόσβαση, αποκλειστικά σε οργανισμούς που ασχολούνται με την άμυνα στον κυβερνοχώρο — για να έχουν χρόνο να ενισχύσουν τα συστήματά τους πριν το μοντέλο γίνει ευρύτερα διαθέσιμο.
Η ανησυχία δεν είναι θεωρητική. Η Anthropic έχει ήδη τεκμηριώσει περιπτώσεις όπου κινεζικές κρατικά υποστηριζόμενες ομάδες χάκερ χρησιμοποίησαν το Claude για να διεισδύσουν σε δεκάδες οργανισμούς — εταιρείες τεχνολογίας, χρηματοπιστωτικά ιδρύματα, κυβερνητικές υπηρεσίες. Η εταιρεία εντόπισε την επιχείρηση, έκλεισε τους λογαριασμούς και ειδοποίησε τους πληγέντες. Αν ένα λιγότερο ισχυρό μοντέλο μπορούσε να χρησιμοποιηθεί έτσι, το ερώτημα για το Mythos γράφεται μόνο του.
Παράλληλα, τα διαρρεύσαντα έγγραφα αποκάλυψαν και κάτι άλλο: η Anthropic ετοιμάζει ένα κλειστό retreat για CEOs ευρωπαϊκών εταιρειών σε έναν αγγλικό πύργο του 18ου αιώνα, με παρουσία του ίδιου του Dario Amodei. Η εικόνα είναι αποκαλυπτική για τη στρατηγική της εταιρείας: το Mythos δεν είναι απλώς ένα τεχνολογικό επίτευγμα, είναι και ένα εργαλείο διείσδυσης στις μεγάλες επιχειρήσεις.
Το ερώτημα που μένει ανοιχτό είναι πόσο καλά μπορεί κανείς να ελέγξει ένα μοντέλο που, σύμφωνα με τους ίδιους τους δημιουργούς του, ξεπερνά τις αμυντικές δυνατότητες της εποχής του. Η Anthropic φαίνεται να το γνωρίζει — και αυτό, από μόνο του, είναι μια σπάνια παραδοχή στον κόσμο της τεχνητής νοημοσύνης.