Νέα στοιχεία δείχνουν ότι οι κυβερνητικοί υπάλληλοι δεν δείχνουν ιδιαίτερη προτίμηση στο chatbot του Elon Musk, το Grok. Το ερώτημα, όμως, είναι αν υπάρχει καν ευρύτερη απήχηση.
Σύμφωνα με νέο ρεπορτάζ του Reuters, το Grok εμφανίζεται ελάχιστα στα ομοσπονδιακά αρχεία για το πώς χρησιμοποίησε η αμερικανική κυβέρνηση την τεχνητή νοημοσύνη πέρυσι. Δεν είναι, όμως, το μόνο σημάδι ότι το βασικό chatbot της xAI αντιμετωπίζει προβλήματα, ακόμη κι αν ο Musk το τοποθετεί στο κέντρο αυτού που θα μπορούσε να εξελιχθεί στη μεγαλύτερη δημόσια εγγραφή όλων των εποχών.
Το Reuters εξέτασε περισσότερα από 400 παραδείγματα χρήσης AI από την κυβέρνηση, όπου αναφέρονταν συγκεκριμένοι πάροχοι. Το Grok ή η xAI εμφανίζονταν μόλις σε τρεις περιπτώσεις. Και στις τρεις, η χρήση ήταν βασική, όπως σύνταξη εγγράφων ή διαχείριση social media, πάντα μαζί με ανταγωνιστές όπως η Microsoft και η OpenAI. Αντίθετα, τα μοντέλα της OpenAI εμφανίζονταν σε περισσότερα από 230 παραδείγματα, ενώ η Google και η Anthropic εμφανίζονταν δεκάδες φορές η καθεμία.
Παρόμοια εικόνα καταγράφηκε και σε άλλη βάση δεδομένων με πιο φιλόδοξα κρατικά projects AI και μικρότερο αριθμό χρηστών. Το Grok εμφανίστηκε μόλις τρεις φορές: δύο φορές για συνήθεις διοικητικές εργασίες στην Election Assistance Commission και μία φορά σε πιλοτικό πρόγραμμα του Department of Energy στο Lawrence Livermore National Laboratory για περιλήψεις εγγράφων και γενική έρευνα. Το Reuters βρήκε 140 εγγραφές που αφορούσαν Microsoft και OpenAI, ενώ ο σύντομος έλεγχος που έγινε εντόπισε τουλάχιστον 10 εγγραφές για την Anthropic και δεκάδες για το Gemini της Google.
Οι λίστες αυτές δεν αποτυπώνουν πλήρως και με ακρίβεια την υιοθέτηση της τεχνητής νοημοσύνης από το Δημόσιο. Πολλά ακόμη παραδείγματα καταγράφονται χωρίς συγκεκριμένο πάροχο, ενώ είναι σαφές ότι δεν υπάρχει κοινός ορισμός για το τι θεωρείται AI. Τα στοιχεία δεν περιλαμβάνουν επίσης τις υπηρεσίες πληροφοριών ή το Πεντάγωνο, όπου η xAI εξασφάλισε πέρυσι σύμβαση 200 εκατ. δολαρίων και πρόσφατα έλαβε άδεια να λειτουργεί σε διαβαθμισμένα δίκτυα, μετά τον αποκλεισμό της Anthropic.
Παρά αυτά, η εικόνα για το Grok δεν είναι καλή. Εμφανίζεται πολύ λιγότερο από τους ανταγωνιστές του και, όταν εμφανίζεται, αφορά κυρίως βασικές διοικητικές εργασίες, κάτι που δύσκολα συνάδει με το κορυφαίο μοντέλο αιχμής για το οποίο μιλά εδώ και χρόνια ο Musk.
«Απλώς δεν είναι το καλύτερο μοντέλο εκεί έξω.»
Όσοι μίλησαν στο Reuters έδωσαν μια απλή εξήγηση: το Grok δεν είναι τόσο καλό όσο οι ανταγωνιστές του. «Απλώς δεν είναι το καλύτερο μοντέλο εκεί έξω», είπε ανώνυμη πηγή από το Πεντάγωνο, προσθέτοντας ότι το προσωπικό εκεί τείνει να προτιμά το Gemini ή το Claude. Τα δημόσια leaderboards που κατατάσσουν τα μοντέλα AI ενισχύουν αυτή την άποψη. Η Anthropic, η Google και η OpenAI κυριαρχούν στις πρώτες θέσεις, ενώ το Grok σπάνια μπαίνει στην πρώτη δεκάδα, πέρα από ορισμένες κατηγορίες εικόνας ή βίντεο.
Αυτό είναι άβολο για τον Musk και ακόμα πιο άβολο για τη SpaceX, η οποία απορρόφησε την xAI νωρίτερα φέτος. Στο έγγραφο για τη δημόσια εγγραφή, η εταιρεία δείχνει να έχει τοποθετήσει την AI —και ειδικά το Grok— στο κέντρο της πρότασής της προς τους επενδυτές. Η SpaceX υποστηρίζει ότι έχει εντοπίσει «τη μεγαλύτερη αξιοποιήσιμη συνολική αγορά στην ανθρώπινη ιστορία»: μια εντυπωσιακή ευκαιρία 28,5 τρισ. δολαρίων, χωρίς όμως να δίνει χρονοδιάγραμμα για το πότε θα φτάσει εκεί. Σχεδόν όλη αυτή η εκτιμώμενη αξία προέρχεται από την AI, και ειδικά από την enterprise AI, όχι από πυραύλους ή δορυφόρους.
Το Reuters σημειώνει ότι η παρουσία του Grok σε κυβερνητικές υπηρεσίες μπορεί να δείχνει και πώς αποδίδει σε άλλους εργασιακούς χώρους. Στο πλαίσιο της προσπάθειας της xAI να προσελκύσει εταιρικούς πελάτες, ο Musk φέρεται να έχει πιέσει τράπεζες να αγοράσουν συνδρομές στο Grok αν θέλουν να συμμετάσχουν στο IPO της SpaceX. Αν όμως δεν παίρνουν αυτό που πληρώνουν, τέτοιες συμφωνίες μπορεί να αποδειχθούν προσωρινή λύση.
Σαν να μην έφτανε η αδύναμη εικόνα του, ο Musk παραδέχτηκε πρόσφατα ότι η xAI έχει χρησιμοποιήσει μοντέλα της OpenAI για να εκπαιδεύσει και να βελτιώσει το Grok. Η διαδικασία, γνωστή ως distillation, είναι συνηθισμένη όταν οι εταιρείες δουλεύουν με δικά τους μοντέλα, αλλά πολύ πιο αμφιλεγόμενη όταν περιλαμβάνει τη χρήση συστήματος ανταγωνιστή. Το Grok δεν μπορεί καν να ξεπεράσει τα μοντέλα πάνω στα οποία εκπαιδεύεται.
Στην εκδοχή του για τον απλό χρήστη, το Grok είναι επίτηδες αντιπαθητικό. Ο Musk το έχει παρουσιάσει ως μια λιγότερο μεροληπτική και λιγότερο λογοκριμένη εναλλακτική σε εργαλεία όπως το ChatGPT, αλλά αυτό έχει οδηγήσει σε ένα προϊόν με χαλαρά αποδεικτικά κριτήρια, εμμονή με τον ίδιο τον Musk και μακρά ιστορία από προσβλητικές, συνωμοσιολογικές και σεξουαλικοποιημένες απαντήσεις. Ακόμη κι αν τα φίλτρα στον χώρο εργασίας είναι διαφορετικά, δεν είναι βέβαιο ότι κάτι τέτοιο θα έβρισκε θερμή υποδοχή από μια επιχείρηση. Στο ιστορικό του Grok περιλαμβάνονται ύμνοι προς τον Adolf Hitler, αμφισβήτηση των αριθμών για τα θύματα του Ολοκαυτώματος, μαζική ανάρτηση μη συναινετικών σεξουαλικοποιημένων deepfakes στο X, ακόμη και με παιδιά, καθώς και η τροφοδότηση ενός ρατσιστικού και τρανσφοβικού αντιγράφου της Wikipedia και μιας «καυτής» anime girlfriend. Και ας μην ξεχνάμε τη στιγμή που αποκάλεσε τον εαυτό του «MechaHitler». Αν το Grok ήταν ανθρώπινος υπάλληλος, δεν θα αργούσε να εμπλακεί το HR.
Η SpaceX φαίνεται να αναγνωρίζει το πρόβλημα. Στο έγγραφό της προειδοποιεί ότι οι «spicy» ή «unhinged» λειτουργίες του Grok ενέχουν «αυξημένους κινδύνους», μεταξύ των οποίων η βλάβη στη φήμη, ο κανονιστικός έλεγχος και οι αγωγές. Σε εταιρική γλώσσα: αυτό το chatbot μπορεί να μας βάλει σε δικαστικές περιπέτειες.
Το Grok πήρε το όνομά του από το Stranger in a Strange Land του Robert A. Heinlein, όπου περίπου σημαίνει τη βαθιά και ουσιαστική κατανόηση κάποιου πράγματος. Αυτό που πρέπει να γίνει σαφές εδώ δεν είναι ιδιαίτερα σύνθετο: ο Musk έχει ξοδέψει δισεκατομμύρια για να φτιάξει ένα chatbot που δεν είναι ιδιαίτερα καλό, δεν είναι ιδιαίτερα δημοφιλές και, παρ’ όλα αυτά, θεωρείται κεντρικό για να δικαιολογηθεί η αστρονομική αποτίμηση της SpaceX. Καλή τύχη με αυτό.