Ο διευθύνων σύμβουλος του Twitter, Ίλον Μασκ, απειλεί να μηνύσει τη Microsoft, κατηγορώντας την ότι χρησιμοποιεί παράνομα τα δεδομένα της εταιρείας κοινωνικής δικτύωσης για να εκπαιδεύσει το μοντέλο τεχνητής νοημοσύνης της.
Η απειλή του Μασκ με tweet ήρθε στον απόηχο δημοσιευμάτων που ανέφεραν ότι η Microsoft σχεδιάζει να αποσύρει το Twitter από τη διαφημιστική του πλατφόρμα, η οποία επιτρέπει στους αγοραστές διαφημίσεων να διαχειρίζονται όλους τους λογαριασμούς τους στα μέσα κοινωνικής δικτύωσης σε ένα μέρος.
«Εκπαιδεύτηκαν παράνομα χρησιμοποιώντας δεδομένα Twitter», έγραψε ο Μασκ στο Twitter. «Ώρα για μηνύσεις».
Ίλον Μασκ: Πώς «απαντά» στην ανάπτυξη του ChatGPT
Αξίζει πάντως να σημειωθεί ότι ο Μασκ, συχνά γράφει στο Twitter για σχέδια που δεν πραγματοποιούνται ποτέ και μέχρι στιγμής δεν φαίνεται να έχει υποβληθεί κάποια μήνυση.
Η απειλή του Μασκ είναι η πιο πρόσφατη ένδειξη ότι η κατοχή δεδομένων μετατρέπεται γρήγορα σε ένα τεράστιο πεδίο μάχης στη ραγδαία ανάπτυξη της τεχνητής νοημοσύνης. Οι μεγάλες εταιρείες τεχνολογίας εργάζονται για την ανάπτυξη μοντέλων τεχνητής νοημοσύνης αιχμής όπως το GPT του OpenAI, και οι ιδιοκτήτες δεδομένων επιδιώκουν να τα σταματήσουν ή να χρεώνουν για τη χρήση του περιεχομένου τους.
Διαμάχη για την εκπαίδευση
Η Microsoft αναπτύσσει τα δικά της λεγόμενα μεγάλα γλωσσικά μοντέλα (LLM) και πουλάει πρόσβαση στα μοντέλα του OpenAI. Η Microsoft επένδυσε 10 δισεκατομμύρια δολάρια στο OpenAI πέρυσι σε μια ασυνήθιστα δομημένη συμφωνία. Ο Μασκ ήταν συνιδρυτής του OpenAI πριν αποχωρήσει από το διοικητικό συμβούλιο του το 2018 και πρόσφατα παραπονέθηκε για τη μετάβαση της εταιρείας από ένα μη κερδοσκοπικό μοντέλο σε μια πολύτιμη επιχείρηση επηρεασμένη από τη Microsoft.
Τα LLM όπως το GPT απαιτούν terabyte δεδομένων για εκπαίδευση, μεγάλο μέρος των οποίων αφαιρείται από ιστότοπους όπως το Reddit, το StackOverflow και το Twitter. Τα δεδομένα εκπαίδευσης από τα κοινωνικά δίκτυα είναι πολύτιμα επειδή καταγράφουν ανεπίσημες, συνεχόμενες συνομιλίες.
Καθώς αυτά τα νέα μοντέλα τεχνητής νοημοσύνης μετακινούνται από τα ερευνητικά εργαστήρια και τα πανεπιστήμια στον εταιρικό κόσμο, οι κάτοχοι των δεδομένων αρχίζουν να έχουν απαιτήσεις.
Για παράδειγμα, η Reddit είπε νωρίτερα αυτή την εβδομάδα ότι θα χρεώσει τις εταιρείες για την πρόσβαση στη διεπαφή προγραμματισμού που χρησιμοποιείται για την τροφοδοσία των συνομιλιών μεταξύ των Redditors σε λογισμικό εκπαίδευσης AI. Η Universal Music Group είπε επίσης αυτή την εβδομάδα ότι μια τέτοια εκπαίδευση της μουσικής των καλλιτεχνών θα αντιπροσώπευε «παράβαση των συμφωνιών μας και παραβίαση του νόμου περί πνευματικών δικαιωμάτων» ως απάντηση σε ένα viral βίντεο ενός τραγουδιού που ισχυριζόταν ότι χρησιμοποιούσε AI για να μιμηθεί τον ράπερ Drake.
Και η βάση δεδομένων φωτογραφιών Getty Images μηνύει την Stable Diffusion , ισχυριζόμενη ότι η εταιρεία αντέγραψε το περιεχόμενό της για να εκπαιδεύσει τη γεννήτρια εικόνων AI.
Ο Μασκ είπε τον Δεκέμβριο ότι το Twitter θα «παύσει» την πρόσβαση του OpenAI στη βάση δεδομένων του. Έχει επίσης ανακοινώσει τα σχέδιά του να δημιουργήσει το δικό του μεγάλο μοντέλο γλώσσας σε μια από τις εταιρείες του που ονομάζεται TruthGPT.