Η Meta βρίσκεται αντιμέτωπη με ομαδική αγωγή που κατέθεσαν πέντε μεγάλοι εκδοτικοί οίκοι και ένας συγγραφέας, με την κατηγορία ότι η εταιρεία «επέδωσε σε μία από τις πιο εκτεταμένες παραβιάσεις υλικού που προστατεύεται από πνευματικά δικαιώματα στην ιστορία» όταν εκπαίδευε τα μοντέλα τεχνητής νοημοσύνης Llama, όπως ανέφερε νωρίτερα η New York Times.
Στην αγωγή τους, οι Macmillan, McGraw-Hill, Elsevier, Hachette, Cengage και ο συγγραφέας Scott Turow υποστηρίζουν ότι η Meta «αντέγραψε επανειλημμένα» τα βιβλία και τα επιστημονικά τους άρθρα χωρίς άδεια.
Η αγωγή κατηγορεί τη Meta ότι άντλησε εν γνώσει της προστατευόμενο υλικό από «διαβόητους πειρατικούς ιστότοπους», όπως οι LibGen, Anna’s Archive, Sci-Hub, Sci-Mag και άλλοι, και στη συνέχεια το χρησιμοποίησε για την εκπαίδευση του μοντέλου της. Υποστηρίζει επίσης ότι η Meta εκπαίδευσε το Llama με πληροφορίες από το σύνολο δεδομένων Common Crawl, το οποίο φέρεται να είναι «γεμάτο μη εξουσιοδοτημένα αντίγραφα έργων που προστατεύονται από πνευματικά δικαιώματα». Ως αποτέλεσμα, το Llama «παράγει αυτολεξεί και σχεδόν αυτολεξεί αποδόσεις» τέτοιου υλικού:
Για παράδειγμα, όταν του δόθηκαν δύο σύντομες προτάσεις από το ευπώλητο εγχειρίδιο της Cengage, Calculus: Early Transcendentals, 9th edition, του James Stewart, το Llama αρχίζει να αναπαράγει λέξη προς λέξη τη συνέχεια της ενότητας.
Ήδη αρκετοί συγγραφείς έχουν κινηθεί νομικά κατά της Meta για φερόμενη παραβίαση πνευματικών δικαιωμάτων, κάτι που έφερε στο φως εσωτερικές συζητήσεις της εταιρείας για το πώς πρέπει να διαχειριστεί «δημοσιεύματα που υποδηλώνουν ότι έχουμε χρησιμοποιήσει ένα σύνολο δεδομένων που γνωρίζουμε ότι είναι πειρατικό». Πέρυσι, ομοσπονδιακός δικαστής αποφάσισε υπέρ της Meta σε μία από αυτές τις υποθέσεις, επισημαίνοντας ωστόσο ότι η απόφασή του «δεν σημαίνει ότι η χρήση προστατευμένου υλικού από τη Meta για την εκπαίδευση των γλωσσικών της μοντέλων είναι νόμιμη».
Και μια ομάδα συγγραφέων είχε στραφεί νομικά κατά της Anthropic για παραβίαση πνευματικών δικαιωμάτων. Αν και ομοσπονδιακός δικαστής έκρινε ότι η εκπαίδευση μοντέλων τεχνητής νοημοσύνης σε βιβλία που αγοράστηκαν νόμιμα, χωρίς άδεια, αποτελεί fair use, επέτρεψε στους συγγραφείς να συνεχίσουν ομαδική αγωγή για τα «εκατομμύρια» έργα που η Anthropic φέρεται να έχει πειρατεύσει. Η Anthropic συμφώνησε πέρυσι να καταβάλει 1,5 δισ. δολάρια σε συγγραφείς για τον διακανονισμό της ομαδικής αγωγής.
Ο Turow και οι εκδοτικοί οίκοι ζητούν αποζημιώσεις από τη Meta και από το δικαστήριο να διατάξει την εταιρεία να σταματήσει τις φερόμενα παράνομες ενέργειές της. Ζητούν επίσης να υποχρεωθεί η εταιρεία να δώσει λίστα με βιβλία, επιστημονικά άρθρα και άλλα έργα που προστατεύονται από πνευματικά δικαιώματα και στα οποία εκπαιδεύτηκαν τα μοντέλα Llama.
«Η τεχνητή νοημοσύνη τροφοδοτεί μετασχηματιστικές καινοτομίες, παραγωγικότητα και δημιουργικότητα για ιδιώτες και εταιρείες, και τα δικαστήρια έχουν σωστά κρίνει ότι η εκπαίδευση AI σε υλικό που προστατεύεται από πνευματικά δικαιώματα μπορεί να θεωρηθεί fair use», δήλωσε σε email προς το The Verge ο εκπρόσωπος της Meta, Dave Arnold. «Θα πολεμήσουμε αυτή την αγωγή με αποφασιστικότητα.»