Το ChatGPT αποκλείει τις μη-αγγλικές γλώσσες από την επανάσταση της Τεχνητής Νοημοσύνης

Η Fung, διευθύντρια του Κέντρου Έρευνας Τεχνητής Νοημοσύνης στο Πανεπιστήμιο Επιστήμης και Τεχνολογίας του Χονγκ Κονγκ, η οποία μιλάει η ίδια επτά γλώσσες, βλέπει την προκατάληψη υπέρ των αγγλικών να προϋπάρχει και στον δικό της τομέα. “Αν δεν δημοσιεύεις εργασίες στα αγγλικά, δεν είσαι σχετικός”, λέει. “Οι μη αγγλόφωνοι τείνουν να τιμωρούνται επαγγελματικά”.

Η Fung θα ήθελε να δει την τεχνητή νοημοσύνη να το αλλάζει αυτό και όχι να ενισχύει περαιτέρω την πρωτοκαθεδρία της αγγλικής γλώσσας. Είναι μέλος μιας παγκόσμιας κοινότητας ερευνητών ΤΝ που δοκιμάζουν τις γλωσσικές δεξιότητες του ChatGPT και των ανταγωνιστικών του chatbots και κρούουν τον κώδωνα του κινδύνου για τα στοιχεία που δείχνουν ότι είναι σημαντικά λιγότερο ικανά σε άλλες γλώσσες εκτός της αγγλικής.

Παρόλο που οι ερευνητές έχουν εντοπίσει κάποιες πιθανές διορθώσεις, τα κυρίως αγγλόφωνα chatbots εξαπλώνονται. “Μία από τις μεγαλύτερες ανησυχίες μου είναι ότι θα επιδεινώσουμε την κυριαρχία που υπάρχει από τα αγγλικά και τους αγγλόφωνους”, λέει ο Thien Huu Nguyen, ένας επιστήμονας πληροφορικής του Πανεπιστημίου του Όρεγκον, ο οποίος επίσης έχει ασχοληθεί με την υπόθεση των στρεβλών chatbots. “Οι άνθρωποι θα ακολουθήσουν τον κανόνα και δεν θα σκεφτούν τη δική τους ταυτότητα ή κουλτούρα. Αυτό σκοτώνει την ποικιλομορφία. Σκοτώνει την καινοτομία”.
Ειδικά σε άλλες γλώσσες, όπως τα κορεατικά, με μη λατινικές γραφές.

Παρά τις πολλές πρόσφατες συζητήσεις για το ότι η τεχνητή νοημοσύνη αποκτά μεγάλες δυνατότητες, τα συστήματα τύπου ChatGPT αγωνίζονται επίσης να
να αναμειγνύουν με ευχέρεια γλώσσες στην ίδια έκφραση – ας πούμε αγγλικά και ταμίλ – όπως κάνουν δισεκατομμύρια άνθρωποι στον κόσμο καθημερινά. Η μελέτη του Nguyen αναφέρει ότι οι δοκιμές του ChatGPT τον Μάρτιο έδειξαν ότι είχε σημαντικά χειρότερες επιδόσεις στην απάντηση πραγματικών ερωτήσεων ή στην περίληψη σύνθετου κειμένου σε μη αγγλικές γλώσσες και ήταν πιο πιθανό να κατασκευάσει πληροφορίες. “Αυτή είναι μια αγγλική πρόταση, οπότε δεν υπάρχει τρόπος να τη μεταφράσουμε στα βιετναμέζικα”, απάντησε ανακριβώς το ρομπότ σε ένα ερώτημα.

Παρά τους περιορισμούς της τεχνολογίας, οι εργαζόμενοι σε όλο τον κόσμο στρέφονται στα chatbots για βοήθεια στην επεξεργασία επιχειρηματικών ιδεών, στη σύνταξη εταιρικών email και στην τελειοποίηση του κώδικα λογισμικού. Αν τα εργαλεία συνεχίσουν να λειτουργούν καλύτερα στα αγγλικά, θα μπορούσαν να αυξήσουν την πίεση για την εκμάθηση της γλώσσας σε ανθρώπους που ελπίζουν να κερδίσουν μια θέση στην παγκόσμια οικονομία. Αυτό θα μπορούσε να προωθήσει ένα σπιράλ επιβολής και επιρροής της αγγλικής γλώσσας που ξεκίνησε με τη Βρετανική Αυτοκρατορία.

Δεν ανησυχούν μόνο οι μελετητές της τεχνητής νοημοσύνης. Σε ακρόαση στο αμερικανικό Κογκρέσο αυτό το μήνα, ο γερουσιαστής Alex Padilla από την Καλιφόρνια ρώτησε τον Sam Altman, διευθύνοντα σύμβουλο της δημιουργού του ChatGPT, OpenAI, η οποία εδρεύει στην πολιτεία, τι κάνει η εταιρεία του για να καλύψει το γλωσσικό χάσμα. Περίπου το 44% των Καλιφορνέζων μιλούν μια γλώσσα διαφορετική από τα αγγλικά. Ο Altman δήλωσε ότι ελπίζει να συνεργαστεί με κυβερνήσεις και άλλους οργανισμούς για να αποκτήσει σύνολα δεδομένων που θα ενισχύσουν τις γλωσσικές δεξιότητες του ChatGPT και θα διευρύνουν τα οφέλη του σε “όσο το δυνατόν περισσότερο πληθυσμό”.

Ο Padilla, ο οποίος μιλάει επίσης ισπανικά, είναι επιφυλακτικός σχετικά με τα συστήματα που παρέχουν δίκαια γλωσσικά αποτελέσματα χωρίς μεγάλες αλλαγές στις στρατηγικές από τους προγραμματιστές τους. “Αυτές οι νέες τεχνολογίες υπόσχονται πολλά για την πρόσβαση σε πληροφορίες, την εκπαίδευση και την ενισχυμένη επικοινωνία και πρέπει να διασφαλίσουμε ότι η γλώσσα δεν θα αποτελέσει εμπόδιο για αυτά τα οφέλη”, λέει.

Η OpenAI δεν έχει κρύψει το γεγονός ότι τα συστήματά του είναι προκατειλημμένα. Η κάρτα αναφοράς της εταιρείας για το GPT-4, το πιο προηγμένο γλωσσικό μοντέλο της, το οποίο είναι διαθέσιμο στους χρήστες που πληρώνουν για το ChatGPT, αναφέρει ότι η πλειονότητα των υποκείμενων δεδομένων προήλθε από την αγγλική γλώσσα και ότι οι προσπάθειες της εταιρείας για την τελειοποίηση και τη μελέτη των επιδόσεων του μοντέλου επικεντρώθηκαν κυρίως στην αγγλική γλώσσα “με αμερικανοκεντρική οπτική γωνία”. Ή όπως έγραψε ένα μέλος του προσωπικού τον περασμένο Δεκέμβριο στο φόρουμ υποστήριξης της εταιρείας, αφού ένας χρήστης ρώτησε αν η OpenAI θα προσθέσει ισπανική υποστήριξη στο ChatGPT, “Οποιαδήποτε καλά ισπανικά αποτελέσματα είναι ένα μπόνους”. Η OpenAI αρνήθηκε να σχολιάσει για την παρούσα ιστορία.

Η Jessica Forde, διδακτορική φοιτήτρια πληροφορικής στο Πανεπιστήμιο Brown, επέκρινε την OpenAI επειδή δεν αξιολόγησε διεξοδικά τις δυνατότητες του GPT-4 σε άλλες γλώσσες πριν το κυκλοφορήσει. Είναι μεταξύ των ερευνητών που θα ήθελαν οι εταιρείες να εξηγούν δημοσίως τα δεδομένα εκπαίδευσής τους και να παρακολουθούν την πρόοδό τους όσον αφορά την πολυγλωσσική υποστήριξη. “Τα αγγλικά έχουν τσιμεντωθεί τόσο πολύ επειδή οι άνθρωποι έλεγαν (και μελετούσαν), μπορεί αυτό να αποδώσει όπως ένας δικηγόρος στα αγγλικά ή ένας γιατρός στα αγγλικά; Μπορεί αυτό να παράγει μια κωμωδία στα αγγλικά; Αλλά δεν ρωτούν το ίδιο για άλλες γλώσσες”, λέει.

Must read

Related Articles