Έρχεται το ChatGPT για ρομπότ – Θα τους δώσει «ικανότητα συλλογισμού που μοιάζει με την ανθρώπινη»

Η ovariant ανακοίνωσε αυτή την εβδομάδα την κυκλοφορία του RFM-1 (Robotics Foundation Model 1). Ο Peter Chen, συνιδρυτής και διευθύνων σύμβουλος του spinout τεχνητής νοημοσύνης του UC Berkeley, λέει στο TechCrunch ότι η πλατφόρμα, “είναι βασικά ένα μεγάλο γλωσσικό μοντέλο (LLM), αλλά για τη γλώσσα των ρομπότ”.

Το RFM-1 είναι το αποτέλεσμα, μεταξύ άλλων, ενός τεράστιου όγκου δεδομένων που συλλέχθηκαν από την ανάπτυξη της πλατφόρμας Brain AI της Covariant. Με τη συγκατάθεση των πελατών, η startup έχει δημιουργήσει το ρομποτικό ισοδύναμο μιας βάσης δεδομένων LLM.

“Το όραμα του RFM-1 είναι να τροφοδοτήσει τα δισεκατομμύρια ρομπότ που θα έρθουν”, λέει ο Chen. “Εμείς στην Covariant έχουμε ήδη αναπτύξει πολλά ρομπότ σε αποθήκες με επιτυχία. Αλλά αυτό δεν είναι το όριο του πού θέλουμε να φτάσουμε. Θέλουμε πραγματικά να τροφοδοτήσουμε ρομπότ στη μεταποίηση, την επεξεργασία τροφίμων, την ανακύκλωση, τη γεωργία, τη βιομηχανία υπηρεσιών και ακόμη και στα σπίτια των ανθρώπων”.

Η πλατφόρμα εγκαινιάζεται καθώς όλο και περισσότερες εταιρείες ρομποτικής συζητούν το μέλλον των συστημάτων “γενικής χρήσης”. Η ξαφνική επέλαση εταιρειών ανθρωποειδών ρομποτικών συστημάτων όπως οι Agility, Figure, 1X και Apptronik έχει παίξει καθοριστικό ρόλο σε αυτή τη συζήτηση. Ο συντελεστής μορφής είναι ιδιαίτερα κατάλληλος για προσαρμοστικότητα (όπως και οι άνθρωποι στους οποίους βασίζεται), αν και η ανθεκτικότητα των ενσωματωμένων συστημάτων τεχνητής νοημοσύνης/λογισμικού είναι ένα εντελώς διαφορετικό ζήτημα.

“Μας αρέσει πολύ η δουλειά που γίνεται στο χώρο του υλικού των ρομπότ γενικότερου σκοπού”, λέει ο Chen. “Η σύζευξη του σημείου καμπής της νοημοσύνης με το σημείο καμπής του υλικού είναι το σημείο όπου θα δούμε ακόμη μεγαλύτερη έκρηξη των εφαρμογών των ρομπότ. Αλλά πολλές από αυτές δεν έχουν επιτευχθεί πλήρως ακόμη, ιδίως από την πλευρά του υλικού. Είναι πολύ δύσκολο να προχωρήσουμε πέρα από το σκηνοθετημένο βίντεο. Πόσοι άνθρωποι έχουν αλληλεπιδράσει με ένα ανθρωποειδές αυτοπροσώπως; Αυτό σας δείχνει τον βαθμό ωριμότητας”.

Η Covariant δεν αποφεύγει, ωστόσο, τις ανθρώπινες συγκρίσεις όταν πρόκειται για τον ρόλο που παίζει το RFM-1 στις διαδικασίες λήψης αποφάσεων των ρομπότ. Σύμφωνα με το υλικό τύπου της, η πλατφόρμα, “παρέχει στα ρομπότ την ανθρώπινη ικανότητα να σκέφτονται, αντιπροσωπεύοντας την πρώτη φορά που η Generative AI έχει δώσει με επιτυχία στα εμπορικά ρομπότ μια βαθύτερη κατανόηση της γλώσσας και του φυσικού κόσμου”.

Αυτό είναι ένα από εκείνα τα πεδία όπου πρέπει να είμαστε προσεκτικοί με τους ισχυρισμούς, τόσο όσον αφορά τις συγκρίσεις με αφηρημένες – ή ακόμη και φιλοσοφικές – έννοιες όσο και την πραγματική τους αποτελεσματικότητα στον πραγματικό κόσμο με την πάροδο του χρόνου. Η “ικανότητα συλλογισμού που μοιάζει με την ανθρώπινη” είναι μια ευρεία έννοια που σημαίνει πολλά διαφορετικά πράγματα για πολλούς διαφορετικούς ανθρώπους. Εδώ η έννοια αφορά την ικανότητα του συστήματος να επεξεργάζεται δεδομένα του πραγματικού κόσμου και να καθορίζει την καλύτερη πορεία δράσης για την εκτέλεση της εκάστοτε εργασίας.

Αυτό αποτελεί μια απόκλιση από τα παραδοσιακά ρομποτικά συστήματα που είναι προγραμματισμένα να εκτελούν μια εργασία επανειλημμένα, μέχρις εσχάτων. Τέτοια ρομπότ ενός σκοπού έχουν ευδοκιμήσει σε ιδιαίτερα δομημένα περιβάλλοντα, ξεκινώντας από τις γραμμές συναρμολόγησης αυτοκινήτων. Εφόσον υπάρχουν ελάχιστες αλλαγές στην εκάστοτε εργασία, ένας ρομποτικός βραχίονας μπορεί να κάνει τη δουλειά του ξανά και ξανά, ανεμπόδιστα, μέχρι να έρθει η ώρα να τελειώσει και να παραλάβει το χρυσό ρολόι τσέπης για τα χρόνια πιστής υπηρεσίας του.

Ωστόσο, τα πράγματα μπορούν να στραβώσουν γρήγορα, ακόμη και με τις μικρότερες αποκλίσεις. Ας πούμε ότι το αντικείμενο δεν έχει τοποθετηθεί ακριβώς σωστά στον ιμάντα μεταφοράς ή ότι έχει γίνει προσαρμογή του φωτισμού που επηρεάζει τις κάμερες του οχήματος. Αυτού του είδους οι διαφορές μπορεί να έχουν τεράστιο αντίκτυπο στην ικανότητα εκτέλεσης του ρομπότ. Φανταστείτε τώρα να προσπαθείτε να βάλετε αυτό το ρομπότ να δουλέψει με ένα νέο εξάρτημα, ένα νέο υλικό ή ακόμη και να εκτελέσει μια εντελώς διαφορετική εργασία. Αυτό είναι ακόμη πιο δύσκολο.

Αυτό είναι το σημείο όπου παραδοσιακά παρεμβαίνουν οι προγραμματιστές. Το ρομπότ πρέπει να επαναπρογραμματιστεί. Τις περισσότερες φορές, κάποιος εκτός του εργοστασίου μπαίνει στην εικόνα. Αυτό είναι μια μεγάλη απορρόφηση πόρων και χρόνου. Αν θέλετε να το αποφύγετε αυτό, πρέπει να συμβεί ένα από τα δύο πράγματα: 1) Οι άνθρωποι που εργάζονται στο χώρο πρέπει να μάθουν κώδικα ή 2) Χρειάζεστε μια νέα, πιο φυσική μέθοδο αλληλεπίδρασης με το ρομπότ.

Αν και θα ήταν υπέροχο να γίνει το πρώτο, φαίνεται απίθανο ότι οι εταιρείες θα είναι πρόθυμες να επενδύσουν τα χρήματα και να περιμένουν τον απαραίτητο χρόνο. Το τελευταίο είναι ακριβώς αυτό που προσπαθεί να κάνει η Covariant με το RFM-1. Το “ChatGPT για ρομπότ” δεν είναι μια τέλεια αναλογία, αλλά είναι μια λογική συντομογραφία (ειδικά υπό το πρίσμα της σύνδεσης των ιδρυτών με το OpenAI).

Από τη σκοπιά του πελάτη, η πλατφόρμα παρουσιάζεται ως πεδίο κειμένου, όπως και η τρέχουσα επανάληψη της δημιουργικής τεχνητής νοημοσύνης που απευθύνεται στον καταναλωτή. Εισάγετε μια εντολή κειμένου όπως “σήκωσε το μήλο” πληκτρολογώντας ή φωνητικά, και το σύστημα χρησιμοποιεί τα δεδομένα εκπαίδευσης (σχήμα, χρώμα, μέγεθος κ.λπ.) για να εντοπίσει το αντικείμενο μπροστά του που ταιριάζει περισσότερο με την περιγραφή.

Στη συνέχεια, το RFM-1 δημιουργεί αποτελέσματα βίντεο – στην ουσία προσομοιώσεις – για να καθορίσει την καλύτερη πορεία δράσης χρησιμοποιώντας την προηγούμενη εκπαίδευση. Αυτό το τελευταίο κομμάτι είναι παρόμοιο με τον τρόπο με τον οποίο ο εγκέφαλός μας επεξεργάζεται τα πιθανά αποτελέσματα μιας ενέργειας πριν από την εκτέλεσή της.

Κατά τη διάρκεια μιας ζωντανής επίδειξης, το σύστημα αντέδρασε σε εισόδους όπως “σήκωσε το κόκκινο αντικείμενο” και ακόμη και το πιο σύνθετο από σημασιολογική άποψη “σήκωσε αυτό που βάζεις στα πόδια σου πριν φορέσεις τα παπούτσια σου”, γεγονός που οδήγησε το ρομπότ να σηκώσει σωστά το μήλο και ένα ζευγάρι κάλτσες, αντίστοιχα.

Πολλές μεγάλες ιδέες πετιούνται όταν συζητείται η υπόσχεση του συστήματος. Τουλάχιστον, το Covariant έχει ένα εντυπωσιακό γενεαλογικό δέντρο μεταξύ των ιδρυτών του. Ο Chen σπούδασε τεχνητή νοημοσύνη στο Berkeley υπό τον Pieter Abbeel, τον συνιδρυτή και επικεφαλής επιστήμονα του Covariant. Ο Abbeel έγινε επίσης ένας πρώιμος υπάλληλος της OpenAI το 2016, ένα μήνα μετά την ένταξη του Chen στην εταιρεία ChatGPT. Η Covariant ιδρύθηκε τον επόμενο χρόνο.

Ο Chen λέει ότι η εταιρεία αναμένει ότι η νέα πλατφόρμα RFM-1 θα λειτουργεί με την “πλειοψηφία” του υλικού στο οποίο έχει ήδη αναπτυχθεί το λογισμικό της Covariant.

Must read

Related Articles