Σύντομα θα μπορέσετε να δοκιμάσετε μόνοι σας τη φημισμένη γεννήτρια μετατροπής κειμένου σε βίντεο της OpenAI. Σε συνέντευξή της στην εφημερίδα The Wall Street Journal, η Mira Murati, επικεφαλής της τεχνολογίας της OpenAI, λέει ότι το Sora θα είναι διαθέσιμο “φέτος” και ότι “μπορεί να περάσουν μερικοί μήνες”.
Η OpenAI παρουσίασε για πρώτη φορά το Sora τον Φεβρουάριο, το οποίο είναι ικανό να παράγει σκηνές βίντεο από κείμενο. Η εταιρεία έκανε το εργαλείο διαθέσιμο μόνο για εικαστικούς καλλιτέχνες, σχεδιαστές και κινηματογραφιστές, αλλά αυτό δεν εμπόδισε κάποια βίντεο που δημιουργήθηκαν με το Sora να βρουν το δρόμο τους σε πλατφόρμες όπως το X.
Εκτός από τη διάθεση του εργαλείου στο κοινό, ο Murati λέει ότι η OpenAI σχεδιάζει να ενσωματώσει “τελικά” ήχο, ο οποίος έχει τη δυνατότητα να κάνει τις σκηνές ακόμα πιο ρεαλιστικές. Η εταιρεία θέλει επίσης να επιτρέψει στους χρήστες να επεξεργάζονται το περιεχόμενο των βίντεο που παράγει το Sora, καθώς τα εργαλεία τεχνητής νοημοσύνης δεν δημιουργούν πάντα ακριβείς εικόνες. “Προσπαθούμε να βρούμε πώς να χρησιμοποιήσουμε αυτή την τεχνολογία ως εργαλείο με το οποίο οι άνθρωποι μπορούν να επεξεργαστούν και να δημιουργήσουν”, λέει ο Murati στην Journal.
Όταν ρωτήθηκε σχετικά με τα δεδομένα που χρησιμοποίησε η OpenAI για να εκπαιδεύσει τον Sora, ο Murati δεν έγινε πολύ συγκεκριμένος και φάνηκε να αποφεύγει την ερώτηση. “Δεν πρόκειται να μπω σε λεπτομέρειες για τα δεδομένα που χρησιμοποιήθηκαν, αλλά ήταν δημόσια διαθέσιμα ή δεδομένα με άδεια χρήσης”, λέει. Η Murati λέει επίσης ότι δεν είναι σίγουρη αν χρησιμοποιήθηκαν βίντεο από το YouTube, το Facebook και το Instagram. Το μόνο που επιβεβαίωσε στην Journal είναι ότι το Sora χρησιμοποιεί περιεχόμενο από το Shutterstock, με το οποίο η OpenAI έχει συνεργασία.
Η Murati δήλωσε επίσης στην Journal ότι η Sora είναι “πολύ πιο ακριβή” για να τροφοδοτηθεί. Η OpenAI προσπαθεί να καταστήσει το εργαλείο “διαθέσιμο σε παρόμοιο κόστος” με το DALL-E, το μοντέλο AI text-to-image της εταιρείας, όταν κυκλοφορήσει στο κοινό. Μπορείτε να δείτε ακόμη περισσότερα παραδείγματα για το τι είδους βίντεο μπορεί να παράγει αυτό το εργαλείο στο δημοσίευμα της Journal, συμπεριλαμβανομένου ενός κινούμενου ταύρου σε ένα κινέζικο κατάστημα και μιας γοργόνας κριτή smartphone.
Καθώς πλησιάζουμε στις προεδρικές εκλογές του 2024, οι ανησυχίες σχετικά με τα εργαλεία δημιουργικής τεχνητής νοημοσύνης και τις δυνατότητές τους να δημιουργήσουν παραπληροφόρηση έχουν αυξηθεί. Όταν κυκλοφορήσει, ο Murati λέει ότι το Sora πιθανότατα δεν θα είναι σε θέση να παράγει εικόνες δημόσιων προσώπων, παρόμοια με τις πολιτικές του DALL-E. Τα βίντεο θα έχουν επίσης υδατογράφημα για να διακρίνονται από τα πραγματικά, αλλά όπως επισημαίνει η συνάδελφός μου Emilia David, τα υδατογραφήματα δεν αποτελούν τέλεια λύση.