Ρευστή, φυσική μετάφραση φωνής με το Gemini 3.5 Live Translate

Από Trantorian 10 Ιουνίου 2026 1 λεπτό ανάγνωσης
Ρευστή, φυσική μετάφραση φωνής με το Gemini 3.5 Live Translate

Η Google παρουσιάζει το Gemini 3.5 Live Translate, το νέο της μοντέλο ήχου για ζωντανή μετάφραση από ομιλία σε ομιλία, με σχεδόν μηδενική καθυστέρηση, σε περισσότερες από 70 γλώσσες.

Η μετάφραση στην Google ξεκίνησε πριν από είκοσι χρόνια ως ένα από τα πρώτα της πειράματα μηχανικής μάθησης, με στόχο να μετατρέψει την επιστήμη της γλώσσας σε ανθρώπινη σύνδεση. Σήμερα, πάνω από ένα τρισεκατομμύριο λέξεις μεταφράζονται κάθε μήνα για δισεκατομμύρια χρήστες σε προϊόντα της εταιρείας.

Με το Gemini 3.5 Live Translate, η εταιρεία κάνει το επόμενο βήμα στη ζωντανή, αυτόματη μετάφραση ομιλίας. Το μοντέλο αναγνωρίζει αυτόματα 70+ γλώσσες και παράγει ομαλή, φυσική φωνή στη μετάφραση, διατηρώντας τον επιτονισμό, τον ρυθμό και την τονικότητα του ομιλητή.

Σε αντίθεση με συστήματα που περιμένουν να ολοκληρωθεί η φράση πριν απαντήσουν, το 3.5 Live Translate δημιουργεί λόγο συνεχώς. Ισορροπεί ανάμεσα στο να περιμένει λίγο για καλύτερο πλαίσιο και στο να μεταφράζει άμεσα, ώστε να μένει συγχρονισμένο με τον ομιλητή. Το αποτέλεσμα είναι ροή χωρίς αμήχανες παύσεις, με την απόδοση να ακολουθεί λίγα δευτερόλεπτα πίσω από τον ομιλητή.

Η διάθεση του Gemini 3.5 Live Translate ξεκινά σήμερα σε προϊόντα της Google.

Για προγραμματιστές, το 3.5 Live Translate επεξεργάζεται την ομιλία καθώς γίνεται streaming, επιτρέποντας πιο αβίαστη επικοινωνία ανάμεσα σε γλώσσες. Διαχειρίζεται πολυγλωσσικές εισόδους χωρίς χειροκίνητες ρυθμίσεις και είναι ανθεκτικό στον θόρυβο, ώστε οι εφαρμογές να λειτουργούν και σε δυνατά, απρόβλεπτα περιβάλλοντα. Μπορεί να αξιοποιηθεί για ζωντανή διερμηνεία σε κλήσεις, συναντήσεις, μαθήματα, μεταδόσεις και άλλα.

Η Gemini Live API επιτρέπει υποτιτλισμό/ντουμπλάζ και ταυτόχρονη μετάφραση σε πολλές γλώσσες. Υπάρχει διαθέσιμο demo και παραδείγματα κώδικα στο Gemini Cookbook.

Πλατφόρμες όπως οι Agora, Fishjam, LiveKit, Pipecat και Vision Agents ενσωματώνουν τη Gemini Live API, ώστε οι προγραμματιστές να δημιουργούν και να διαθέτουν εύκολα εφαρμογές φωνητικής μετάφρασης. Οι ενσωματώσεις αυτές αναλαμβάνουν την απαιτητική υποδομή streaming σε πραγματικό χρόνο, ώστε οι ομάδες να εστιάζουν στην εμπειρία χρήστη.

Οι συνεργάτες της Google στη Grab δοκιμάζουν το μοντέλο για πολυγλωσσική επικοινωνία σχεδόν σε πραγματικό χρόνο ανάμεσα σε οδηγούς και ταξιδιώτες στα σημεία παραλαβής. Μέσω της Grab πραγματοποιούνται πάνω από 10 εκατομμύρια φωνητικές κλήσεις τον μήνα.

Εκτός από τη Grab, εταιρείες όπως οι CJ ENM, LiveKit και άλλες έχουν δώσει θετικά σχόλια για το 3.5 Live Translate, επισημαίνοντας την ποιότητα, την ακρίβεια και τη χαμηλή καθυστέρηση.

Σύντομα, η μετάφραση ομιλίας στο Google Meet θα βασίζεται στο 3.5 Live Translate, βελτιώνοντας την εμπειρία των βιντεοκλήσεων. Η αναβάθμιση ξεκινά σε private preview για επιλεγμένους επαγγελματικούς πελάτες του Google Workspace από αυτόν τον μήνα και θα ακολουθήσει ευρύτερη διάθεση αργότερα μέσα στη χρονιά.

Το μοντέλο έρχεται και στην εφαρμογή Google Translate παγκοσμίως, σε Android και iOS. Με τη λειτουργία Live translate, αρκεί να συνδέσετε οποιαδήποτε ακουστικά για πιο ομαλή μετάφραση που αντικατοπτρίζει τον τόνο του ομιλητή σε 70+ γλώσσες.

Σε Android, ξεκινά επίσης ένα νέο “listening mode” με το 3.5 Live Translate, που στέλνει τη μετάφραση απευθείας στο ακουστικό της συσκευής. Κρατήστε το τηλέφωνο στο αυτί, όπως σε μια κανονική κλήση, και ακούστε τη μεταφρασμένη ομιλία ιδιωτικά. Είναι χρήσιμο όταν θέλετε να ακούσετε γρήγορα χωρίς να ακούνε οι γύρω σας και δεν έχετε ακουστικά. Για παράδειγμα, μπορείτε να ακούσετε σχεδόν σε πραγματικό χρόνο αγγλική μετάφραση μιας ξενάγησης στα ισπανικά απευθείας από το ακουστικό του τηλεφώνου.

Όλος ο ήχος που παράγουν τα μοντέλα της Google φέρει υδατογράφημα SynthID. Το αδιόρατο αυτό σήμα είναι ενσωματωμένο στην έξοδο ήχου, ώστε το AI‑generated περιεχόμενο να παραμένει ανιχνεύσιμο και να βοηθά στην αποτροπή παραπληροφόρησης. Περισσότερα για την προσέγγιση ασφάλειας και υπευθυνότητας υπάρχουν στην κάρτα μοντέλου.