Έρχεται το Gemini 3.5 Live Translate με υποστήριξη της ελληνικής γλώσσας

Η νέα τεχνολογία καταργεί τις ρομποτικές φωνές, διατηρεί το συναίσθημα και το ύφος του ομιλητή, φιλτράρει τους εξωτερικούς θορύβους

Βαγγέλης Γραικόπουλος
4'

Στον πυρετώδη ανταγωνισμό για την κυριαρχία στην αγορά της Τεχνητής Νοημοσύνης, η Google έκανε το επόμενο μεγάλο βήμα παρουσιάζοντας το Gemini 3.5 Live Translate. Πρόκειται για ένα εξελιγμένο μοντέλο άμεσης φωνητικής μετάφρασης που ανήκει στη νέα οικογένεια μοντέλων Gemini 3.5, με στόχο να μετατρέψει τις πολύγλωσσες συνομιλίες σε μια απόλυτα φυσική και ρέουσα εμπειρία, χωρίς τις άβολες παύσεις του παρελθόντος.

Η επανάσταση του “Continuous Streaming”

Η ειδοποιός διαφορά του Gemini 3.5 Live Translate σε σχέση με τα παραδοσιακά συστήματα μετάφρασης εντοπίζεται στον τρόπο επεξεργασίας. Αντί να περιμένει τον ομιλητή να ολοκληρώσει τη φράση του για να ξεκινήσει τη μετάφραση, το μοντέλο λειτουργεί με τη μέθοδο της συνεχούς ροής (continuous streaming). Ακούει, μεταφράζει και «μιλάει» ταυτόχρονα, μένοντας μόλις ελάχιστα δευτερόλεπτα πίσω από τον φυσικό ομιλητή.

Το σύστημα είναι σχεδιασμένο για τις ανάγκες της καθημερινής επικοινωνίας και ξεχωρίζει για τρία κρίσιμα χαρακτηριστικά:

  • Διατήρηση της φωνητικής ταυτότητας: Αντί για μια generic, ρομποτική φωνή, το Gemini 3.5 προσαρμόζει τον τόνο, τον ρυθμό και το ύψος της παραγόμενης ομιλίας, ώστε να προσομοιάζει στο συναίσθημα και το στυλ του αρχικού ομιλητή.

  • Αυτόματος εντοπισμός γλώσσας: Αναγνωρίζει αυτόματα περισσότερες από 70 γλώσσες, επιτρέποντας σε χιλιάδες γλωσσικούς συνδυασμούς να συνυπάρχουν στην ίδια συζήτηση χωρίς χειροκίνητες ρυθμίσεις.

  • Έξυπνο φιλτράρισμα θορύβου: Μπορεί να απομονώνει θορύβους βάθους (background noise) και ετεροχρονισμένες ομιλίες, καθιστώντας το λειτουργικό σε πολυσύχναστα περιβάλλοντα, όπως ξεναγήσεις, δρόμους ή τηλεφωνικά κέντρα.

Άμεση διάθεση σε Οικοσύστημα, Meet και Smartphones

Η Google ξεκινά άμεσα την ενσωμάτωση του μοντέλου σε όλο το φάσμα των υπηρεσιών της. Οι προγραμματιστές μπορούν ήδη να αποκτήσουν πρόσβαση μέσω δημόσιας προεπισκόπησης στο Gemini Live API και στο AI Studio.

Παράλληλα, εντός του μήνα, επιλεγμένοι εταιρικοί πελάτες του Google Meet θα δουν τη ζωντανή μετάφραση ενσωματωμένη στις τηλεδιασκέψεις τους, με ανανεωμένο UI για ευκολότερη χρήση.

Η μεγαλύτερη ανατροπή, ωστόσο, έρχεται στις mobile εφαρμογές του Google Translate για Android και iOS. Μέχρι πρότινος, η ζωντανή φωνητική μετάφραση απαιτούσε τη χρήση των Pixel Buds σε συνδυασμό με Android συσκευή. Πλέον, τα ακουστικά δεν είναι απαραίτητα. Η Google εισάγει τη «λειτουργία ακρόασης» (listening mode), η οποία επιτρέπει στον χρήστη (αρχικά σε Android) να κρατά το τηλέφωνο στο αυτί του σαν να βρίσκεται σε κανονική κλήση και να ακούει τη μεταφρασμένη ροή σχεδόν σε πραγματικό χρόνο.

Ασφάλεια και ηθική στην εποχή του AI Voice

Δεδομένης της ικανότητας του μοντέλου να αναπαράγει ανθρώπινους τόνους φωνής, η Google εμφανίζεται ιδιαίτερα προσεκτική στο κομμάτι της ασφάλειας και των deepfakes. Όλες οι ακουστικές ροές του Gemini 3.5 Live Translate θα φέρουν ενσωματωμένα ψηφιακά υδατογραφήματα SynthID απευθείας στα δεδομένα της κυματομορφής. Η σήμανση αυτή, η οποία προς το παρόν δεν μπορεί να αφαιρεθεί, θα πιστοποιεί ανιχνεύσιμα ότι ο ήχος έχει παραχθεί από συστήματα τεχνητής νοημοσύνης.

Το Big Tech Real-Time Translation Οικοσύστημα

Η κίνηση της Google εντάσσεται σε ένα ευρύτερο κύμα προϊόντων που στοχεύουν στην εξάλειψη των γλωσσικών φραγμών στην παγκόσμια αγορά:

Εταιρεία / Προϊόν Τεχνολογική Εφαρμογή Κύριο Χαρακτηριστικό
Google Gemini 3.5 Live API, Google Meet, Google Translate App Continuous streaming, διατήρηση τόνου, 70+ γλώσσες
Apple AirPods Pro 3 On-device Hardware Translation Ενσωματωμένη ζωντανή μετάφραση μέσω ακουστικών
T-Mobile (US) AI-Powered Voice Calls Μετάφραση σε πραγματικό χρόνο κατά τη διάρκεια τηλεφωνικών κλήσεων
CES 2026 Startups Handheld Translation Devices Φορητές συσκευές φωνητικής μετάφρασης σε κείμενο/ομιλία

Με το Gemini 3.5 Live Translate, η Google επιχειρεί να μεταφέρει τη ζωντανή μετάφραση από το επίπεδο των εντυπωσιακών tech demonstrations στην καθημερινή, πρακτική επιχειρηματική και προσωπική επικοινωνία, κάνοντας το cross-border integration πιο απρόσκοπτο από ποτέ.

Μοιραστείτε αυτό το άρθρο