Η DeepL, η εταιρεία που έχει καθιερωθεί για τα κορυφαία εργαλεία μετάφρασης κειμένου, περνάει πλέον σε μια νέα εποχή. Σήμερα ανακοίνωσε την κυκλοφορία μιας ολοκληρωμένης σουίτας μετάφρασης από φωνή σε φωνή (voice-to-voice), η οποία καλύπτει ανάγκες για επαγγελματικά meetings, συνομιλίες μέσω web και mobile, καθώς και ομαδικές συζητήσεις για εργαζομένους πρώτης γραμμής (frontline workers) μέσω προσαρμοσμένων εφαρμογών.
Παράλληλα, η εταιρεία λανσάρει ένα API που επιτρέπει σε εξωτερικούς προγραμματιστές και επιχειρήσεις να «χτίσουν» πάνω στην τεχνολογία της DeepL, εξυπηρετώντας εξειδικευμένες ανάγκες, όπως είναι τα τηλεφωνικά κέντρα (call centers).
Η DeepL εισέρχεται δυναμικά στον χώρο των εταιρικών επικοινωνιών προσφέροντας:
Ενσωμάτωση σε Zoom και Microsoft Teams: Μέσω ειδικών add-ons, οι ακροατές μπορούν είτε να ακούν τη μετάφραση σε πραγματικό χρόνο καθώς μιλούν οι υπόλοιποι στις μητρικές τους γλώσσες, είτε να παρακολουθούν το μεταφρασμένο κείμενο στην οθόνη τους. (Το πρόγραμμα βρίσκεται σε φάση early access με λίστα αναμονής).
Ομαδικές συζητήσεις & Εκπαιδεύσεις: Οι χρήστες μπορούν να συμμετέχουν σε ομαδικές συνεδρίες, όπως workshops ή εκπαιδεύσεις, κάνοντας απλώς σάρωση ενός QR code.
Προσαρμοσμένο λεξιλόγιο: Η τεχνολογία φωνητικής μετάφρασης μπορεί να μάθει και να προσαρμοστεί σε εξειδικευμένη ορολογία, ονόματα εταιρειών ή και φυσικών προσώπων.
Αυτή τη στιγμή, το σύστημα της DeepL λειτουργεί μετατρέποντας πρώτα την ομιλία σε κείμενο (speech-to-text), εφαρμόζοντας τη μετάφραση και στη συνέχεια μετατρέποντάς το ξανά σε ομιλία. Ωστόσο, ο μακροπρόθεσμος στόχος της εταιρείας είναι να αναπτύξει ένα end-to-end φωνητικό μοντέλο που θα παρακάμπτει εντελώς το στάδιο του κειμένου.
Σε αυτόν τον νέο τομέα, η DeepL καλείται να αντιμετωπίσει αρκετές καλά χρηματοδοτούμενες startups που δραστηριοποιούνται σε παρόμοια πεδία:
Sanas: Έχοντας αντλήσει 65 εκατ. δολάρια πέρυσι, χρησιμοποιεί AI για να τροποποιεί την προφορά ενός ομιλητή σε πραγματικό χρόνο, στοχεύοντας κυρίως σε call centers.
Camb.AI: Με έδρα το Ντουμπάι, εστιάζει στη σύνθεση φωνής και τη μετάφραση για εταιρείες media, βοηθώντας στο localization βίντεο σε μεγάλη κλίμακα.
Palabra: Με την υποστήριξη του ταμείου Seven Seven Six του συνιδρυτή του Reddit, Alexis Ohanian, χτίζει μια μηχανή μετάφρασης σε πραγματικό χρόνο που διατηρεί τόσο το νόημα όσο και την αρχική φωνή του ομιλητή.
