Η Google συνεχίζει να ενισχύει τη θέση της στην τεχνητή νοημοσύνη, προσελκύοντας κορυφαία ταλέντα από την αγορά των startups. Στο πλαίσιο μιας νέας συμφωνίας αδειοδότησης, η Google DeepMind εντάσσει στο δυναμικό της τον CEO και αρκετούς από τους βασικούς μηχανικούς της Hume AI, μιας startup που ειδικεύεται στην φωνητική τεχνητή νοημοσύνη.
Την είδηση αποκάλυψε αρχικά το Wired, αναφέροντας ότι ο CEO της Hume AI, Alan Cowen, μαζί με περίπου επτά ακόμη μηχανικούς, θα εργαστούν με την ομάδα της DeepMind για τη βελτίωση των φωνητικών δυνατοτήτων του Gemini.
Η Hume AI, ωστόσο, δεν παύει να υφίσταται ως εταιρεία. Το τμήμα που παραμένει ανεξάρτητο θα συνεχίσει να παρέχει την τεχνολογία του σε άλλες εταιρείες AI. Αν και δεν αποκαλύφθηκαν οικονομικές λεπτομέρειες της συμφωνίας, ο Andrew Ettinger, επενδυτής και tech executive που ανέλαβε πρόσφατα τη θέση του CEO, δήλωσε στο TechCrunch ότι η Google έχει μη αποκλειστικά δικαιώματα χρήσης του IP της Hume AI, το οποίο θα ενσωματωθεί στις διαδικασίες της.
Ο Ettinger πρόσθεσε ότι η Hume AI σκοπεύει να λανσάρει νέα μοντέλα τους επόμενους μήνες, ενώ εκτιμάται ότι η εταιρεία βρίσκεται σε τροχιά για έσοδα 100 εκατ. δολαρίων μέσα στο 2026.
Η συμφωνία αποτελεί ακόμη ένα παράδειγμα της τάσης των μεγάλων εταιρειών AI να προχωρούν σε acqui-hire, δηλαδή στην απόκτηση ομάδων και όχι ολόκληρων εταιρειών, αποφεύγοντας έτσι ενδεχόμενο ρυθμιστικό έλεγχο. Πέρυσι, η Google απέκτησε τον CEO και κορυφαίους ερευνητές της startup Windsurf, ενώ και η OpenAI έχει απορροφήσει αρκετές ομάδες startups, όπως τις Convogo και Roi. Η Federal Trade Commission (FTC) έχει δηλώσει πρόσφατα ότι σκοπεύει να εξετάσει πιο προσεκτικά τέτοιου είδους συμφωνίες.
Η Hume AI ξεχώρισε χάρη στην ικανότητα των μοντέλων της να αντιλαμβάνονται το συναίσθημα και τη διάθεση του χρήστη μέσω της φωνής. Το 2024 παρουσίασε το Empathetic Voice Interface, ένα conversational AI με συναισθηματική νοημοσύνη. Σύμφωνα με το PitchBook, η εταιρεία έχει αντλήσει συνολικά σχεδόν 80 εκατ. δολάρια σε χρηματοδότηση.
Η συμφωνία αναδεικνύει τη φωνή ως το επόμενο μεγάλο μέτωπο στην AI. Η Google έχει ήδη επενδύσει σημαντικά στο Gemini Live, που επιτρέπει συνομιλίες με το chatbot, ενώ πρόσφατα παρουσίασε ένα νέο native audio model για το Live API, βελτιώνοντας τη διαχείριση σύνθετων workflows.
Παράλληλα, και άλλοι παίκτες της αγοράς κινούνται επιθετικά στον ίδιο χώρο. Η OpenAI φέρεται να ετοιμάζει σημαντική αναβάθμιση των audio μοντέλων της, ενόψει της κυκλοφορίας της audio-first προσωπικής συσκευής που αναπτύσσει με την io του Jonny Ive, η οποία ενδέχεται να πάρει τη μορφή earbuds. Η Meta, από την πλευρά της, επιτάχυνε τη στρατηγική της στο audio με την εξαγορά της Play AI, ενώ τα Ray-Ban smart glasses βασίζονται όλο και περισσότερο σε φωνητικές λειτουργίες.
