Το Microsoft AI, το ερευνητικό εργαστήριο του τεχνολογικού κολοσσού, ανακοίνωσε την κυκλοφορία τριών νέων θεμελιωδών (foundational) μοντέλων Τεχνητής Νοημοσύνης, τα οποία έχουν τη δυνατότητα παραγωγής κειμένου, φωνής και βίντεο. Η κίνηση αυτή σηματοδοτεί τη συνεχιζόμενη προσπάθεια του τεχνολογικού κολοσσού να χτίσει τη δική του «στοίβα» πολυτροπικών (multimodal) μοντέλων και να ανταγωνιστεί τα κορυφαία ερευνητικά εργαστήρια του κλάδου, παρόλο που παραμένει στενά συνδεδεμένος με την OpenAI.
Τα τρία νέα εργαλεία είναι πλέον διαθέσιμα στο Microsoft Foundry, ενώ τα μοντέλα φωνής και απομαγνητοφώνησης είναι προσβάσιμα και στο νέο λογισμικό δοκιμών MAI Playground.
Συγκεκριμένα, το MAI-Transcribe-1 απομαγνητοφωνεί ομιλία σε 25 διαφορετικές γλώσσες, είναι 2,5 φορές ταχύτερο από το Azure Fast της Microsoft και ξεκινά από 0,36 δολάρια την ώρα. Το MAI-Voice-1 είναι ένα μοντέλο παραγωγής ήχου που δημιουργεί 60 δευτερόλεπτα ηχητικού αποσπάσματος σε μόλις ένα δευτερόλεπτο, επιτρέπει τη δημιουργία προσαρμοσμένων φωνών και κοστίζει 22 δολάρια ανά 1 εκατομμύριο χαρακτήρες. Το τρίτο μοντέλο, το MAI-Image-2, το οποίο παρουσιάστηκε αρχικά τον περασμένο Μάρτιο, είναι ένα μοντέλο παραγωγής βίντεο με κόστος 5 δολάρια ανά 1 εκατομμύριο tokens για εισαγωγή κειμένου και 33 δολάρια ανά 1 εκατομμύριο tokens για παραγωγή εικόνας. Σε μια ολοένα και πιο ανταγωνιστική αγορά, το κύριο πλεονέκτημα που προτάσσει η εταιρεία είναι ότι αυτά τα μοντέλα είναι φθηνότερα από τα αντίστοιχα των Google και OpenAI.
Η ανάπτυξή των μοντέλων πραγματοποιήθηκε από την MAI Superintelligence, μια ερευνητική ομάδα που δημιουργήθηκε τον Νοέμβριο του 2025. Επικεφαλής της είναι ο Mustafa Suleyman, Διευθύνων Σύμβουλος της Microsoft AI, ο οποίος τονίζει ότι ο στόχος είναι η δημιουργία μιας «Humanist AI. ». Όπως δήλωσε, η εταιρεία βάζει τον άνθρωπο στο επίκεντρο, βελτιστοποιώντας τα μοντέλα με βάση τον πραγματικό τρόπο επικοινωνίας και με γνώμονα την πρακτική χρήση, ενώ προανήγγειλε την κυκλοφορία και νέων εργαλείων στο άμεσο μέλλον, όπως αναφέρει το TechCrunch.
Παρά την κυκλοφορία των δικών της, in-house μοντέλων, η Microsoft παραμένει προσηλωμένη στη συνεργασία της με την OpenAI, στην οποία έχει επενδύσει πάνω από 13 δισεκατομμύρια δολάρια ενσωματώνοντας τα μοντέλα της στα προϊόντα της. Ο Suleyman επιβεβαίωσε αυτή τη δέσμευση, διευκρινίζοντας ωστόσο ότι μια πρόσφατη επαναδιαπραγμάτευση της συμφωνίας τους επέτρεψε στη Microsoft να επιδιώξει πιο ελεύθερα τη δική της έρευνα γύρω από την «υπερνοημοσύνη».
