Cohere: Παρουσιάζει τα Tiny Aya, νέα open multilingual AI μοντέλα με υποστήριξη 70+ γλωσσών

Τα νέα μοντέλα αναπτύχθηκαν από το ερευνητικό τμήμα Cohere Labs και είναι open-weight, γεγονός που σημαίνει ότι ο πηγαίος κώδικας είναι δημόσια διαθέσιμος για χρήση και τροποποίηση.

Newsroom
3'

Η εταιρεία enterprise AI Cohere ανακοίνωσε μια νέα οικογένεια πολυγλωσσικών μοντέλων τεχνητής νοημοσύνης με την ονομασία Tiny Aya, τα οποία υποστηρίζουν περισσότερες από 70 γλώσσες και μπορούν να λειτουργούν ακόμη και offline σε καθημερινές συσκευές, όπως laptops.

Η ανακοίνωση πραγματοποιήθηκε στο περιθώριο του India AI Summit, με στόχο την ενίσχυση της πρόσβασης σε AI τεχνολογίες για χρήστες και επιχειρήσεις σε διαφορετικά γλωσσικά και πολιτισμικά περιβάλλοντα.

Open-weight μοντέλα για offline χρήση

Τα νέα μοντέλα αναπτύχθηκαν από το ερευνητικό τμήμα Cohere Labs και είναι open-weight, γεγονός που σημαίνει ότι ο πηγαίος κώδικας είναι δημόσια διαθέσιμος για χρήση και τροποποίηση.

Το βασικό μοντέλο διαθέτει 3,35 δισ. παραμέτρους — μέγεθος που αποτυπώνει την πολυπλοκότητα και τις δυνατότητές του — ενώ έχει σχεδιαστεί ώστε να λειτουργεί τοπικά σε συσκευές χωρίς σύνδεση στο διαδίκτυο, απαιτώντας λιγότερους υπολογιστικούς πόρους σε σχέση με αντίστοιχα μοντέλα.

Τα Tiny Aya μπορούν να χρησιμοποιηθούν, μεταξύ άλλων, για εφαρμογές offline μετάφρασης και ανάπτυξη υπηρεσιών που απευθύνονται σε κοινό που χρησιμοποιεί μη αγγλικές γλώσσες.

Έμφαση σε γλωσσική και πολιτισμική προσαρμογή

Η νέα οικογένεια μοντέλων περιλαμβάνει διαφορετικές εκδόσεις προσαρμοσμένες σε συγκεκριμένες γεωγραφικές και γλωσσικές ανάγκες:

  • TinyAya-Global — βελτιστοποιημένο για καλύτερη κατανόηση εντολών και ευρεία γλωσσική υποστήριξη
  • TinyAya-Earth — επικεντρωμένο σε αφρικανικές γλώσσες
  • TinyAya-Fire — για γλώσσες της Νότιας Ασίας
  • TinyAya-Water — για Ασία-Ειρηνικό, Δυτική Ασία και Ευρώπη

Τα μοντέλα υποστηρίζουν μεταξύ άλλων γλώσσες της Νότιας Ασίας, όπως Bengali, Hindi, Punjabi, Urdu, Gujarati, Tamil, Telugu και Marathi.

Σύμφωνα με την εταιρεία, η προσέγγιση αυτή επιτρέπει ισχυρότερη γλωσσική κατανόηση και μεγαλύτερη πολιτισμική ακρίβεια, δημιουργώντας συστήματα που ανταποκρίνονται καλύτερα στις ανάγκες των τοπικών κοινοτήτων.

Η Cohere ανέφερε ότι τα μοντέλα εκπαιδεύτηκαν σε ένα cluster 64 GPUs τύπου H100 της Nvidia, χρησιμοποιώντας σχετικά περιορισμένους υπολογιστικούς πόρους.

Η αρχιτεκτονική τους έχει σχεδιαστεί ειδικά για λειτουργία σε τοπικές συσκευές, γεγονός που τα καθιστά ιδιαίτερα χρήσιμα σε χώρες με υψηλή γλωσσική ποικιλομορφία — όπως η Ινδία— όπου η συνεχής πρόσβαση στο διαδίκτυο δεν είναι δεδομένη.

Τα μοντέλα είναι διαθέσιμα μέσω της Hugging Face και της πλατφόρμας της Cohere, ενώ μπορούν να εγκατασταθούν τοπικά μέσω HuggingFace, Kaggle και Ollama.

Η εταιρεία σχεδιάζει επίσης να δημοσιεύσει datasets εκπαίδευσης και αξιολόγησης, καθώς και τεχνική αναφορά για τη μεθοδολογία εκπαίδευσης των μοντέλων.

Μοιραστείτε αυτό το άρθρο
ΑπόNewsroom
Ακολουθήστε
Tο πρώτο ειδησεογραφικό πόρταλ στην Ελλάδα για τις startups, που αναδεικνύει τα νέα και τη δυναμική του ελληνικού οικοσυστήματος. Εκτός από την καταγραφή του ελληνικού οικοσυστήματος καλύπτει τα τεκταινόμενα και τις διεθνείς τάσεις σε ό,τι αφορά στις startups, τις επενδύσεις, τις νομικές και φορολογικές ρυθμίσεις που αφορούν στα επιχειρηματικά οικοσυστήματα της Ευρώπης και του κόσμου.