Η Arcee AI, μια μικρή startup με μόλις 30 εργαζομένους, ανακοίνωσε την κυκλοφορία του Trinity, ενός γενικής χρήσης foundation model που είναι πλήρως και μόνιμα open source, με άδεια Apache. Με 400 δισεκατομμύρια παραμέτρους, η εταιρεία υποστηρίζει ότι πρόκειται για ένα από τα μεγαλύτερα open source foundation models που έχουν εκπαιδευτεί και διατεθεί ποτέ από εταιρεία με έδρα τις ΗΠΑ.
Σύμφωνα με την Arcee, το Trinity είναι συγκρίσιμο με το Llama 4 Maverick 400B της Meta και το GLM-4.5 της Z.ai, ενός ισχυρού open source μοντέλου από το Πανεπιστήμιο Tsinghua της Κίνας. Τα benchmarks βασίστηκαν σε base models, με ελάχιστο post-training.
Τα αποτελέσματα δείχνουν ότι το Trinity, το οποίο βρίσκεται ακόμη σε preview έκδοση, αποδίδει εξίσου καλά και σε ορισμένες περιπτώσεις ξεπερνά το Llama σε δοκιμές που αφορούν coding, μαθηματικά, κοινή λογική, γνώση και συλλογιστική.
Όπως τα περισσότερα σύγχρονα state-of-the-art μοντέλα, το Trinity έχει σχεδιαστεί για coding και πολυβηματικές διαδικασίες, όπως οι AI agents. Παρότι το μέγεθός του είναι εντυπωσιακό, προς το παρόν υποστηρίζει μόνο text, γεγονός που το καθιστά μη πλήρως ανταγωνιστικό έναντι πολυτροπικών μοντέλων όπως το Llama 4 Maverick, το οποίο ήδη υποστηρίζει εικόνες.
Η Arcee, ωστόσο, έχει ήδη στα σκαριά νέα modes. Ένα vision model βρίσκεται σε ανάπτυξη, ενώ υπάρχει και roadmap για speech-to-text, σύμφωνα με τον CTO της εταιρείας, Lucas Atkins, αναφέρει το TechCrunch. Πριν επεκταθεί σε περισσότερα modalities, η εταιρεία ήθελε πρώτα να δημιουργήσει ένα base LLM που να εντυπωσιάζει τους βασικούς της χρήστες: developers και ακαδημαϊκούς.
Στόχος της Arcee είναι επίσης να προσελκύσει εταιρείες στις ΗΠΑ και να τις απομακρύνει από open models που προέρχονται από την Κίνα, τα οποία πολλές επιχειρήσεις είτε αποφεύγουν είτε δεν επιτρέπεται να χρησιμοποιήσουν.
Το Trinity αποτελεί το επόμενο βήμα μετά από δύο μικρότερα μοντέλα που παρουσίασε η εταιρεία τον Δεκέμβριο: το Trinity Mini με 26 δισ. παραμέτρους, ένα πλήρως post-trained reasoning μοντέλο για εφαρμογές όπως web apps και agents, και το Trinity Nano με 6 δισ. παραμέτρους, ένα πειραματικό μοντέλο που εξερευνά τα όρια των μικρών αλλά «συνομιλητικών» LLMs.
Εντυπωσιακό στοιχείο είναι ότι η Arcee εκπαίδευσε όλα τα μοντέλα της μέσα σε έξι μήνες, με συνολικό κόστος $20 εκατομμύρια, χρησιμοποιώντας 2.048 GPUs Nvidia Blackwell B300. Το ποσό αυτό προέρχεται από τα περίπου $50 εκατομμύρια που έχει αντλήσει συνολικά η εταιρεία μέχρι σήμερα, σύμφωνα με τον ιδρυτή και CEO Mark McQuade.
Παρότι το κόστος ήταν υψηλό για τα δεδομένα της Arcee, παραμένει εξαιρετικά χαμηλό σε σύγκριση με τα ποσά που επενδύουν σήμερα τα μεγάλα AI labs. Ο Atkins ανέφερε ότι το εξάμηνο χρονοδιάγραμμα ήταν ιδιαίτερα προσεκτικά υπολογισμένο και βασίστηκε στην ένταση, την εμπειρία και την αφοσίωση μιας μικρής αλλά ιδιαίτερα φιλόδοξης ομάδας ερευνητών.
Ο McQuade, πρώην early employee της Hugging Face, εξηγεί ότι η Arcee δεν ξεκίνησε με στόχο να γίνει νέο AI lab. Αρχικά, η εταιρεία ασχολούνταν με post-training και customisation μοντέλων για μεγάλους enterprise πελάτες, όπως η SK Telecom, βασιζόμενη σε open source μοντέλα τρίτων, όπως τα Llama, Mistral και Qwen.
Καθώς όμως η πελατειακή βάση μεγάλωνε, η ανάγκη για ένα ιδιόκτητο μοντέλο έγινε επιτακτική, ενώ υπήρχε και ανησυχία για την εξάρτηση από άλλες εταιρείες. Την ίδια στιγμή, πολλά από τα κορυφαία open models προέρχονταν από την Κίνα, γεγονός που δημιουργούσε επιφυλάξεις ή νομικούς περιορισμούς για αμερικανικές επιχειρήσεις.
Η απόφαση να προχωρήσουν σε pre-training δικού τους μοντέλου ήταν ριψοκίνδυνη. Σύμφωνα με τον McQuade, λιγότερες από 20 εταιρείες παγκοσμίως έχουν καταφέρει να εκπαιδεύσουν και να κυκλοφορήσουν μοντέλα αυτού του μεγέθους και επιπέδου.
Η Arcee ξεκίνησε δοκιμαστικά με ένα μικρό 4,5B μοντέλο, σε συνεργασία με την DatologyAI. Η επιτυχία του εγχειρήματος άνοιξε τον δρόμο για μεγαλύτερες φιλοδοξίες.
Όσον αφορά το ερώτημα γιατί χρειάζεται ένα νέο open model στις ΗΠΑ ενώ υπάρχει ήδη το Llama, η απάντηση της Arcee εστιάζει στην άδεια χρήσης. Το Trinity διατίθεται με Apache license, διασφαλίζοντας ότι θα παραμείνει μόνιμα ανοιχτό. Αυτό έρχεται σε αντίθεση με το Llama, το οποίο χρησιμοποιεί άδεια που ελέγχεται από τη Meta και περιλαμβάνει εμπορικούς περιορισμούς — κάτι που έχει οδηγήσει ορισμένους οργανισμούς open source να αμφισβητούν αν είναι πραγματικά open source.
Όλα τα μοντέλα Trinity διατίθενται δωρεάν για λήψη. Η μεγαλύτερη έκδοση θα κυκλοφορήσει σε τρεις μορφές: το Trinity Large Preview, ένα ελαφρώς post-trained instruct model για γενική χρήση και chat, το Trinity Large Base, χωρίς post-training, και το TrueBase, το οποίο δεν περιλαμβάνει instruct data ή post-training, ώστε επιχειρήσεις και ερευνητές να μπορούν να το προσαρμόσουν πλήρως από το μηδέν.
Η Arcee σκοπεύει επίσης να προσφέρει hosted έκδοση μέσω API, με ανταγωνιστική τιμολόγηση, μέσα στις επόμενες έξι εβδομάδες, καθώς συνεχίζει να βελτιώνει τη συλλογιστική του μοντέλου. Για το Trinity Mini, η τιμολόγηση API είναι $0,045 / $0,15, ενώ διατίθεται και δωρεάν tier με περιορισμούς. Παράλληλα, η εταιρεία συνεχίζει να προσφέρει υπηρεσίες post-training και customisation.
