Η Mistral AI, η γαλλική startup τεχνητής νοημοσύνης, αποκάλυψε το πρώτο της πολυτροπικό μοντέλο, το Pixtral 12B. Αυτό το καινοτόμο μοντέλο, ικανό να επεξεργάζεται τόσο κείμενο όσο και εικόνες, έρχεται να σταθεί απέναντι από καθιερωμένους παίκτες στον τομέα, όπως η OpenAI και η Anthropic.
Το Pixtral 12B έχει 12 δισεκατομμύρια παραμέτρους και αναλύει εικόνες με ανάλυση έως 1024×1024 pixel. Η αρχιτεκτονική του μοντέλου, βασισμένη στο μοντέλο κειμένου Nemo 12B της Mistral, επιτρέπει εξελιγμένα καθήκοντα όπως λεζάντες εικόνων, μέτρηση αντικειμένων και απάντηση σε ερωτήσεις με βάση την οπτική είσοδο. Με μέγεθος λεξιλογίου 131.072 tokens, το Pixtral 12B σχεδιάστηκε για ευελιξία και αποτελεσματικότητα σε πολυτροπικές εφαρμογές.
Αυτό που ξεχωρίζει το Pixtral 12B είναι η άδεια ανοιχτού κώδικα Apache 2.0, επιτρέποντας στους προγραμματιστές και τους ερευνητές ανεμπόδιστη πρόσβαση στο μοντέλο. Διαθέσιμο για λήψη μέσω συνδέσμων torrent στο GitHub και το Hugging Face, το μοντέλο μπορεί να χρησιμοποιηθεί για ακαδημαϊκούς και εμπορικούς σκοπούς χωρίς τέλη αδειοδότησης. Αυτή η προσέγγιση συνάδει με τη δέσμευση της Mistral να ενθαρρύνει την καινοτομία μέσα στην κοινότητα της τεχνητής νοημοσύνης.
Το λανσάρισμα έρχεται μετά από μια σημαντική χρηματοδότηση ύψους 645 εκατομμυρίων δολαρίων με επικεφαλής την General Catalyst, η οποία αποτίμησε την Mistral σε 6 δισεκατομμύρια δολάρια. Η Mistral σχεδιάζει να ενσωματώσει το Pixtral 12B στις πλατφόρμες chatbot και API Le Chat και Le Platforme, επιτρέποντας στους χρήστες να εξερευνήσουν τις δυνατότητές του σε πραγματικές εφαρμογές.
