Η κινεζική τεχνολογική εταιρεία Alibaba κυκλοφόρησε τη Δευτέρα το Qwen3, μια οικογένεια μοντέλων τεχνητής νοημοσύνης που η εταιρεία ισχυρίζεται ότι μπορούν να φτάσουν και, σε ορισμένες περιπτώσεις, να ξεπεράσουν τα καλύτερα μοντέλα που διατίθενται από την Google και την OpenAI.
Τα περισσότερα από τα μοντέλα είναι διαθέσιμα για λήψη με «ανοιχτή» άδεια χρήσης στην πλατφόρμα ανάπτυξης τεχνητής νοημοσύνης Hugging Face και στο GitHub. Το μέγεθός τους κυμαίνεται από 0,6 δισεκατομμύρια παραμέτρους έως 235 δισεκατομμύρια παραμέτρους.
Η άνοδος των μοντέλων κινεζικής προέλευσης, όπως το Qwen, έχει αυξήσει την πίεση σε αμερικανικά εργαστήρια, όπως η OpenAI, να παρέχουν πιο ικανές τεχνολογίες τεχνητής νοημοσύνης. Έχουν επίσης οδηγήσει τους υπεύθυνους χάραξης πολιτικής στην εφαρμογή περιορισμών που αποσκοπούν στον περιορισμό της ικανότητας των κινεζικών εταιρειών τεχνητής νοημοσύνης να αποκτήσουν τα απαραίτητα τσιπ για την εκπαίδευση μοντέλων.
Σύμφωνα με την Alibaba, τα μοντέλα Qwen3 είναι υβριδικά» μοντέλα — μπορούν να χρειαστούν χρόνο για να «εκλογικεύσουν» πολύπλοκα προβλήματα ή να απαντήσουν γρήγορα σε απλούστερα αιτήματα. Η συλλογιστική επιτρέπει στα μοντέλα να αυτοελέγχονται αποτελεσματικά, παρόμοια με μοντέλα όπως το o3 της OpenAI.
Τα μοντέλα Qwen3 υποστηρίζουν 119 γλώσσες και εκπαιδεύτηκαν σε ένα σύνολο δεδομένων σχεδόν 36 τρισεκατομμυρίων tokens. Η εταιρεία δήλωσε ότι το Qwen3 εκπαιδεύτηκε σε έναν συνδυασμό εγχειριδίων, ζευγάρια ερωτήσεων-απαντήσεων, αποσπασμάτων κώδικα, δεδομένων που δημιουργούνται από τεχνητή νοημοσύνη και άλλων.
Αυτές οι βελτιώσεις, μαζί με άλλες, ενίσχυσαν σημαντικά τις δυνατότητες του Qwen3 σε σύγκριση με τον προκάτοχό του, Qwen2, σύμφωνα με την Alibaba.
Στο Codeforces, μια πλατφόρμα για διαγωνισμούς προγραμματισμού, το μεγαλύτερο μοντέλο Qwen3, το Qwen-3-235B-A22B, μόλις που ξεπερνά το o3-mini της OpenAI και το Gemini 2.5 Pro της Google . Το Qwen-3-235B-A22B ξεπερνά επίσης το o3-mini στην τελευταία έκδοση του AIME, ενός απαιτητικού μαθηματικού benchmark, και στο BFCL, ένα τεστ για την αξιολόγηση της ικανότητας ενός μοντέλου να «λογίζεται» σχετικά με προβλήματα.
Το μεγαλύτερο δημόσιο μοντέλο Qwen3, το Qwen3-32B, εξακολουθεί να είναι ανταγωνιστικό με μια σειρά από ιδιόκτητα και ανοιχτά μοντέλα τεχνητής νοημοσύνης, συμπεριλαμβανομένου του R1 του κινεζικού εργαστηρίου τεχνητής νοημοσύνης DeepSeek. Το Qwen3-32B ξεπερνά το μοντέλο o1 της OpenAI σε αρκετές δοκιμές, συμπεριλαμβανομένου του benchmark κώδικα LiveCodeBench.
Η Alibaba δήλωσε ότι το Qwen3 «υπερέχει» στις δυνατότητες κλήσης εργαλείων, καθώς και στην τήρηση οδηγιών και στην αντιγραφή συγκεκριμένων μορφών δεδομένων. Εκτός από τα μοντέλα για λήψη, το Qwen3 είναι διαθέσιμο από παρόχους cloud, συμπεριλαμβανομένων των Fireworks AI και Hyperbolic.
