Alibaba: Αποκαλύπτει το Qwen3, το υβριδικό μοντέλο συλλογισμού AI STARTUPPER

Τα μοντέλα Qwen3 υποστηρίζουν 119 γλώσσες και εκπαιδεύτηκαν σε ένα σύνολο δεδομένων σχεδόν 36 τρισεκατομμυρίων tokens

Τελευταία ενημέρωση: 30/04/2025 00:13

Η κινεζική τεχνολογική εταιρεία Alibaba κυκλοφόρησε τη Δευτέρα το Qwen3, μια οικογένεια μοντέλων τεχνητής νοημοσύνης που η εταιρεία ισχυρίζεται ότι μπορούν να φτάσουν και, σε ορισμένες περιπτώσεις, να ξεπεράσουν τα καλύτερα μοντέλα που διατίθενται από την Google και την OpenAI.

Τα περισσότερα από τα μοντέλα είναι διαθέσιμα για λήψη με «ανοιχτή» άδεια χρήσης στην πλατφόρμα ανάπτυξης τεχνητής νοημοσύνης Hugging Face και στο GitHub. Το μέγεθός τους κυμαίνεται από 0,6 δισεκατομμύρια παραμέτρους έως 235 δισεκατομμύρια παραμέτρους.

Η άνοδος των μοντέλων κινεζικής προέλευσης, όπως το Qwen, έχει αυξήσει την πίεση σε αμερικανικά εργαστήρια, όπως η OpenAI, να παρέχουν πιο ικανές τεχνολογίες τεχνητής νοημοσύνης. Έχουν επίσης οδηγήσει τους υπεύθυνους χάραξης πολιτικής στην εφαρμογή περιορισμών που αποσκοπούν στον περιορισμό της ικανότητας των κινεζικών εταιρειών τεχνητής νοημοσύνης να αποκτήσουν τα απαραίτητα τσιπ για την εκπαίδευση μοντέλων.

Σύμφωνα με την Alibaba, τα μοντέλα Qwen3 είναι υβριδικά» μοντέλα — μπορούν να χρειαστούν χρόνο για να «εκλογικεύσουν» πολύπλοκα προβλήματα ή να απαντήσουν γρήγορα σε απλούστερα αιτήματα. Η συλλογιστική επιτρέπει στα μοντέλα να αυτοελέγχονται αποτελεσματικά, παρόμοια με μοντέλα όπως το o3 της OpenAI.

Τα μοντέλα Qwen3 υποστηρίζουν 119 γλώσσες και εκπαιδεύτηκαν σε ένα σύνολο δεδομένων σχεδόν 36 τρισεκατομμυρίων tokens. Η εταιρεία δήλωσε ότι το Qwen3 εκπαιδεύτηκε σε έναν συνδυασμό εγχειριδίων, ζευγάρια ερωτήσεων-απαντήσεων, αποσπασμάτων κώδικα, δεδομένων που δημιουργούνται από τεχνητή νοημοσύνη και άλλων.

Αυτές οι βελτιώσεις, μαζί με άλλες, ενίσχυσαν σημαντικά τις δυνατότητες του Qwen3 σε σύγκριση με τον προκάτοχό του, Qwen2, σύμφωνα με την Alibaba.

Στο Codeforces, μια πλατφόρμα για διαγωνισμούς προγραμματισμού, το μεγαλύτερο μοντέλο Qwen3, το Qwen-3-235B-A22B, μόλις που ξεπερνά το o3-mini της OpenAI και το Gemini 2.5 Pro της Google . Το Qwen-3-235B-A22B ξεπερνά επίσης το o3-mini στην τελευταία έκδοση του AIME, ενός απαιτητικού μαθηματικού benchmark, και στο BFCL, ένα τεστ για την αξιολόγηση της ικανότητας ενός μοντέλου να «λογίζεται» σχετικά με προβλήματα.

Το μεγαλύτερο δημόσιο μοντέλο Qwen3, το Qwen3-32B, εξακολουθεί να είναι ανταγωνιστικό με μια σειρά από ιδιόκτητα και ανοιχτά μοντέλα τεχνητής νοημοσύνης, συμπεριλαμβανομένου του R1 του κινεζικού εργαστηρίου τεχνητής νοημοσύνης DeepSeek. Το Qwen3-32B ξεπερνά το μοντέλο o1 της OpenAI σε αρκετές δοκιμές, συμπεριλαμβανομένου του benchmark κώδικα LiveCodeBench.

Η Alibaba δήλωσε ότι το Qwen3 «υπερέχει» στις δυνατότητες κλήσης εργαλείων, καθώς και στην τήρηση οδηγιών και στην αντιγραφή συγκεκριμένων μορφών δεδομένων. Εκτός από τα μοντέλα για λήψη, το Qwen3 είναι διαθέσιμο από παρόχους cloud, συμπεριλαμβανομένων των Fireworks AI και Hyperbolic.

Must Read

Review Philips Evnia 34M2C6500: Η απόλυτη χρωματική ακρίβεια σε μια προσιτή QD-OLED οθόνη

TAG Heuer Carrera Chronograph Glassbox Sand: Όταν η αδρεναλίνη της πίστας συναντά την κομψότητα του καλοκαιριού

STARTUPPER MAG: Το περιοδικό της ελληνικής Startup σκηνής, Το Σάββατο 18/7 ΑΠΟΚΛΕΙΣΤΙΚΑ με τα ΠΑΡΑΠΟΛΙΤΙΚΑ

Η Visa λανσάρει stablecoin πλατφόρμα για 200 εκατ. εμπόρους – και ανοίγει νέο μέτωπο απέναντι στη Mastercard

Η FATF προειδοποιεί: Εγκληματικά δίκτυα δημιουργούν δικά τους stablecoins για να αποφύγουν κατασχέσεις

Alibaba: Αποκαλύπτει το Qwen3, το υβριδικό μοντέλο συλλογισμού AI

Τα μοντέλα Qwen3 υποστηρίζουν 119 γλώσσες και εκπαιδεύτηκαν σε ένα σύνολο δεδομένων σχεδόν 36 τρισεκατομμυρίων tokens

Must Read

Review Philips Evnia 34M2C6500: Η απόλυτη χρωματική ακρίβεια σε μια προσιτή QD-OLED οθόνη

TAG Heuer Carrera Chronograph Glassbox Sand: Όταν η αδρεναλίνη της πίστας συναντά την κομψότητα του καλοκαιριού

STARTUPPER MAG: Το περιοδικό της ελληνικής Startup σκηνής, Το Σάββατο 18/7 ΑΠΟΚΛΕΙΣΤΙΚΑ με τα ΠΑΡΑΠΟΛΙΤΙΚΑ

Η Visa λανσάρει stablecoin πλατφόρμα για 200 εκατ. εμπόρους – και ανοίγει νέο μέτωπο απέναντι στη Mastercard

Σχετικά Άρθρα

Review Philips Evnia 34M2C6500: Η απόλυτη χρωματική ακρίβεια σε μια προσιτή QD-OLED οθόνη

TAG Heuer Carrera Chronograph Glassbox Sand: Όταν η αδρεναλίνη της πίστας συναντά την κομψότητα του καλοκαιριού

STARTUPPER MAG: Το περιοδικό της ελληνικής Startup σκηνής, Το Σάββατο 18/7 ΑΠΟΚΛΕΙΣΤΙΚΑ με τα ΠΑΡΑΠΟΛΙΤΙΚΑ

Η Visa λανσάρει stablecoin πλατφόρμα για 200 εκατ. εμπόρους – και ανοίγει νέο μέτωπο απέναντι στη Mastercard

Τελευταία Νέα

Review Philips Evnia 34M2C6500: Η απόλυτη χρωματική ακρίβεια σε μια προσιτή QD-OLED οθόνη

TAG Heuer Carrera Chronograph Glassbox Sand: Όταν η αδρεναλίνη της πίστας συναντά την κομψότητα του καλοκαιριού

STARTUPPER MAG: Το περιοδικό της ελληνικής Startup σκηνής, Το Σάββατο 18/7 ΑΠΟΚΛΕΙΣΤΙΚΑ με τα ΠΑΡΑΠΟΛΙΤΙΚΑ

Δημοφιλή Εβδομάδας

Newsletter

Επικοινωνία

Πολιτική Προστασίας | Πολιτική Cookies | Όροι Χρήσης

Stock images by Depositphotos

© 2024 - Startupper. All Rights Reserved.

Αριθμός Πιστοποίησης Μ.Η.Τ.242865

Must Read

More Read

Must Read

Σχετικά Άρθρα

Δημοφιλή Εβδομάδας

Newsletter