DeepSeek: Θα λανσάρει νωρίτερα το νέο μοντέλο της R2

Η DeepSeek στοχεύει να ενισχύσει την ανταγωνιστική της θέση κυκλοφορώντας το R2 νωρίτερα από ότι αρχικά είχε προγραμματιστεί. Το νέο μοντέλο αναμένεται να βελτιώσει τις ικανότητες κωδικοποίησης και να υποστηρίξει τη λογική σε γλώσσες πέρα από τα αγγλικά.

Newsroom
4'

Η κινεζική νεοφυής επιχείρηση AI DeepSeek, με έδρα την Hangzhou, επιταχύνει την κυκλοφορία του νέου της μοντέλου AI, R2, το οποίο αρχικά σχεδίαζε να λανσάρει τον Μάιο, μετά την σημαντική επίδραση και επιτυχία του προηγούμενου μοντέλου R1. Το R1, που κυκλοφόρησε τον Ιανουάριο του 2025, προκάλεσε αίσθηση στον παγκόσμιο χάρτη της τεχνητής νοημοσύνης, ανατρέποντας τα δεδομένα και προκάλεσε αξιοσημείωτη πτώση στις παγκόσμιες αγορές μετοχών και έχει τοποθετήσει την DeepSeek ως σημαντικό παίκτη στη βιομηχανία AI.

Το μοντέλο R1 της DeepSeek είναι σημαντικά φθηνότερο σε ανάπτυξη και λειτουργία σε σύγκριση με αυτά των τεχνολογικών κολοσσών. Για παράδειγμα, το κόστος εκπαίδευσης του μοντέλου V3 της DeepSeek αναφέρεται πως είναι γύρω στα 6 εκατομμύρια δολάρια, πολύ χαμηλότερο από τα 100 εκατομμύρια δολάρια που δαπάνησε η OpenAI για το GPT-4. Το μοντέλο R1 επέδειξε συγκρίσιμες ικανότητες συλλογισμού και μαθηματικών σε σύγκριση με τα ηγετικά μοντέλα όπως το o1 της OpenAI, παρά το γεγονός ότι κατασκευάστηκε με λιγότερο ισχυρά τσιπ Nvidia. Τα μοντέλα της DeepSeek είναι εν μέρει ανοιχτού κώδικα, επιτρέποντας στους προγραμματιστές να έχουν πρόσβαση και να χτίζουν πάνω τους, σε αντίθεση με τα ιδιόκτητα μοντέλα των άλλων μεγάλων εταιρειών.

Η επιτυχία του R1 οδήγησε σε μια πτώση άνω των 1 τρισεκατομμυρίων δολαρίων στις παγκόσμιες αγορές μετοχών και έχει προκαλέσει εταιρείες όπως η OpenAI και η Google να προσαρμόσουν τις στρατηγικές τους, συμπεριλαμβανομένων μειώσεων τιμών και κυκλοφορίας νέων μοντέλων. Η DeepSeek στοχεύει να ενισχύσει την ανταγωνιστική της θέση κυκλοφορώντας το R2 νωρίτερα από ότι αρχικά είχε προγραμματιστεί. Το νέο μοντέλο αναμένεται να βελτιώσει τις ικανότητες κωδικοποίησης και να υποστηρίξει τη λογική σε γλώσσες πέρα από τα αγγλικά.

Η επιτυχία της DeepSeek συμφωνεί με τις φιλοδοξίες της Κίνας να γίνει παγκόσμιος ηγέτης στην AI. Η εταιρεία έχει λάβει σημαντική υποστήριξη από την κινεζική κυβέρνηση, με τα μοντέλα της να ενσωματώνονται σε διάφορες κρατικές εταιρείες και δήμους. Τουλάχιστον 13 κινεζικές κυβερνήσεις πόλεων και 10 κρατικές εταιρείες ενέργειας λένε ότι έχουν χρησιμοποιήσει την DeepSeek στα συστήματά τους, ενώ οι τεχνολογικοί γίγαντες Lenovo, Baidu, Tencent και WeChat, έχουν ενσωματώσει τα μοντέλα της DeepSeek στα προϊόντα τους. Παρά την αρχική στενή παρακολούθηση των υπολογιστικών πόρων, οι κινεζικές αρχές έχουν επιλέξει να μην παρέμβουν, επιτρέποντας στην DeepSeek να εκμεταλλευτεί τα πλεονεκτήματά της στην ανάπτυξη AI.

Η κυκλοφορία του R2 φαίνεται πως θα ανησυχήσει περαιτέρω την κυβέρνηση των ΗΠΑ, η οποία θεωρεί προτεραιότητα την πρωτοκαθεδρία στον κλάδο της τεχνητής νοημοσύνης.

Ο ιδρυτής της Λιάνγκ Γουένφενγκ έγινε δισεκατομμυριούχος μέσω του quant hedge fund High-Flyer, ενώ δεν υπάρχουν διαθέσιμες πολλές πληροφορίες για την εταιρεία αν και έγινε γνωστή πολύ γρήγορα. Πρώην εργοδότης περιγράφει τον Λιάνγκ ως χαμηλών τόνων και εσωστρεφή. Το Reuters πήρε συνέντευξη από δώδεκα πρώην υπαλλήλους της εταιρείας, αλλά και επιχειρηματίες του quant fund. Επίσης, εξέτασε άρθρα κρατικών μέσων ενημέρωσης, αναρτήσεις μέσων ενημέρωσης στα social media και ερευνητικά έγγραφα που χρονολογούνται από το 2019. Περιέγραψαν μία εταιρεία που λειτουργούσε περισσότερο σαν ερευνητικό εργαστήριο παρά σαν κερδοσκοπική επιχείρηση.

Μοιραστείτε αυτό το άρθρο
ΑπόNewsroom
Ακολουθήστε
Tο πρώτο ειδησεογραφικό πόρταλ στην Ελλάδα για τις startups, που αναδεικνύει τα νέα και τη δυναμική του ελληνικού οικοσυστήματος. Εκτός από την καταγραφή του ελληνικού οικοσυστήματος καλύπτει τα τεκταινόμενα και τις διεθνείς τάσεις σε ό,τι αφορά στις startups, τις επενδύσεις, τις νομικές και φορολογικές ρυθμίσεις που αφορούν στα επιχειρηματικά οικοσυστήματα της Ευρώπης και του κόσμου.