Η κινεζική DeepSeek αναμένεται να κυκλοφορήσει το νέο της μοντέλο-ναυαρχίδα, DeepSeek V4, το οποίο υπόσχεται να επανακαθορίσει τι είναι εφικτό στην Τεχνητή Νοημοσύνη, χρησιμοποιώντας μάλιστα… κινεζικά τσιπ.
1 Τρισ. παράμετροι και Native Multimodality
Σύμφωνα με αποκαλυπτικά στοιχεία του Financial Times και του Awesome Agents, το V4 θα είναι ένα μοντέλο αρχιτεκτονικής Mixture-of-Experts (MoE) με το ασύλληπτο νούμερο του 1 τρισεκατομμυρίου παραμέτρων. Το πιο εντυπωσιακό; Παρά την αύξηση του μεγέθους κατά 50% σε σχέση με το V3, οι ενεργές παράμετροι ανά token μειώνονται στις 32 δισ., καθιστώντας το μοντέλο ακόμα πιο γρήγορο και οικονομικό.
Σε αντίθεση με τους ανταγωνιστές που «κολλάνε» δυνατότητες εικόνας και ήχου πάνω σε μοντέλα κειμένου, το V4 είναι natively multimodal. Εκπαιδεύτηκε εξαρχής σε κείμενο, εικόνα, βίντεο και ήχο, προσφέροντας μια ενιαία και πολύ πιο βαθιά κατανόηση του κόσμου.
Το «διαζύγιο» με την Nvidia και η κυριαρχία της Huawei
Η μεγαλύτερη είδηση, ωστόσο, είναι γεωπολιτική. Η DeepSeek απέκλεισε την Nvidia και την AMD από το στάδιο της προ-κυκλοφορίας, βελτιστοποιώντας το V4 αποκλειστικά για τους επεξεργαστές Huawei Ascend και Cambricon. Πρόκειται για μια στρατηγική κίνηση που αποδεικνύει ότι η Κίνα μπορεί πλέον να παράγει AI παγκόσμιας κλάσης χωρίς να εξαρτάται από το αμερικανικό πυρίτιο – ακριβώς το σενάριο που οι κυρώσεις των ΗΠΑ προσπαθούσαν να αποτρέψουν.
Επιδόσεις που σοκάρουν: Καλύτερο από το Claude 4.5;
Διαρροές από εσωτερικά benchmarks δείχνουν το DeepSeek V4 να χτυπάει πάνω από 90% στο HumanEval (coding) και 80%+ στο SWE-bench, ξεπερνώντας το Claude 4.5 της Anthropic. Επιπλέον, το context window των 1 εκατομμυρίου tokens επιτρέπει την επεξεργασία τεράστιων όγκων δεδομένων με ελάχιστο κόστος.
Όσον αφορά την τιμολόγηση, οι αναλυτές εκτιμούν ότι το V4 θα είναι 20 έως 50 φορές φθηνότερο από τα μοντέλα της OpenAI, συνεχίζοντας την πολιτική του «δημοκρατικού AI» που ακολουθεί η εταιρεία.
Η κυκλοφορία είναι προγραμματισμένη να συμπέσει με τις ετήσιες κοινοβουλευτικές συνεδριάσεις της Κίνας (Two Sessions), στέλνοντας ένα σαφές μήνυμα τεχνολογικής αυτονομίας και ισχύος στη διεθνή σκηνή.
