Meta: Θα χρειαστεί δεκαπλάσια υπολογιστική ισχύ για να εκπαιδεύσει το Llama 4

Η εταιρεία ετοιμάζεται να εκπαιδεύσει το επόμενης γενιάς μοντέλο γλώσσας, Llama 4, το οποίο απαιτεί περίπου 160.000 GPUs, αριθμός που αντιπροσωπεύει δεκαπλάσια αύξηση σε σύγκριση με τους πόρους που χρειάστηκαν για το Llama 3.

Τελευταία ενημέρωση: 06/08/2024 12:19

Newsroom

Η Meta, η οποία αναπτύσσει ένα από τα μεγαλύτερα θεμελιώδη μοντέλα μεγάλων γλωσσών ανοιχτού κώδικα, το Llama, πιστεύει ότι θα χρειαστεί σημαντικά περισσότερη υπολογιστική ισχύ για την εκπαίδευση μοντέλων στο μέλλον. Η εταιρεία ετοιμάζεται να εκπαιδεύσει το επόμενης γενιάς μοντέλο γλώσσας, Llama 4, το οποίο απαιτεί περίπου 160.000 GPUs, αριθμός που αντιπροσωπεύει δεκαπλάσια αύξηση σε σύγκριση με τους πόρους που χρειάστηκαν για το Llama 3.

Η Meta κυκλοφόρησε το Llama 3 με 8 δισεκατομμύρια παραμέτρους τον Απρίλιο. Η εταιρεία κυκλοφόρησε την περασμένη εβδομάδα μια αναβαθμισμένη έκδοση του μοντέλου, που ονομάζεται Llama 3.1 405B, η οποία είχε 405 δισεκατομμύρια παραμέτρους , καθιστώντας το το μεγαλύτερο μοντέλο ανοιχτού κώδικα της Meta.

Οι κεφαλαιουχικές δαπάνες της εταιρείας έχουν ήδη δει μια αύξηση 33% σε ετήσια βάση το δεύτερο τρίμηνο του 2024, φτάνοντας τα 8,5 δισεκατομμύρια δολάρια, καθώς επενδύει σημαντικά σε servers, κέντρα δεδομένων και υποδομές δικτύου για να υποστηρίξει τα σχέδιά της για την ανάπτυξη τεχνητής νοημοσύνης. Η CFO της Meta, Susan Li, τόνισε τη στρατηγική της εταιρείας για σταδιακή ανάπτυξη κέντρων δεδομένων σε διάφορα στάδια ανάπτυξης, επιτρέποντας μια ευέλικτη κατανομή πόρων μεταξύ της εκπαίδευσης δημιουργικής τεχνητής νοημοσύνης και των βασικών καθηκόντων κατάταξης και σύστασης.

Ο CEO της Meta, Mark Zuckerberg, έχει εκφράσει την φιλοδοξία της εταιρείας το Llama 4 να γίνει το πιο προηγμένο μοντέλο στη βιομηχανία την επόμενη χρονιά. Ενώ συγκεκριμένες λεπτομέρειες σχετικά με τις δυνατότητες του μοντέλου παραμένουν αδημοσίευτες, η δεκαπλάσια αύξηση της υπολογιστικής ισχύος υποδηλώνει σημαντικές βελτιώσεις στην απόδοση και τις δυνατότητες.

Η επένδυση της Meta στις υποδομές τεχνητής νοημοσύνης αναμένεται να συνεχιστεί τα επόμενα χρόνια, με τις κεφαλαιουχικές δαπάνες να προβλέπεται να αυξηθούν σημαντικά το 2025 για να υποστηρίξουν την μελλοντική εκπαίδευση μοντέλων τεχνητής νοημοσύνης. Αν και η εταιρεία δεν προβλέπει άμεσα έσοδα από προϊόντα δημιουργικής τεχνητής νοημοσύνης, η μακροπρόθεσμη στρατηγική περιλαμβάνει την ανάπτυξη προηγμένων εργαλείων τεχνητής νοημοσύνης για διάφορες εφαρμογές, συμπεριλαμβανομένων πιθανών βελτιώσεων στην εξατομίκευση διαφημίσεων και τις συστάσεις περιεχομένου.

Must Read

AWS: Ανοίγει δωρεάν προγράμματα και πιστοποιήσεις Τεχνητής Νοημοσύνης για Έλληνες προγραμματιστές

Κομισιόν: Φρένο στα Social Media για κάτω των 13

JA Europe Gen-E 2026: 2η θέση στην Ευρώπη και βροχή διακρίσεων για την ελληνική ENALION

Το απόλυτο “Sanctuary”: Όταν η ακουστική μηχανική της B&O συναντά τα κορυφαία αποστάγματα του 2026

BRRRO: Το app με ελληνικό DNA που ξεπέρασε WhatsApp & Viber και κατέκτησε την κορυφή του App Store

Meta: Θα χρειαστεί δεκαπλάσια υπολογιστική ισχύ για να εκπαιδεύσει το Llama 4

Must Read

AWS: Ανοίγει δωρεάν προγράμματα και πιστοποιήσεις Τεχνητής Νοημοσύνης για Έλληνες προγραμματιστές

JA Europe Gen-E 2026: 2η θέση στην Ευρώπη και βροχή διακρίσεων για την ελληνική ENALION

Το απόλυτο “Sanctuary”: Όταν η ακουστική μηχανική της B&O συναντά τα κορυφαία αποστάγματα του 2026

Σχετικά Άρθρα

AWS: Ανοίγει δωρεάν προγράμματα και πιστοποιήσεις Τεχνητής Νοημοσύνης για Έλληνες προγραμματιστές

Κομισιόν: Φρένο στα Social Media για κάτω των 13

JA Europe Gen-E 2026: 2η θέση στην Ευρώπη και βροχή διακρίσεων για την ελληνική ENALION

Το απόλυτο “Sanctuary”: Όταν η ακουστική μηχανική της B&O συναντά τα κορυφαία αποστάγματα του 2026

Τελευταία Νέα

AWS: Ανοίγει δωρεάν προγράμματα και πιστοποιήσεις Τεχνητής Νοημοσύνης για Έλληνες προγραμματιστές

JA Europe Gen-E 2026: 2η θέση στην Ευρώπη και βροχή διακρίσεων για την ελληνική ENALION

Δημοφιλή Εβδομάδας

ESA BIC Greece: Ποιες είναι οι 32 Startups που ορίζουν το ελληνικό SpaceTech

Newsletter

Επικοινωνία

Πολιτική Προστασίας | Πολιτική Cookies | Όροι Χρήσης

Stock images by Depositphotos

© 2024 - Startupper. All Rights Reserved.

Αριθμός Πιστοποίησης Μ.Η.Τ.242865