DeepMind: Το Genie 2 δημιουργεί διαδραστικούς κόσμους που μοιάζουν με βιντεοπαιχνίδια

Το Genie 2, το μοντέλο -διάδοχος του Genie, το οποίο κυκλοφόρησε νωρίτερα αυτό το έτος - μπορεί να δημιουργήσει μια διαδραστική σκηνή σε πραγματικό χρόνο από μια περιγραφή εικόνας και κειμένου.

Newsroom
3'
Η DeepMind, ο ερευνητικός οργανισμός τεχνητής νοημοσύνης της Google, αποκάλυψε ένα μοντέλο που μπορεί να δημιουργήσει μια «ατελείωτη» ποικιλία τρισδιάστατων κόσμων με δυνατότητα αναπαραγωγής.

Το Genie 2, το μοντέλο -διάδοχος του Genie, το οποίο κυκλοφόρησε νωρίτερα αυτό το έτος – μπορεί να δημιουργήσει μια διαδραστική σκηνή σε πραγματικό χρόνο από μια περιγραφή εικόνας και κειμένου. Για παράδειγμα ένα χαριτωμένο ανθρωποειδές ρομπότ στο δάσος. Είναι παρόμοιο με μοντέλα υπό ανάπτυξη από την εταιρεία του Fei-Fei Li, τα World Labs και την ισραηλινή startup Decart .

Η DeepMind ισχυρίζεται ότι το Genie 2 μπορεί να δημιουργήσει μια «τεράστια ποικιλία από πλούσιους τρισδιάστατους κόσμους», συμπεριλαμβανομένων κόσμων στους οποίους οι χρήστες μπορούν να κάνουν ενέργειες όπως το άλμα και το κολύμπι χρησιμοποιώντας ένα ποντίκι ή πληκτρολόγιο. Εκπαιδευμένο σε βίντεο, το μοντέλο μπορεί να προσομοιώνει αλληλεπιδράσεις αντικειμένων, κινούμενα σχέδια, φωτισμό, φυσική, αντανακλάσεις και τη συμπεριφορά των “NPC”.

Πολλές από τις προσομοιώσεις του Genie 2 μοιάζουν με βιντεοπαιχνίδια AAA. Η DeepMind λέει ότι το Genie 2 μπορεί να δημιουργήσει συνεπείς κόσμους με διαφορετικές προοπτικές, όπως όψεις πρώτου προσώπου και ισομετρικές, για έως και ένα λεπτό, με την πλειοψηφία να διαρκεί 10 έως 20 δευτερόλεπτα.

Τα περισσότερα μοντέλα όπως το Genie 2, μπορούν να προσομοιώσουν παιχνίδια και τρισδιάστατα περιβάλλοντα, αλλά με προβλήματα που σχετίζονται με συνέπεια και παραισθήσεις . Για παράδειγμα, ο προσομοιωτής Minecraft του Decart,  Oasis , έχει χαμηλή ανάλυση και γρήγορα «ξεχνά» τη διάταξη των επιπέδων.

Το Genie 2, ωστόσο, μπορεί να θυμηθεί μέρη μιας προσομοιωμένης σκηνής που δεν είναι ορατά και να τα αποδώσει με ακρίβεια όταν γίνουν ξανά ορατά.

Τα παιχνίδια που δημιουργήθηκαν με το Genie 2 δεν θα ήταν τόσο διασκεδαστικά, δεδομένου ότι θα διαγράφουν την πρόοδό σας κάθε λεπτό. Αυτός είναι ο λόγος για τον οποίο η DeepMind τοποθετεί το μοντέλο περισσότερο ως εργαλείο έρευνας και δημιουργικότητας – ένα εργαλείο για τη δημιουργία πρωτοτύπων «διαδραστικών εμπειριών» και την αξιολόγηση πρακτόρων τεχνητής νοημοσύνης .

Η Google διοχέτευσε πόρους στην παγκόσμια έρευνα μοντέλων της, η οποία υπόσχεται να είναι το next big thing στην τεχνητή νοημοσύνη. Τον Οκτώβριο, η DeepMind προσέλαβε τον Tim Brooks, ο οποίος ήταν επικεφαλής της ανάπτυξης στη γεννήτρια βίντεο Sora του OpenAI , για να εργαστεί σε τεχνολογίες παραγωγής βίντεο και σε παγκόσμιους προσομοιωτές. Και πριν από δύο χρόνια, το εργαστήριο πήρε από τη Meta τον Tim Rocktäschel, πιο γνωστό για τα πειράματά του «ανοιχτού τύπου» με βιντεοπαιχνίδια όπως το NetHack.

Μοιραστείτε αυτό το άρθρο
ΑπόNewsroom
Ακολουθήστε
Tο πρώτο ειδησεογραφικό πόρταλ στην Ελλάδα για τις startups, που αναδεικνύει τα νέα και τη δυναμική του ελληνικού οικοσυστήματος. Εκτός από την καταγραφή του ελληνικού οικοσυστήματος καλύπτει τα τεκταινόμενα και τις διεθνείς τάσεις σε ό,τι αφορά στις startups, τις επενδύσεις, τις νομικές και φορολογικές ρυθμίσεις που αφορούν στα επιχειρηματικά οικοσυστήματα της Ευρώπης και του κόσμου.