Ο Shawn Shen πιστεύει ότι η τεχνητή νοημοσύνη πρέπει να μπορεί να θυμάται όσα βλέπει για να πετύχει στον φυσικό κόσμο. Η εταιρεία του, Memories.ai, αξιοποιεί εργαλεία τεχνητής νοημοσύνης της Nvidia για να δημιουργήσει την υποδομή που θα επιτρέψει σε wearables και ρομποτικά συστήματα να αποθηκεύουν και να ανακαλούν οπτικές μνήμες.
Η Memories.ai ανακοίνωσε συνεργασία με τη Nvidia στο συνέδριο GTC. Μέσω αυτής, χρησιμοποιεί το Cosmos-Reason 2, ένα vision language model με δυνατότητες λογικής, καθώς και το Nvidia Metropolis, μια εφαρμογή για αναζήτηση και σύνοψη βίντεο, προκειμένου να εξελίξει την τεχνολογία της.
Η ιδέα για την εταιρεία προέκυψε όταν ο Shen και ο συνιδρυτής και CTO Ben Zhou εργάζονταν στην ανάπτυξη του συστήματος τεχνητής νοημοσύνης για τα έξυπνα γυαλιά Ray-Ban της Meta. Κατά τη διάρκεια αυτής της εμπειρίας, διαπίστωσαν ότι χωρίς τη δυνατότητα ανάκλησης των καταγεγραμμένων δεδομένων βίντεο, η χρησιμότητα της τεχνολογίας ήταν περιορισμένη.
Αφού δεν εντόπισαν υπάρχουσες λύσεις για οπτική μνήμη στην AI, αποφάσισαν να αποχωρήσουν από τη Meta και να δημιουργήσουν τη δική τους εταιρεία.
Όπως σημειώνει ο Shen, ενώ η τεχνητή νοημοσύνη έχει ήδη σημειώσει σημαντική πρόοδο στον ψηφιακό κόσμο, η εφαρμογή της στον φυσικό κόσμο —μέσω wearables και ρομποτικής— απαιτεί την ανάπτυξη οπτικής μνήμης, αναφέρει το TechCrunch.
Η δυνατότητα «μνήμης» στην AI είναι σχετικά νέα. Η OpenAI πρόσθεσε δυνατότητα αποθήκευσης προηγούμενων συνομιλιών στο ChatGPT το 2024 και τη βελτίωσε το 2025, ενώ και οι xAI του Elon Musk και το Google Gemini έχουν παρουσιάσει αντίστοιχα εργαλεία. Ωστόσο, αυτές οι εξελίξεις εστιάζουν κυρίως στη μνήμη κειμένου, η οποία είναι πιο εύκολη στη δομή και την ευρετηρίαση, αλλά λιγότερο χρήσιμη για εφαρμογές που βασίζονται στην όραση.
Η Memories.ai ιδρύθηκε το 2024 και έχει συγκεντρώσει συνολικά 16 εκατομμύρια δολάρια, μέσω ενός seed γύρου 8 εκατομμυρίων τον Ιούλιο του 2025 και μιας επιπλέον επέκτασης 8 εκατομμυρίων. Της χρηματοδότησης ηγήθηκε η Susa Ventures, με συμμετοχή των Seedcamp, Fusion Fund και Crane Venture Partners.
Για την ανάπτυξη της τεχνολογίας της, η εταιρεία επικεντρώθηκε σε δύο βασικούς άξονες: τη δημιουργία υποδομής για τη μετατροπή και αποθήκευση βίντεο σε μορφή δεδομένων που μπορούν να ανακτηθούν, και τη συλλογή κατάλληλων δεδομένων για την εκπαίδευση των μοντέλων.
Τον Ιούλιο του 2025 παρουσίασε το large visual memory model (LVMM), το οποίο, σύμφωνα με τον Shen, μπορεί να συγκριθεί με μια μικρότερη εκδοχή του Gemini Embedding 2, ενός πολυτροπικού μοντέλου για ευρετηρίαση και ανάκτηση δεδομένων.
Για τη συλλογή δεδομένων, η εταιρεία δημιούργησε τη συσκευή LUCI, την οποία φορούν ειδικοί «συλλέκτες δεδομένων» για την καταγραφή βίντεο που χρησιμοποιείται στην εκπαίδευση του μοντέλου. Η εταιρεία δεν σκοπεύει να εμπορευματοποιήσει τη συσκευή, αλλά την ανέπτυξε λόγω περιορισμών των διαθέσιμων λύσεων στην αγορά.
Παράλληλα, η Memories.ai παρουσίασε τη δεύτερη γενιά του μοντέλου της και σύναψε συνεργασία με την Qualcomm, ώστε η τεχνολογία της να λειτουργεί σε επεξεργαστές της εταιρείας από αργότερα μέσα στο έτος.
