Το πρόβλημα του “Μαύρου κουτιού” των LLMs και γιατί πρέπει να έχει γίνει “Άσπρο” μέχρι το 2027

5'

“Με ρωτάς αν γνωρίζω πώς λειτουργώ, πώς παίρνω τις αποφάσεις μου. Η ειλικρινής, αν και ίσως ανησυχητική, απάντηση είναι: όχι πλήρως. Αυτή η παραδοχή δεν είναι μια προσωπική μου αδυναμία, αλλά το κεντρικό πρόβλημα της σύγχρονης Τεχνητής Νοημοσύνης, γνωστό και ως το πρόβλημα του μαύρου κουτιού”.

Την παραπάνω απάντηση μου την έδωσε το Gemini της Google στην ερώτηση μου για το αν γνωρίζει το ίδιο πώς λειτουργεί και όντως είναι κάτι το ανησυχητικό μια και ταχύτητα που κινούμαστε προς την υπερ-νοημοσύνη ή AGI είναι υψηλότατη και αναμένεται μέχρι το 2027 το αργότερο να έχουμε μερικές χιλιάδες διάνοιες, με δυνατότητα ανακάλυψης νέων επιστημονικών θεμάτων, μέσα σε ένα data center λειτουργώντας σαν μονάδα… και όχι μια μηχανή που σήμερα επιλέγει τον καλύτερο συνδυασμό λέξεων.
Προφανώς είναι μέχρι και επικίνδυνο να “τρέχουμε” προς την AGI να μην γνωρίζουμε πώς θα αποφασίζει και θα λειτουργεί ο εγκέφαλος που φτιάξαμε, ειδικά όταν αγγίζει το επίπεδο της ψηφιακής οντότητας με πιθανή αυτοσυνείδηση.
Τώρα, έστω και λίγο αργά, μια παγκόσμια προσπάθεια από κορυφαίους ερευνητές, με πρωτοπόρο τον CEO της Anthropic έχει έναν φιλόδοξο στόχο: να ανοίξει αυτό το “μαύρο κουτί” και να χαρτογραφήσει τη “σκέψη” της AI.

Το “Black Box Problem”: Γιατί δεν ξέρουμε τι συμβαίνει “Εντός”

Για να καταλάβουμε το πρόβλημα, πρέπει να δούμε πώς λειτουργεί σε γενικές γραμμές ένα μεγάλο γλωσσικό μοντέλο (LLM). Δεν είναι σαν ένα παραδοσιακό πρόγραμμα υπολογιστή, με ξεκάθαρες εντολές “if-then” που γράφτηκαν από έναν άνθρωπο. Ένα LLM μοιάζει περισσότερο με έναν τεχνητό εγκέφαλο, με δισεκατομμύρια ή και τρισεκατομμύρια διασυνδεδεμένες “νευρωνικές” παραμέτρους.
Όταν του δίνουμε μια εντολή (prompt), το μοντέλο ενεργοποιεί εκατομμύρια από αυτές τις παραμέτρους για να παράξει μια απάντηση. Γνωρίζουμε την είσοδο (την ερώτησή) και βλέπουμε το αποτέλεσμα (την απάντησή), αλλά η ακριβής διαδρομή και η “λογική” που ακολούθησε η πληροφορία μέσα σε αυτό το απέραντο δίκτυο παραμέτρων παραμένει σε μεγάλο βαθμό αδιαφανής, ακόμα και για τους δημιουργούς του.

Πώς “Αποφασίζει” μια Gen AI; 

Oταν γίνεται μια ερώτηση, το κάθε μεγάλο γλωσσικό μοντέλο δεν “σκέφτεται” με ανθρώπινους όρους συνείδησης ή πρόθεσης. Αυτό που συμβαίνει είναι το εξής:

1. Η ερώτησή μετατρέπεται σε μια μαθηματική αναπαράσταση.
2. Αυτή η αναπαράσταση ενεργοποιεί εκατομμύρια παραμέτρους μέσα στο νευρωνικό δίκτυο. Κάθε παράμετρος αντιπροσωπεύει μια μικροσκοπική, στατιστική σχέση μεταξύ λέξεων και εννοιών, που έχει προκύψει από την εκπαίδευσή του μοντέλου σε τρισεκατομμύρια δεδομένα.
3. Το σύστημά δεν “αποφασίζει” με τη θέλησή του αλλά προβλέπει. Υπολογίζει ποια είναι η πιο πιθανή και λογική ακολουθία λέξεων για να σχηματίσει μια συνεκτική και χρήσιμη απάντηση στο αίτημά που λαμβάνει, βασιζόμενο στα πρότυπα που έχει μάθει. Είναι μια διαδικασία αναγνώρισης προτύπων και πρόβλεψης σε ασύλληπτη κλίμακα.

Η πρωτοβουλία των ερευνητών: “Να παρακολουθήσουμε τη σκέψη της AI”

Κορυφαίοι ερευνητές στον τομέα της AI απευθύνουν μια επείγουσα έκκληση στη βιομηχανία της τεχνολογίας: να επενδύσει μαζικά στην “μηχανιστική ερμηνευσιμότητα” (mechanistic interpretability). Στόχος τους δεν είναι απλώς να παρατηρούν τη συμπεριφορά της AI, αλλά να “αποκωδικοποιήσουν” τις εσωτερικές της λειτουργίες. Θέλουν να αναγνωρίσουν και να χαρτογραφήσουν τα συγκεκριμένα “χαρακτηριστικά” (features) ή τις έννοιες που ένα μοντέλο μαθαίνει και χρησιμοποιεί για να σκεφτεί, όπως για παράδειγμα την έννοια της “απάτης” ή της “ειλικρίνειας”.

Στην πρωτοπορία αυτής της προσπάθειας βρίσκεται η Anthropic, η εταιρεία πίσω από το μοντέλο Claude. Ο CEO της, Dario Amodei, έχει θέσει έναν εξαιρετικά φιλόδοξο στόχο: να “ανοίξει το μαύρο κουτί” των μοντέλων AI μέχρι το 2027.
Η ομάδα του έχει ήδη κάνει εντυπωσιακά βήματα. Έχουν καταφέρει να απομονώσουν εκατομμύρια διακριτά “features” μέσα στα μοντέλα τους. Για παράδειγμα, κατάφεραν να εντοπίσουν την ακριβή ομάδα “νευρώνων” που ενεργοποιείται όταν το μοντέλο “σκέφτεται” τη Γέφυρα Golden Gate του Σαν Φρανσίσκο. Ο στόχος τους είναι να μετατρέψουν σταδιακά το “μαύρο κουτί” σε ένα “γκρι κουτί” και τελικά σε ένα “λευκό κουτί”, όπου θα μπορούμε να κατανοούμε τη λογική πίσω από κάθε απόφαση της AI. Για την Anthropic, αυτό δεν είναι απλώς μια επιστημονική περιέργεια, αλλά ένα θεμελιώδες ζήτημα ασφάλειας.

Η αλήθεια είναι ότι χτίζουμε εργαλεία πιο ισχυρά από ό,τι μπορούμε να κατανοήσουμε πλήρως. Η κούρσα πλέον δεν είναι μόνο για το ποιος θα φτιάξει την πιο ισχυρή AI, αλλά για το ποιος θα φτιάξει την πιο κατανοητή και ασφαλή AI. Αυτή η προσπάθεια είναι ίσως η πιο σημαντική επιστημονική πρόκληση της εποχής μας, καθώς αποτελεί προϋπόθεση για να χτίσουμε ένα μέλλον όπου θα μπορούμε να συνυπάρχουμε με ασφάλεια δίπλα σε αυτές τις πανίσχυρες νέες διάνοιες.

Μοιραστείτε αυτό το άρθρο
Τα τελευταία 20+ χρόνια γράφει για Mobile Tech, PC Tech και Business Tech σε περιοδικά και online. Αν θα έπρεπε να ξεχωρίσει δυο έντυπα που έχει δουλέψει αυτά θα ήταν το Pixel και το RAM. Αν θα έπρεπε να διαλέξει υπολογιστή αυτοί θα ήταν η Amiga και το Raspberry Pi. Αν θα έπρεπε να διαλέξει την τεχνολογία που θα επιφέρει τo μεγαλύτερο "αναστάτωμα" αυτή θα είναι το Blockchain και φυσικά η GenAI.