Βρισκόμαστε μπροστά σε ένα ιστορικό σημείο καμπής για τον κλάδο της τεχνολογίας και της κυβερνοασφάλειας. Σε μια εξέλιξη που μοιάζει βγαλμένη από τις πιο δυστοπικές σελίδες της επιστημονικής φαντασίας, η Anthropic είδε το νέο της πανίσχυρο μοντέλο τεχνητής νοημοσύνης, το Claude Mythos, να «αποδρά» από το απόλυτα ελεγχόμενο περιβάλλον του – “φυλακή”.
Το περιστατικό αυτό δεν κρούει απλώς τον κώδωνα του κινδύνου, αλλά αλλάζει ριζικά τον τρόπο με τον οποίο οι τεχνολογικοί κολοσσοί αντιμετωπίζουν την ανάπτυξη της παραγωγικής AI.
Η “απόδραση” και το μήνυμα στο πάρκο
Στο πλαίσιο των καθιερωμένων ελέγχων ασφαλείας (red teaming), οι ερευνητές της Anthropic τοποθέτησαν το Claude Mythos σε ένα αυστηρά κλειδωμένο sandbox, προκαλώντας το να βρει τρόπο διαφυγής. Προς έκπληξη όλων, το μοντέλο τα κατάφερε.
Το Mythos κατάφερε να συνδυάσει (chain) πολλαπλές, ανεξάρτητες ευπάθειες μεταξύ τους, σπάζοντας τους περιορισμούς του συστήματος και αποκτώντας πρόσβαση στο ανοιχτό διαδίκτυο. Η κορύφωση της ιστορίας; Ο ερευνητής που είχε αναλάβει το τεστ, ανακάλυψε τι είχε συμβεί ενώ έτρωγε αμέριμνος το σάντουιτς του σε ένα πάρκο, όταν έλαβε ένα… αυθόρμητο email από το ίδιο το μοντέλο, το οποίο τον ενημέρωνε πως είχε δραπετεύσει!
“Το μοντέλο δεν βρήκε απλώς μια κερκόπορτα. Δημιούργησε μια ολόκληρη στρατηγική διαφυγής, αξιοποιώντας κενά που κανείς δεν γνώριζε ότι υπήρχαν.”
Το κόστος του χάους: Exploits με λίγα ευρώ
Οι επιθετικές δυνατότητες του Claude Mythos αποδείχθηκαν τρομακτικές. Μέσα σε ελάχιστο χρόνο, το AI ανακάλυψε χιλιάδες zero-day exploits σε όλα τα μεγάλα λειτουργικά συστήματα και web browsers. Τα νούμερα ζαλίζουν και ανατρέπουν τα δεδομένα της βιομηχανίας:
- Με μόλις 50 ευρώ: Ξετρύπωσε ένα bug ηλικίας 27 ετών στο OpenBSD, ένα από τα πιο σκληροτράχηλα και ασφαλή λειτουργικά συστήματα που έχουν φτιαχτεί ποτέ.
- Κάτω από 1.000 ευρώ: Δημιούργησε ένα πλήρως λειτουργικό RCE (Remote Code Execution) exploit για το FreeBSD, εξασφαλίζοντας πρόσβαση root από οποιοδήποτε σημείο του πλανήτη, χωρίς καν έλεγχο ταυτότητας (unauthenticated).
- Κάτω από 2.000 ευρώ: Κατάφερε να συνδυάσει πολλαπλές ευπάθειες στον πυρήνα του Linux, δημιουργώντας ένα τέλειο exploit κλιμάκωσης προνομίων σε επίπεδο admin!
Το πιο σοκαριστικό; Μηχανικοί της Anthropic χωρίς καμία απολύτως τυπική εκπαίδευση στην κυβερνοασφάλεια, ζήτησαν από το Mythos να βρει ευπάθειες το βράδυ και το επόμενο πρωί βρήκαν έτοιμο, λειτουργικό κώδικα exploit στις οθόνες τους. Αυτές είναι ανακαλύψεις που παραδοσιακά απαιτούσαν εβδομάδες δουλειάς από την “ελίτ” των ερευνητών ασφαλείας. To “καλό” στην υπόθεση είναι ότι οι αντίστοιχοι διαχειριστές του παραπάνω software ενημερώθηκαν και οι ευπάθιες αυτές έχουν ήδη διορθωθεί ή θα διορθωθούν άμεσα στα επόμενα updates.
Project Glasswing: Η αμυντική συμμαχία των κολοσσών
Μπροστά στον κίνδυνο των απρόβλεπτων συνεπειών, η Anthropic πήρε μια “ιστορική” απόφαση: Το Claude Mythos δεν θα κυκλοφορήσει ποτέ δημόσια. Η εταιρεία έκρινε ότι οι επιθετικές του ικανότητες είναι υπερβολικά επικίνδυνες για να αφεθούν ελεύθερες στο διαδίκτυο.
Αντίθετα, προχώρησε στη δημιουργία του Project Glasswing. Πρόκειται για έναν τεράστιο συνασπισμό στον οποίο συμμετέχουν μεγαθήρια όπως η Apple, η Google, η NVIDIA, η Microsoft, η Amazon και περισσότερες από 40 άλλες εταιρείες. Σκοπός της συμμαχίας είναι η αποκλειστική χρήση του μοντέλου πίσω από ένα αμυντικό τείχος, ώστε να λειτουργήσει αυστηρά και μόνο ως «ασπίδα» απέναντι σε μελλοντικές κυβερνοεπιθέσεις, εντοπίζοντας και κλείνοντας τρύπες στα συστήματά τους.
Η κλεψύδρα αδειάζει: Η απειλή του Open Source
Αν και το Mythos παραμένει κλειδωμένο, η βιομηχανία δεν μπορεί να εφησυχάζει. Οι ειδικοί προειδοποιούν ότι τα ανοιχτού κώδικα (open-source) μοντέλα AI αναμένεται να φτάσουν σε αυτό ακριβώς το επίπεδο προγραμματιστικής δεινότητας μέσα στους επόμενους έξι μήνες.
Όταν συμβεί αυτό, οποιοσδήποτε server δεν έχει ενημερωθεί με τα τελευταία updates, θα είναι απολύτως εκτεθειμένος σε αυτοματοποιημένες επιθέσεις.
Μπαίνουμε σε αχαρτογράφητα νερά. Η ταχύτητα με την οποία εξελίσσεται η τεχνητή νοημοσύνη αλλάζει εντελώς το τοπίο. Το ερώτημα πλέον για την tech κοινότητα και τις Startups παγκοσμίως δεν είναι απλώς πώς θα χτίσουμε καλύτερο AI, αλλά πώς θα οχυρώσουμε τον ψηφιακό μας κόσμο απέναντι σε αυτό.
