Το «αγκάθι» του AI Inference: Πώς θα γίνει βιώσιμη η Τεχνητή Νοημοσύνη για τις επιχειρήσεις;

4'

Η εποχή του πειραματισμού με την Τεχνητή Νοημοσύνη (AI) πλησιάζει στο τέλος της. Καθώς οι επιχειρήσεις παγκοσμίως μεταβαίνουν από τα πιλοτικά προγράμματα (PoCs) στην πλήρη ενσωμάτωση του AI στις λειτουργίες τους, έρχονται αντιμέτωπες με μια σκληρή πραγματικότητα: το κόστος του Inference, όταν δηλαδή ένα εκπαιδευμένο μοντέλο βγαίνει στην παραγωγή/online), είναι απαγορευτικό.

Στο τελευταίο επεισόδιο του The Deep View: Conversations, ο Rob May, ιδρυτής και CEO της Neurometric AI, αναλύει αυτό ακριβώς το πρόβλημα. Πώς μπορούμε να κάνουμε το AI αρκετά προσιτό ώστε να αποφέρει πραγματικό ROI (Απόδοση Επένδυσης);

Το πρόβλημα του κόστους στο AI

Σήμερα, τα Μεγάλα Γλωσσικά Μοντέλα (LLMs) είναι εντυπωσιακά ισχυρά, αλλά και εξαιρετικά «ακριβά» στην εκτέλεσή τους. Για μια επιχείρηση, το να τρέχει κάθε ερώτημα ή διεργασία μέσω ενός γιγαντιαίου μοντέλου (όπως το GPT-4) είναι σαν να χρησιμοποιεί ένα υπερωκεάνιο για να διασχίσει μια λίμνη. Είναι αναποτελεσματικό και καίει πόρους.

Για να δουν οι επιχειρήσεις κέρδος, το κόστος του inference πρέπει να πέσει δραματικά, χωρίς όμως να θυσιαστεί η ακρίβεια των αποτελεσμάτων.

Η λύση: «Thinking Algorithms» και Μικρά Μοντέλα

Η προσέγγιση της Neurometric, όπως την εξηγεί ο Rob May, βασίζεται σε μια αλλαγή παραδείγματος. Αντί να βασιζόμαστε αποκλειστικά σε γενικευμένα, τεράστια μοντέλα, η λύση βρίσκεται στον συνδυασμό:

Small Specialized Models (SLMs): Μικρότερα, εξειδικευμένα μοντέλα που εκπαιδεύονται για συγκεκριμένες εργασίες.
Thinking Algorithms: Αλγόριθμοι που αποφασίζουν ποιο μοντέλο είναι κατάλληλο για κάθε εργασία.
Workload-specific optimizations: Βελτιστοποιήσεις ανάλογα με τον φόρτο εργασίας.

Αυτή η στρατηγική επιτρέπει στις εταιρείες να μειώσουν το κόστος υποδομών (GPU hours/tokens) διατηρώντας ή και βελτιώνοντας την ακρίβεια, καθώς τα μικρότερα μοντέλα είναι συχνά καλύτερα σε niche εργασίες όταν έχουν εκπαιδευτεί σωστά.

Από Επενδυτής ξανά Founder: Μαθήματα για Startuppers

Ο Rob May δεν είναι άγνωστος στο οικοσύστημα. Έχοντας στο ενεργητικό του επιτυχημένα exits (όπως η Backupify) και μια πορεία ως επενδυτής (Angel/VC), η επιστροφή του στον ρόλο του CEO της Neurometric δείχνει πολλά για την τρέχουσα ευκαιρία στην αγορά.

Σύμφωνα με τον ίδιο, η τρέχουσα έκρηξη του AI είναι τόσο θεμελιώδης που απαιτεί επιχειρηματίες που κατανοούν βαθιά την υποδομή. Οι συμβουλές του προς τους founders είναι σαφείς:

1. Υποδομή & Οικονομικά: Μην αγνοείτε τα unit economics. Το να χτίσετε ένα προϊόν AI είναι εύκολο σήμερα, το να το κάνετε κερδοφόρο σε κλίμακα (scale) είναι η πραγματική πρόκληση.
2. Marketing & PR: Ένα από τα πιο ενδιαφέροντα σημεία της συζήτησης αφορά τη σχέση με τα media. Ο May μοιράζεται πώς μια πρώιμη συζήτηση στην καριέρα του άλλαξε τον τρόπο που προσέγγιζε τους δημοσιογράφους, οδηγώντας σε κάλυψη που άλλαξε την πορεία της εταιρείας του. Το μάθημα; Οι δημοσιογράφοι ψάχνουν ιστορίες, όχι απλά δελτία τύπου. Δώστε τους ένα αφήγημα που εντάσσεται στη μεγάλη εικόνα της αγοράς.

Το μέλλον του AI στην επιχείρηση

Καθώς το AI ωριμάζει, η συζήτηση μετατοπίζεται από το «τι μπορεί να κάνει το AI» στο «πόσο κοστίζει να το κάνει». Η προσέγγιση της Neurometric και του Rob May δείχνει τον δρόμο: εξειδίκευση, βελτιστοποίηση και έξυπνη διαχείριση πόρων.

Για τους Έλληνες startuppers που δραστηριοποιούνται στο AI, το μήνυμα είναι ξεκάθαρο: Μην εστιάζετε μόνο στην καινοτομία του αλγορίθμου, αλλά και στην οικονομική βιωσιμότητα της εφαρμογής του.

Μοιραστείτε αυτό το άρθρο
Τα τελευταία 20+ χρόνια γράφει για Mobile Tech, PC Tech και Business Tech σε περιοδικά και online. Αν θα έπρεπε να ξεχωρίσει δυο έντυπα που έχει δουλέψει αυτά θα ήταν το Pixel και το RAM. Αν θα έπρεπε να διαλέξει υπολογιστή αυτοί θα ήταν η Amiga και το Raspberry Pi. Αν θα έπρεπε να διαλέξει την τεχνολογία που θα επιφέρει τo μεγαλύτερο "αναστάτωμα" αυτή θα είναι το Blockchain και φυσικά η GenAI.