H Nvidia παρουσίασε ένα επαναστατικό μοντέλο AI με το όνομα Fugatto, συντομογραφία του Foundational Generative Audio Transformer Opus 1, για τη δημιουργία μουσικής και ήχου που μπορεί να τροποποιήσει φωνές και να δημιουργήσει νέους ήχους. H τεχνολογία απευθύνεται σε παραγωγούς μουσικής, ταινιών και βιντεοπαιχνιδιών.
Το Fugatto έχει κατασκευαστεί με μια ισχυρή αρχιτεκτονική που χρησιμοποιεί 2,5 δισεκατομμύρια παραμέτρους και έχει εκπαιδευτεί σε ένα ποικιλόμορφο σύνολο δεδομένων που περιλαμβάνει εκατομμύρια ηχητικά δείγματα. Αυτή η εκτενής εκπαίδευση του επιτρέπει να εκτελεί διάφορες ηχητικές εργασίες με υψηλή ακρίβεια και ευελιξία. Το μοντέλο χρησιμοποιεί μια τεχνική που ονομάζεται ComposableART, επιτρέποντας στους χρήστες να συνδυάζουν πολλές οδηγίες κατά τη διάρκεια της δημιουργίας ήχου, ενισχύοντας τον δημιουργικό έλεγχο πάνω στο αποτέλεσμα.
Η Nvidia, ο μεγαλύτερος προμηθευτής τσιπ και λογισμικού στον κόσμο που χρησιμοποιείται για τη δημιουργία συστημάτων AI, δήλωσε ότι δεν έχει άμεσα σχέδια να κυκλοφορήσει δημόσια την τεχνολογία.
Συμμετέχει σε άλλες τεχνολογίες από startups όπως η Runway και μεγαλύτερους παίκτες όπως η Meta Platforms που μπορεί να δημιουργήσει ήχο ή βίντεο από μια προτροπή κειμένου.
Η έκδοση της Nvidia παράγει ηχητικά εφέ και μουσική από μια περιγραφή κειμένου, συμπεριλαμβανομένων καινοτόμων ήχων, όπως η τρομπέτα να γαβγίζει σαν σκύλος. Αυτό που το κάνει διαφορετικό από άλλες τεχνολογίες τεχνητής νοημοσύνης είναι η ικανότητά του να δέχεται και να τροποποιεί τον υπάρχοντα ήχο, για παράδειγμα παίρνοντας μια γραμμή που παίζεται σε ένα πιάνο και μετατρέποντάς την σε μια γραμμή που τραγουδιέται από ανθρώπινη φωνή.
Ενώ εταιρείες όπως η OpenAI διαπραγματεύονται με τα στούντιο του Χόλιγουντ για το εάν και πώς θα μπορούσε να χρησιμοποιηθεί η τεχνητή νοημοσύνη στη βιομηχανία της ψυχαγωγίας, η σχέση μεταξύ τεχνολογίας και Χόλιγουντ έχει γίνει τεταμένη, ιδιαίτερα αφού η σταρ του Χόλιγουντ Σκάρλετ Γιόχανσον κατηγόρησε την OpenAI ότι μιμείται τη φωνή της.
Το νέο μοντέλο της Nvidia εκπαιδεύτηκε σε δεδομένα ανοιχτού κώδικα και η εταιρεία είπε ότι εξακολουθεί να συζητά εάν και πώς θα το κυκλοφορήσει δημόσια.
Οι δημιουργοί μοντέλων τεχνητής νοημοσύνης δεν έχουν ακόμη καθορίσει πώς να αποτρέψουν την κατάχρηση της τεχνολογίας, όπως η δημιουργία παραπληροφόρησης από έναν χρήστη ή η παραβίαση των πνευματικών δικαιωμάτων δημιουργώντας χαρακτήρες που προστατεύονται από πνευματικά δικαιώματα. OpenAI και Meta ομοίως δεν έχουν πει πότε σκοπεύουν να κυκλοφορήσουν στο κοινό τα μοντέλα τους που παράγουν ήχο ή βίντεο.
