Η Apple φέρνει το MGIE, το AI μοντέλο επεξεργασίας εικόνων με γραπτή περιγραφή

Newsroom
1'

Οι ερευνητές της Apple κυκλοφόρησαν ένα νέο μοντέλο AI, το MGIE, που επιτρέπει στους χρήστες να περιγράφουν σε απλή γλώσσα τι θέλουν να αλλάξουν σε μια φωτογραφία χωρίς ποτέ να αγγίξουν το λογισμικό επεξεργασίας φωτογραφιών.

Το μοντέλο MGIE, για το οποίο η Apple συνεργάστηκε με το Πανεπιστήμιο της Καλιφόρνια στη Σάντα Μπάρμπαρα, μπορεί να περικόψει, να αλλάξει το μέγεθος, να αναστρέψει και να προσθέσει φίλτρα σε εικόνες μέσω μηνυμάτων κειμένου.

Το MGIE, το οποίο σημαίνει MLLM-Guided Image Editing, μπορεί να εφαρμοστεί σε απλές και πιο σύνθετες εργασίες επεξεργασίας εικόνας, όπως η τροποποίηση συγκεκριμένων αντικειμένων σε μια φωτογραφία για να τους αλλάξει σχήμα ή να βγουν πιο φωτεινά. Το μοντέλο συνδυάζει δύο διαφορετικές χρήσεις πολυτροπικών γλωσσικών μοντέλων. Πρώτον, μαθαίνει πώς να ερμηνεύει τις προτροπές των χρηστών. Στη συνέχεια, “φαντάζεται” πώς θα μοιάζει η επεξεργασία. Για πάρα, ζητώντας έναν πιο μπλε ουρανό σε μια φωτογραφία γίνεται αύξηση της φωτεινότητας στο τμήμα του ουρανού μιας εικόνας.

Η Apple έκανε το MGIE διαθέσιμο μέσω του GitHub για λήψη, αλλά κυκλοφόρησε επίσης και ένα web demo στο Hugging Face Spaces, όπως αναφέρει το VentureBeat. Η εταιρεία δεν αποκάλυψε ποια είναι τα σχέδιά της για το μοντέλο πέρα από την έρευνα.

Μοιραστείτε αυτό το άρθρο
ΑπόNewsroom
Ακολουθήστε
Tο πρώτο ειδησεογραφικό πόρταλ στην Ελλάδα για τις startups, που αναδεικνύει τα νέα και τη δυναμική του ελληνικού οικοσυστήματος. Εκτός από την καταγραφή του ελληνικού οικοσυστήματος καλύπτει τα τεκταινόμενα και τις διεθνείς τάσεις σε ό,τι αφορά στις startups, τις επενδύσεις, τις νομικές και φορολογικές ρυθμίσεις που αφορούν στα επιχειρηματικά οικοσυστήματα της Ευρώπης και του κόσμου.