7
Τεχνολογία

Η τεχνητή νοημοσύνη ζωγραφίζει… ό,τι της περιγράψεις

Η τεχνητή νοημοσύνη ζωγραφίζει… ό,τι της περιγράψεις
Νέο σύστημα τεχνητής νοημοσύνης παράγει εικόνες με βάση γραπτές οδηγίες ή περιγραφές, και μάλιστα είναι αρκετά καλό!

Τα συστήματα τεχνητής νοημοσύνης εξαπλώνουν τα δίχτυα τους σε κάθε πλευρά της ανθρώπινης δραστηριότητας, από απλά πράγματα όπως τα φίλτρα σε selfies μέχρι και πολύ εξειδικευμένες εφαρμογές, όπως τα αυτοοδηγούμενα αυτοκίνητα. Μέσα σε όλα αυτά, έχουμε και, βέβαια, ιατρικές εφαρμογές, αρκετές από τις οποίες έχουμε καλύψει σε παλαιότερα άρθρα, αλλά και σε πιο… αρτίστικ πράγματα, όπως η τεχνητή επαύξηση ανάλυσης σε εικόνες.

Ουσιαστικά, στην τελευταα αυτή περίπτωση, η τεχνητή νοημοσύνη καλείται να καταλάβει τι δείχνει η κάθε εικόνα και να αυξήσει την ανάλυση, προσθέτοντας λεπτομέρειες οι οποίες δεν υπάρχουν. Τελευταία, μια άλλη εφαρμογή παίρνει ως είσοδο, όχι προϋπάρχουσα εικόνα, αλλά γραπτό κείμενο με οδηγίες και, με βάση αυτές, παράγει εικόνες. Μάλιστα, λόγω ακριβώς αυτής της ικανότητας των συστημάτων τεχνητής νοημοσύνης να προσθέτουν δεδομένα εκεί που δεν υπάρχουν, έχουν χαρακτηριστεί από πολλούς ως fake news generators, λόγω της ικανότητάς τους να δημιουργούν εικόνες από το μηδέν. Οι επιστήμονες πίσω από αυτό το σύστημα ήθελαν να δουν, όπως και στα περισσότερα ερευνητικά προγράμματα, πόσο μακριά μπορούν να φτάσουν με το σύστημά τους.

Το νέο σύστημα ονομάζεται DALL-E – λογοπαίγνιο με το όνομα του γνωστού σουρεαλιστή ζωγράφου Salvador Dali και του WALL-E, του ρομπότ από τη γνωστή ταινία της Pixar – και το οποίο μπορεί να δεχθεί ως είσοδο τόσο περιγραφικό κείμενο όσο και εικόνες. Το σύστημα δεν απαιτεί ακριβείς οδηγίες και αριθμητικές τιμές για να δώσει αποτέλεσμα, μιας και η τεχνητή νοημοσύνη συμπληρώνει όσα δεδομένα λείπουν.

Για του λόγου το αληθές, πιο κάτω μπορείς να δεις μια σειρά από εικόνες που παρήγαγε το σύστημα, όταν του ζητήθηκε (γραπτώς) να ζωγραφίσει μια εικόνα ενός μωρού πιγκουίνου το οποίο φορά Χριστουγεννιάτικο πουλόβερ και παίζει κιθάρα. Απλά αυτό!

Το ενδιαφέρον είναι πως το DALL-E έχει αντίληψη των πραγμάτων και μπορεί να καταλάβει τη διαφορά ακόμη και σε βάθος χρόνου. Δηλαδή, αν του ζητηθεί να απεικονίσει ένα παλιό τηλέφωνο, ίσως το αποτέλεσμα έχει περίεργο σχήμα ή λάθος κουμπιά, αλλά σε γενικές γραμμές θα είναι σωστό από άποψης παλαιότητας.

Εκτός των απλών περιπτώσεων, το DALL-E φαίνεται να έχει και χιούμορ. Δες πιο κάτω τι έβγαλε όταν του ζητήθηκε να ζωγραφίσει ένα emoji ενός… ερωτοχτυπημένου αβοκάντο!

Είναι δυνατή, επίσης, η τροποποίηση κάποιας υπάρχουσας εικόνας μέσω γραπτών οδηγιών. Μπορείς, για παράδειγμα, να δώσεις την φωτογραφία της γάτας σου και να του ζητήσεις να σου δώσει μια ζωγραφιά της γάτας σου, να της προσθέσει γυαλιά ηλίου ή να της αλλάξει χρώμα.

Δε θα είμαστε σωστοί αν δε σου δίναμε το link για τη σελίδα στην οποία μπορείς κι εσύ να πειραματιστείς με το DALL-E – αν και σε περιορισμένο βαθμό. Καλή διασκέδαση!

https://openai.com/blog/dall-e/