Skip to main content

EVA: Ένα ρομπότ που «έμαθε» να χαμογελά

Οι εκφράσεις του προσώπου μας παίζουν πολύ σημαντικό ρόλο ως προς την οικοδόμηση εμπιστοσύνης, ωστόσο τα πιο πολλοά ρομπότ εξακολουθούν να χαρακτηρίζονται από κενές, στατικές εκφράσεις. Καθώς η χρήση των ρομπότ αυξάνεται όλο και περισσότερο, περνώντας σε τομείς όπου ρομπότ και άνθρωποι πρέπει να συνεργάζονται- όπως γηροκομεία, αποθήκες, εργοστάσια κλπ- η ανάγκη για πιο ρεαλιστικά ρομπότ, που ανταποκρίνονται/ αντιδρούν καλύτερα, γίνεται μεγαλύτερη.

Ερευνητές στο Creative Machines Lab στο Columbia Engineering εργάζονταν εδώ και πέντε χρόνια για τη δημιουργία της EVA- ενός νέου, αυτόνομου ρομπότ με μαλακό, εκφραστικό πρόσωπο το οποίο ανταποκρίνεται στις εκφράσεις ανθρώπων που είναι κοντά του, προβαίνοντας σε αντίστοιχες.

«Η ιδέα για την EVA διαμορφώθηκε πριν μερικά χρόνια, όταν οι φοιτητές μου και εγώ αρχίσαμε να αντιλαμβανόμαστε πως τα ρομπότ στο εργαστήριό μας μας κοιτούσαν μέσα από πλαστικά, κενά μάτια» είπε ο καθηγητής Χοντ Λίπσον, διευθυντής του Creative Machines Lab.

O Λίπσον παρατήρηση παρόμοιες τάσεις και σε καταστήματα όπου πωλούνταν λαχανικά, όπου είδε ρομπότ που φορούσαν ταμπελάκια με ονόματα, ακόμα και, σε μια περίπτωση, ένα σκουφάκι. «Οι άνθρωποι φαίνονταν να δίνουν ανθρώπινα χαρακτηριστικά στους ανθρώπους συναδέλφους τους, δίνοντάς τους μάτια, μια ταυτότητα ή ακόμα και ένα όνομα» είπε χαρακτηριστικά. «Αυτό μας έκανε να αναρωτηθούμε, εάν τα μάτια και τα ρούχα αποδίδουν, γιατί να μη φτιάξουμε ένα ρομπότ που έχει ένα υπερ-εκφραστικό ανθρώπινο πρόσωπο, που ανταποκρίνεται;».

Η πρώτη φάση του εγχειρήματος άρχισε στο εργαστήριο του Λίπσον πριν χρόνια, όταν ο προπτυχιακός Ζανβάρ Φαράτζ ηγήθηκε μιας ομάδας φοιτητών που έφτιαξαν το μηχανικό τμήμα του ρομπότ. Οι φοιτητές κατασκεύασαν την EVA ως μια προτομή που θύμιζε τους σιωπηλούς, μα εκφραστικούς performers του Blue Man Group. Η EVA μπορεί να εκφράσει τα έξι βασικά συναισθήματα του θυμού, της αηδίας, του φόβου, της χαράς, της λύπης και της έκπληξης, καθώς και μια σειρά από άλλα συναισθήματα μέσω τεχνητών «μυών» (καλωδίων και μοτέρ) που ασκούσαν έλξη σε διαφορετικά σημεία του προσώπου της EVA, μιμούμενα τις κινήσεις των άνω των 42 μικρών μυών που ήταν προσκολλημμένοι σε διάφορα σημεία του δέρματος και οστά ανθρώπινων προσώπων.

Στη συνέχεια η ομάδα χρησιμοποίησε 3D printing για την εκτύπωση τμημάτων με πολύπλοκα σχήματα, που ενσωματώνονταν ομαλά και απρόσκοπτα στο κρανίο της EVA. Εν τέλει, μετά από εβδομάδες δοκιμών, το ρομπότ ήταν σε θέση να ανταποκρίνεται σε συναισθηματικές αντιδράσεις των ερευνητών. «Κοιτούσα τη δουλειά μου μια μέρα, όταν η EVA ξαφνικά μου έδωσε ένα μεγάλο, φιλικό χαμόγελο» είπε ο Λίπσον. «Το ήξερα πως ήταν καθαρά μηχανικό, μα έπιασα τον εαυτό μου να χαμογελά και αυτός, αντανακλαστικά».

Η δεύτερη φάση ήταν ο προγραμματισμός της τεχνητής νοημοσύνης που καθοδηγούσε τις κινήσεις του προσώπου του ρομπότ. Η EVA χρησιμοποιεί τεχνητή νοημοσύνη deep learning για να «μαθαίνει» και να προσομοιώνει τις εκφράσεις των κοντινών ανθρώπινων προσώπων. Σε αυτό το πλαίσιο, μαθαίνει να το κάνει μέσω «trial and error», παρακολουθώντας βίντεο της ίδιας.

Οι πιο δύσκολες δραστηριότητες ως προς την αυτοματοποίηση περιλαμβάνουν μη επαναλαμβανόμενες φυσικές κινήσεις που λαμβάνουν χώρα σε πολύπλοκα κοινωνικά περιβάλλοντα. Για αυτό τον σκοπό δημιουργήθηκαν νευρωνικά δίκτυα deep learning. Ο εγκέφαλος του ρομπότ είχε δύο προκλήσεις: Να μάθει να χειρίζεται το δικό του πολύπλοκο σύστημα μηχανικών μυών και να γνωρίζει ποιες εκφράσεις να παίρνει όταν «διαβάζει» τα πρόσωπα των ανθρώπων.

Για να «εκπαιδεύσουν» σχετικά την EVA, οι ερευνητές κατέγραψαν ώρες βίντεο της EVA, όπου έπαιρνε διάφορες τυχαίες εκφράσεις. Το ρομπότ, ως εκ τούτου, έμαθε να συνδυάζει τις κινήσεις των μυών με τα βίντεο του προσώπου του. Πλέον είχε τη δυνατότητα να ξέρει πώς δουλεύει το πρόσωπό του, και στη συνέχεια χρησιμοποίησε ένα δεύτερο δίκτυο για να κάνε αντιστοίχιση της δικής του εικόνας με αυτήν ενός ανθρώπινου προσώπου που καταγραφόταν από τη βιντεοκάμερά του. Εν τέλει ήταν σε θέση να «διαβάζει» μορφασμούς από την κάμερα και να τους μιμείται.

Οι ερευνητές σημειώνουν πως ο δρόμος είναι ακόμα μακρύς μέχρι να μπορεί να πλησιάσει έστω τους πολύπλοκους τρόπους με τους οποίους οι άνθρωποι επικοινωνούν με τις εκφράσεις τους- ωστόσο τέτοιες τεχνολογίες θα μπορούσαν να έχουν επωφελείς εφαρμογές, πχ σε νοσοκομεία, σχολεία, χώρους εργασίας και σπίτια.