Skip to main content

«Έξυπνο», αλλά όχι «ψηφιακό» γυαλί για αναγνώριση προσώπου και εικόνας

Μια «high tech» αναβάθμιση η οποία όμως φαντάζει μάλλον…«low-tech» αναμένεται να λάβει στο όχι και τόσο μακρινό μέλλον η εξελιγμένη τεχνολογία πίσω από την αναγνώριση προσώπου και εικόνας που συναντά κανείς σε πολλά σύγχρονα smartphones.

Το εν λόγω «παράθυρο στο μέλλον» δεν είναι άλλο από το «έξυπνο» γυαλί που ανέπτυξαν μηχανικοί στο University of Wisconsin- Madison, και μπορεί να αναγνωρίζει εικόνες χωρίς να χρειάζεται αισθητήρες, κυκλώματα ή πηγές ενέργειας. «Χρησιμοποιούμε οπτικά μέσα για να συμπυκνώσουμε τη συνηθισμένη ακολουθία καμερών, αισθητήρων και deep neural δικτύων σε ένα και μόνο κομμάτι λεπτού γυαλιού» λέει ο Ζονγκφού Γιου, καθηγητής στο πανεπιστήμιο (τμήμα ηλεκτρολόγων μηχανικών και μηχανικών υπολογιστών).

Ο Γιου και οι συνάδελφοί του δημοσίευσαν λεπτομέρειες για την έρευνά τους στο Photonics Research. H ενσωμάτωση τεχνητής νοημοσύνης μέσα σε κατά τα άλλα αδρανή αντικείμενα ένα μια ιδέα που φαντάζει εκ πρώτης όψεως από την επιστημονική φαντασία, ωστόσο μπορεί να ανοίξει νέους ορίζοντες στα ηλεκτρονικά χαμηλής ενέργειας.

Η τεχνητή νοημοσύνη καταναλώνει σημαντικούς υπολογιστικούς πόρους (και ενέργεια) κάθε φορά που ο χρήστης κοιτά το τηλέφωνό του για να το ξεκλειδώσει μέσω του face ID. Στο μέλλον, ωστόσο, ένα κομμάτι γυαλί πιθανώς να μπορεί να το κάνει χωρίς να καταναλώνει ενέργεια.

«Πρόκειται για κάτι εντελώς διαφορετικό από την τυπική διαδρομή στο machine vision» σημειώνει ο Γιου, ο οποίος οραματίζεται κομμάτια γυαλιού σαν διάφανα τετράγωνα, με μικρές, στρατηγικά τοποθετημένες φυσαλίδες και ατέλειες ενσωματωμένες σε αυτά ώστε να κυρτώνουν το φως με τρόπους που θα επιτρέπουν τη διαφοροποίηση μεταξύ διαφορετικών εικόνων.

Ως «proof of concept», οι μηχανικοί ανέπτυξαν μια μέθοδο για τη δημιουργία μικρών κομματιών γυαλιού που αναγνώριζαν χειρόγραφα νούμερα: Το φως που εκπέμπεται από την εικόνα ενός αριθμού μπαίνει από τη μια πλευρά του γυαλιού και μετά επικεντρώνεται σε ένα από εννιά συγκεκριμένα σημεία στην άλλη πλευρά- το καθένα εκ των οποίων αντιστοιχεί σε συγκεκριμένα ψηφία. Το γυαλί ήταν σε θέση να αναγνωρίζει σε πραγματικό χρόνο πότε ένα χειρόγραφο 3 είχε τροποποιηθεί έτσι ώστε να γίνεται 8.

«Το ότι ήμασταν σε θέση να έχουμε αυτή την πολύπλοκη συμπεριφορά με μια τέτοια απλή δομή ήταν πραγματικά σημαντικό» είπε ο Ερφάν Χοράμ, τελειόφοιτος στο εργαστήριο του Γιου.

Ο σχεδιασμός του γυαλιού έτσι ώστε να μπορεί να αναγνωρίζει αριθμούς είναι παρόμοιος με τη διαδικασία εκπαίδευσης machine learning, μόνο που οι μηχανικοί «εκπαίδευσαν» ένα αναλογικό υλικό αντί για ψηφιακούς κώδικες. Ειδικότερα, αυτό που έκαναν ήταν να βάλουν φυσαλίδες αέρα διαφορετικών μεγεθών και σχημάτων, καθώς και μικρά κομμάτια φωτοαπορροφητικών υλικών σε συγκεκριμένα σημεία μέσα στο γυαλί.

«Έχουμε συνηθίσει το ψηφιακό computing, μα αυτό διεύρυνε τους ορίζοντές μας» είπε ο Γιου. «Οι δυναμικές κυμάτων στη διάδοση φωτός παρέχουν έναν νέο τρόπο για αναλογικό, τεχνητό neural computing».

Ένα από τα βασικά πλεονεκτήματα αυτής της φιλοσοφίας είναι πως οι υπολογισμοί είναι εντελώς παθητικοί και εσωτερικοί- «έμφυτοι» στο υλικό, κάτι που σημαίνει πως ένα κομμάτι γυαλιού αναγνώρισης προσώπου μπορεί να χρησιμοποιηθεί εκατοντάδες χιλιάδες φορές. «Θα μπορούσαμε να χρησιμοποιήσουμε το γυαλί ως βιομετρική κλειδαριά, φτιαγμένη έτσι ώστε να αναγνωρίζει μόνο το πρόσωπο ενός ανθρώπου» είπε ο Γιου. «Εφόσον φτιαχτεί, θα μπορεί να κρατήσει για πάντα χωρίς να χρειάζεται ενέργεια ή Ίντερνετ- κάτι που σημαίνει ότι θα μπορούσε να συνεχίσει να κρατά κάτι ασφαλές ακόμα και μετά από χιλιάδες χρόνια» πρόσθεσε. Επίσης, λειτουργεί κυριολεκτικά στην ταχύτητα του φωτός, καθώς αναγνωρίζει διαφορετικές εικόνες μέσω των κυμάτων του φωτός. Επίσης, αν και η διαδικασία «εκπαίδευσης» μπορεί να είναι χρονοβόρα και να απαιτητική από υπολογιστικής άποψης, το ίδιο το γυαλί παράγεται εύκολα και φθηνά.