9′ διάβασμα
Πειράματα,πειράματα,πειράματα.
Όπως αναφέρθηκε στο πρώτο μέρος του άρθρου οι ερευνητές, στην προσπάθειά τους να ταξινομήσουν τις εικόνες, δημιούργησαν ένα δίκτυο πολλαπλών στρωμάτων απο κόμβους φιλτραρίσματος, ή «νευρώνες,» κάθε έναν σχεδιασμένο για την αναγνώριση μοτίβων (patterns) σε μια εικόνα και με τη δυνατότητα να συνδέει εκείνα τα σχέδια με πραγματικά αντικείμενα. Στα χαμηλότερα επίπεδα, οι νευρώνες ανιχνεύουν τα απλά σχήματα, τις άκρες, τα χρώματα, και τις γωνίες. Τα ενδιάμεσα στρώματα μπορούν να δώσουν έμφαση στις πιό σύνθετες μορφές και να προσδιορίσουν τα συστατικά των αντικειμένων, όπως τα φύλλα, τα μουστάκια στο ρύγχος ενός ζώου, ή τα παράθυρα. Στα ανώτατα επίπεδα των τεχνητών νευρωνικών δικτύων, οι νευρώνες εκπαιδεύονται για να ανιχνεύουν ολόκληρους οργανισμούς και πολύπλοκες συνθέσεις, όπως τα δέντρα και φυτά, γεωγραφικά χαρακτηριστικά, κτήρια, ακόμα και συγκεκριμένα είδη ζώων. Μέσω της διαχείρισης, σχεδόν κάθε εικόνας, μέσα από αυτά τα πολλαπλά επίπεδα (μερικές φορές μέχρι και 30 ή άλλες φορές μέχρι 10 μόνο) απο ειδικά διαμορφωμένους τεχνητούς νευρώνες, το σύστημα μπορεί να πει αποτελεσματικά για όλα όσα περιλαμβάνονται στην εικόνα. Ή τουλάχιστον αυτός είναι ο απώτερος στόχος, γιατί δεν έχουν φτάσει σ’αυτό το σημείο ακόμα. Το πλαίσιο εργασίας των νευρώνων αποτελείται από πολλά σύνθετα μαθηματικά, αλλά καθώς οι ερευνητές τροποποιούν τους τύπους για κάθε ένα από τους νευρώνες, χρειάζονται έναν τρόπο για να εξακριβώνουν αν τα πειράματα τους βελτιώνουν ή εμποδίζουν την δυνατότητα ενός νευρώνα να εντοπίσει εξειδικευμένα μοτίβα. Το θέμα που απασχολεί είναι η απομόνωση ενός -ή περισσότερων- από τους νευρώνες που έχει εκπαιδευτεί για να ανιχνεύει ειδικά χαρακτηριστικά, όπως τα άκρα των αντικειμένων, η γούνα ενός ζώου, και στη συνέχεια να μην αναφέρει μόνο ότι τα εντόπισε αλλά και να βελτιώσει αυτά τα μοτίβα. Για να πραγματοποιηθεί αυτή η βελτίωση, το δίκτυο αγνοεί εικονοστοιχεία (pixels) που θεωρεί λιγότερο σημαντικά και αυξάνει την αντίθεση, τα χρώματα, και άλλες τιμές των εικονοστοιχείων που θεωρεί σχετικές.
![]() |
Ερευνητές του MIT έχουν δημιουργήσει μερικά απίστευτα τοπία |
Αν ένας νευρώνας νομίζει ότι βλέπει ένα κουνέλι σε έναν αγρό με αγριολούλουδα, θα σκουρύνει το περίγραμμα του σώματος του κουνελιού, για παράδειγμα. Είναι το ισοδύναμο του να ζητάς απο μια μηχανή να κάνει ένα τεστ Ρόρσαχ (1) και στη συνέχεια, να απαιτήσεις να προσθέσει μελάνι για να κάνει την εικόνα να μοιάζει περισσότερο με το αντικείμενο που νομίζει ότι βλέπει. Τα πράγματα όμως πήραν πραγματικά ενδιαφέρουσα τροπή όταν οι ερευνητές ξεκίνησαν να τροφοδοτούν το τεχνητό νευρωνικό δίκτυο με εικόνες που δεν περιέχουν κάποιο προκαθορισμένο μοτίβο, όπως εικόνες γεμάτες με λευκό θόρυβο (2). Με αυτό τον τρόπο, οι ερευνητές ήταν σε θέση να επαληθεύσουν ότι ο νευρώνας που είναι επιφορτισμένος να ανιχνεύει σκυλιά λειτουργεί καλά όταν η τροφοδοτούμενη εικόνα μοιάζει, τουλάχιστον αόριστα, σαν ένα σκυλί. Για να υπάρξει συγκεκριμένη εικόνα ενός νευρώνα που αστοχεί, οι ερευνητές της Google αναφέρουν ένα παράδειγμα, την περίπτωση όπου προσπάθησαν να ενεργοποιήσουν το δίκτυο για να βρουν αλτήρες μέσα σε μια εικόνα λευκού θορύβου.
Το αποτέλεσμα που προέκυψε όχι μόνο παρουσίασε αλτήρες με δυσανάλογες άκρες αλλά περιείχαν επίσης και ανθρώπινα χέρια που αναδύονταν από τη μέση της καθεμίας. Σε αυτήν την περίπτωση, ήταν σαφές ότι αυτό το τεχνητό νευρωνικό δίκτυο λειτούργησε κάτω από την ψεύτικη εντύπωση ότι ανθρώπινα χέρια ανιχνευόντουσαν συχνά στις εικόνες που τροφοδοτούνταν κατά τη διάρκεια της κατάρτισης άρα ήταν ένα ουσιαστικό χαρακτηριστικό γνώρισμα των αλτήρων. Όπως συμβαίνει, η εκπαίδευση μιας μηχανής για να αναγνωρίζει τα πραγματικά αντικείμενα είναι δυσκολότερη απ’ότι φαίνεται.
![]() |
αλτήρες |
Δοκιμάστε το και εσείς απο το σπίτι (δεν συνιστάται για νευρικά άτομα)
Μετά την αρχική δημοσίευση, οι μηχανικοί λογισμικού και καλλιτέχνες που ήθελαν να εφαρμόσουν επανειλημμένα τις τεχνικές φιλτραρίσματος του τεχνητού νευρωνικού δικτύου στις δικές τους εικόνες, κατακλύζουν με τα αιτήματά τους την ερευνητική ομάδα της Google. Ανταποκρινόμενη η ομάδα, έχει κυκλοφορήσει τον πηγαίο κώδικα για το εκπαιδευμένο τεχνητό νευρωνικό δίκτυο. Η ομάδα παρέχει επίσης ένα κατάλογο με το λογισμικό ανοιχτού κώδικα που μπορεί κάποιος να χρησιμοποιήσει.
Θα χρειαστεί κάποιος να κατεβάσει το IPython notebook που θα βρεί στο [ http://googleresearch.blogspot.gr/2015/07/deepdream-code-example-for-visualizing.html ]. Επίσης θα χρειαστεί τα πακέτα πηγαίου κώδικα των βασιζόμενων στο Caffe (ένα εις βάθος πλαίσιο εκμάθησης) και να έχουν εγκαταστήσει το NumPy, SciPy, PIL, IPython, ή μια επιστημονική διανομή της Python, όπως η Anaconda ή η Canopy. Ακολουθώντας αυτή τη διαδρομή, θα είναι σε θέση να έχει τις δικές του εικόνες και να καθορίσει σε ποια στρώματα του δικτύου να δώσει έμφαση, πόσες επαναλήψεις να εφαρμόσει, καθώς και σε ποιο βαθμό να μεγεθύνει. Μπορεί επίσης να βασιστεί σε πολλαπλά προ-διαμορφωμένα δίκτυα για την παραγωγή των δικών του έργων τέχνης.
Οι ερευνητές παρέχουν ακόμη και μερικές συμβουλές για περισσότερο εντυπωσιακά αποτελέσματα, συμπεριλαμβανομένης της αντιστάθμισης της εικόνας από ένα τυχαίο jitter, της ομαλοποίησης του μεγέθους των βημάτων αύξησης, και της εφαρμογής της αύξησης στις πολλαπλές κλίμακες (ή οκτάβες, όπως τις αποκαλούν οι ερευνητές).
![]() |
© Κ.Λ. -2015 all rights reserved |
Απροσδόκητη φαντασμαγορία
Ακούμε πολλά σήμερα για «εξυπνάδα» και «νοημοσύνη» – όροι εξαιρετικά δημοφιλείς που αναφέρονται σε ένα ευρύ φάσμα εφαρμογών, τόσο ευρύ ώστε αυτά τα επίθετα να πλησιάζουν αρκετά κοντα στην απουσία νοήματος. Επίσης όσοι χρησιμοποιούν υπολογιστές και λογισμικό σε τακτική βάση έχουν ακούσει για την έννοια της GIGO (σκουπίδια βάζεις, σκουπίδια παίρνεις). Ένα θεώρημα που περιγράφει πώς ένας πλήρως λογικός υπολογιστής, θα δημιουργήσει μόνο παράλογα ή εσφαλμένα αποτελέσματα όταν τα δεδομένα που εισάγονται είναι λανθασμένα ή ανακριβή. Με τα τεχνητά νευρωνικά δίκτυα ικανά να παράγουν τόσο ελκυστικά οπτικά αποτελέσματα, ο νόμος αυτός δεν φαίνεται να ισχύει. Είναι δύσκολο πλέον να αμφισβητηθεί, ότι οι διάφορες μορφές των υλικών και λογισμικών μηχανών είναι ολοένα και πιο ικανές να κατασκευάσουν αυτοτελείς αφηγήσεις που φαίνονται και ακούγονται αμυδρά μεν, οικείες δε στον άνθρωπο, έστω και αν καθοδηγούνται από ανθρώπινα χέρια κατα το στάδιο της εκπαίδευσης. Αυτή τη στιγμή, εκατοντάδες κακόβουλα bots υφαίνουν υποτυπώδεις αφηγήσεις στα κοινωνικά μέσα μαζικής ενημέρωσης κάθε μέρα, δημιουργώντας πιστευτές περσόνες και στον αντίποδα bots κάνουν τέχνη που θεωρούν ότι είναι ελκυστική (κατά τα ανθρώπινη γούστα). Παρόλο που δεν μπορούμε να εξηγήσουμε γιατί πραγματικά αυτά τα δίκτυα βλέπουν ό,τι βλέπουν, μπορούμε να εκτιμούμε τα αποτελέσματα ως έργα τέχνης και σαν ένα τρόπο ικανό να πυροδοτήσει τη δική μας φαντασία. Αυτές οι μη ανεπτυγμένες ευφυΐες που κινούνται αστραπιαία πάνω απο μια ανοίκεια ψηφιακή κοιλάδα, εμφανίζουν κάτι ανθρώπινο τόσο ευανάγνωστο, που μόνο αυτό αρκεί για να ανιχνεύσουμε την πρόθεση και την αίσθηση στα έργα τους. Αν μη τι άλλο, ίσως να έχουμε βρει την απάντησή μας στο ερώτημα του κατά πόσον τα ανδροειδή ονειρεύονται ηλεκτρικά πρόβατα (3).
![]() |
© Κ.Λ. -2015 all rights reserved |
![]() |
© Κ.Λ. -2015 all rights reserved |
Nota bene
1. – Το τέστ ψυχολογικής αξιολόγησης, με τις κάρτες που έχουν διάφορα σχέδια και ο θεατής καλείται να αναγνωρίσει τί παριστάνει το κάθε σχέδιο.
2. -Στην ψηφιακή επεξεργασία εικόνας, τα εικονοστοιχεία ενός λευκού θορύβου της εικόνας είναι συνήθως τοποθετημένα σε ορθογώνιο πλέγμα, και υποτίθεται ότι είναι ανεξάρτητες τυχαίες μεταβλητές με ομοιόμορφη κατανομή πιθανότητας πάνω από κάποιο χρονικό διάστημα. Η έννοια μπορεί να οριστεί επίσης για σήματα κατανεμημένα σε πιο περίπλοκα πεδία, όπως μια σφαίρα ή σπείρα.
3. -“Ονειρεύονται τα ανδροειδή το ηλεκτρικό πρόβατο;” το βιβλίο του Φίλιπ K. Ντικ, που πάνω σ’αυτό βασίστηκε η ταινία Blade Runner (1982).
Άν δεν την έχετε δεί έχετε την υποχρέωση να αυτοτιμωρηθείτε!
Δείτε επίσης:
Τεχνητά νευρωνικά δίκτυα της Google (μέρος Ι)
επιμέλεια-κείμενο: Κάππα Λάμδα
© periopton
Απαγορεύεται από το δίκαιο της Πνευμ. Ιδιοκτησίας
η καθ΄οιονδήποτε τρόπο χρήση/αναπαραγωγή/ιδιοποίηση
του παρόντος άρθρου (ολόκληρου ή αποσπασμάτων)
των εικόνων συμπεριλαμβανομένων