Τεχνολογία

Αναγνώριση προσώπου

Οι παραδοσιακοί αλγόριθμοι αναγνώρισης προσώπου βασίζονται σε τοπικά χαρακτηριστικά. Ο αλγόριθμος, αρχικά, ανιχνεύει μια σειρά σχετικά αμετάβλητων σημείων στο πρόσωπο (σημεία αναφοράς: γωνίες των οφθαλμών και του στόματος, ρουθούνια, κλπ.). Τυπικά, ο αριθμός των σημείων είναι μεταξύ 10 και 300. Στη συνέχεια, συνήθως μετά την ευθυγράμμιση του προσώπου, ο αλγόριθμος εξάγει πληροφορίες ενδιαφέροντος από αυτές τις τοπικές περιοχές, μία ανά σημείο, χρησιμοποιώντας ορισμένα οπτικά χαρακτηριστικά (π.χ. κυματίδια, HOG, SIFT, SURF... ή παραλλαγές αυτών). Τα διάφορα κομμάτια πληροφοριών συνδυάζονται σε μια ενιαία προβολή και -προαιρετικά- η διάστασή του μειώνεται για να καταστεί ευκολότερη η αποθήκευση και η γρήγορη σύγκριση με άλλα χαρακτηριστικά.

Σε αυτό το είδος αλγορίθμων, ο αριθμός των σημείων έγινε συνώνυμος με την ακρίβεια της πρόβλεψης. Αυτό όμως δεν είναι όλη η αλήθεια: αν τα σημεία είναι καλά ευθυγραμμισμένα, γενικά, περισσότερα σημεία δίνουν μεγαλύτερη ακρίβεια για μια δεδομένη μέθοδο, αλλά η ακρίβεια εξαρτάται σε εξαιρετικά μεγάλο βαθμό από το συγκεκριμένο χαρακτηριστικό και τον ταξινομητή.

Deep learning

Οι αλγορίθμοι βαθιάς μάθησης, οι οποίοι σήμερα είναι η τελευταία λέξη της τεχνολογίας στις περισσότερες εφαρμογές τεχνητής όρασης, λειτουργούν διαφορετικά. Εφαρμόζουν σειρές συνέλιξης και μη γραμμικών φίλτρων επανειλημμένα πάνω σε μια πρωτότυπη εικόνα. Κάθε στρώμα εφαρμογής επεξεργάζεται την εικόνα και εξάγει πληροφορίες υψηλότερης τάξης. Μετά από πολλά στρώματα από αυτές τις σειρές φίλτρων (τυπικά μεταξύ δεκάδων και εκατοντάδων), τα πρόσωπα κωδικοποιούνται απευθείας σε μικρά πρότυπα τα οποία είναι πολύ γρήγορα συγκρίσιμα και παρέχουν πολύ πιο ακριβή αποτελέσματα.

Το ενδιαφέρον της βαθιάς μάθησης είναι ότι ο τρόπος εξαγωγής οπτικών χαρακτηριστικών δεν ορίζεται χειροκίνητα, όπως γινόταν παλιότερα, αλλά μαθαίνεται με τον βέλτιστο τρόπο από το ίδιο το δίκτυο κατά τη διάρκεια της εκπαίδευσης. Επομένως, όλες οι διαδικασίες ευθυγράμμισης προσώπου/frontalization, ο εντοπισμός των περιοχών ενδιαφέροντος κλπ., γίνονται εσωτερικά από το δίκτυο. Δεν χρειάζεται να πείτε στον αλγόριθμο πού είναι τα σημεία ενδιαφέροντος, ούτε πώς να εξαχθούν οι πληροφορίες, καθώς μαθαίνει από μόνο του.

Η βαθιά μάθηση είναι ένας κλάδος της μηχανικής μάθησης. Είναι ιδιαίτερα κατάλληλη για ορισμένες μαθησιακές εργασίες, καθώς τείνει να μετράει την ακρίβεια και τη γενίκευση με τα δεδομένα της εκπαίδευσης (έτσι επωφελείται από τη μεγάλη ποσότητά τους) και μαθαίνει αυτόματα τις καλύτερες εσωτερικές αναπαραστάσεις δεδομένων που βελτιστοποιούν έναν μαθησιακό στόχο, σε αντίθεση με μερικές παραδοσιακές τεχνικές μάθησης που απαιτούσαν χειροκίνητη επεξεργασία τέτοιων αναπαραστάσεων.

Χρήση GPU της Nvidia

Οι GPU της NVIDIA είναι ιδανικές για την εκπαίδευση βαθέων νευρωνικών δίκτυα, επιταχύνοντας μια διαδικασία που θα μπορούσε διαφορετικά να διαρκέσει ένα έτος ή και περισσότερο, σε λίγες μόνο εβδομάδες ή ημέρες. Αυτό οφείλεται στο γεγονός ότι οι GPU εκτελούν πολλούς υπολογισμούς ταυτόχρονα - ή παράλληλα. Και άπαξ και ένα σύστημα «εκπαιδευτεί», με τις GPU, οι επιστήμονες και οι ερευνητές μπορούν να βάλουν αυτή τη μάθηση σε εφαρμογή. Αυτή η δουλειά περιλαμβάνει κεργασίες που κάποτε ήταν αδύνατες.

Οι GPU χρησιμοποιούνται για την εκπαίδευση αυτών των βαθέων νευρωνικών δικτύων χρησιμοποιώντας πολύ μεγαλύτερα σύνολα εκπαίδευσης, σε τάξη μεγέθους λιγότερο χρόνο, χρησιμοποιώντας πολύ λιγότερα data centers. Οι GPU χρησιμοποιούνται επίσης για την εκτέλεση αυτών των εκπαιδευμένων μοντέλων μηχανικής μάθησης για να κάνουν ταξινόμηση και πρόβλεψη στο cloud, υποστηρίζοντας πολύ μεγαλύτερο όγκο δεδομένων και χωρητικότητα με λιγότερη ενέργεια και υποδομή.

Οι πρώτοι που υιοθέτησαν τους επιταχυντές GPU για μηχανική μάθηση περιλαμβάνουν πολλές από τις μεγαλύτερες εταιρείες του διαδικτύου και των κοινωνικών μέσων δικτύωσης, καθώς και κορυφαία ερευνητικά ιδρύματα στην επιστήμη των δεδομένων και στη μηχανική μάθηση. Με χιλιάδες υπολογιστικούς πυρήνες και 10-100 φορές σε ταχύτητα εφαρμογής με τις CPU μόνες, οι GPUs έχουν γίνει ο επεξεργαστής της επιλογής των επιστημόνων δεδομένων για την επεξεργασία πολλών δεδομένων.

 

NVIDIA logo

Σχετικά με την NVIDIA

Το 1999 η NVIDIA πυροδότησε την ανάπτυξη της αγοράς των παιχνιδιών PC, επαναπροσδιόρησε τα σύγχρονα γραφικά υπολογιστών και έφερε την επανάσταση στον παράλληλο προγραμματισμό. Πιο πρόσφατα, η βαθιά μάθηση GPU ώθησε τη σύγχρονη τεχνητή νοημοσύνη -την επόμενη εποχή της πληροφορικής- με τη GPU να λειτουργεί ως εγκέφαλος των υπολογιστών, των ρομπότ και των αυτοκινήτων αυτο-δήγησης που μπορούν να αντιληφθούν και να κατανοήσουν τον κόσμο.