Technologie

Gesichtserkennung

Traditionelle Gesichtserkennungsalgorithmen basieren auf lokalen Merkmalen. Der Algorithmus erkannte zuerst eine Reihe von relativ invarianten Punkten im Gesicht (Bezugspunkte: Ecken der Augen und Mund, Nasenlöcher, etc.). (Z. B. Wavelets, HOG, SIFT, SURF, etc.) Dies ist ein Beispiel für einen Algorithmus, der auf den folgenden Algorithmen basiert: oder Variationen von ihnen). Die verschiedenen Informationen wurden zu einem einzigen Merkmal verkettet, und es wurde in der Größe reduziert, um es einfacher zu speichern und mit anderen Funktionen zu vergleichen.

In dieser Art von Algorithmen wurde die Anzahl der Punkte gleichbedeutend mit der Genauigkeit der Vorhersage. Das ist nicht ganz richtig: Wenn die Punkte gut ausgerichtet sind, geben mehr Punkte im Allgemeinen mehr Genauigkeit für eine gegebene Methode, aber die Genauigkeit ist extrem abhängig von der Besonderheit und dem Klassifikator.

Deep learning

Deep Learning Algorithmen, die heute auf dem neuesten Stand der meisten Computer Vision Anwendungen sind, arbeiten anders. Sie wenden Banken von Faltungs- und Nicht-Linearfiltern über ein Originalbild an. Jede Schicht der Anwendung verarbeitet das Bild und extrahiert Informationen höherer Ordnung. Nach vielen Schichten dieser Filterbänke (typischerweise zwischen zehn und hundert) werden Gesichter direkt in kleine Vorlagen verschlüsselt, die sehr schnell zu vergleichen sind und viel genauere Ergebnisse liefern.

Das Interessante an tiefem Lernen ist, dass der Weg, um visuelle Features zu extrahieren, nicht manuell definiert wird, wie zuvor, sondern es wird vom Training selbst während des Trainings optimal gelernt. Also alle Prozesse der Gesichtsausrichtung / Frontalisierung, Lokalisierung interessanter Regionen usw. werden intern durch das Netzwerk durchgeführt. Sie müssen nicht den Algorithmus erzählen, wo die interessanten Punkte sind, noch wie man die Informationen extrahiert, wie sie selbst lernt.

Tiefes Lernen ist ein Zweig des maschinellen Lernens. Es eignet sich besonders für bestimmte Lernaufgaben, da es dazu neigt, die Genauigkeit und Verallgemeinerung mit den Trainingsdaten zu skalieren (also von großen Mengen davon zu profitieren), und er lernt automatisch die besten internen Darstellungen von Daten, die das Lernziel optimieren, im Gegensatz zu einige traditionelle Lerntechniken, die eine manuelle Handarbeit solcher Darstellungen erforderten.

Verwendung von Nvidia GPUS

NVIDIA GPUs sind ideal für die Ausbildung von tiefen neuronalen Netzwerken und beschleunigen einen Prozess, der sonst ein Jahr oder mehr zu nur Wochen oder Tagen dauern könnte. Das ist, weil GPUs viele Berechnungen gleichzeitig oder parallel durchführen. Und sobald ein System "trainiert" ist, mit GPUs können Wissenschaftler und Forscher das Lernen zur Arbeit setzen. Diese Arbeit beinhaltet Aufgaben, die einmal für unmöglich gehalten wurden.

GPUs werden verwendet, um diese tiefen neuronalen Netze mit weit größeren Trainings-Sets, in einer Größenordnung weniger Zeit, mit weit weniger Rechenzentrum Infrastruktur zu trainieren. GPUs werden auch verwendet, um diese trainierten maschinellen Lernmodelle der Klassifikation und Vorhersage in der Cloud zu betreiben, die weit mehr Datenvolumen und Durchsatz mit weniger Energie und Infrastruktur unterstützen.

Frühe Anwender von GPU-Beschleunigern für das maschinelle Lernen gehören viele der größten Web- und Social Media-Unternehmen, zusammen mit Top-Tier-Forschungseinrichtungen in der Datenwissenschaft und maschinelles Lernen. Mit Tausenden von Computational Farben und 10-100x Anwendungsdurchsatz im Vergleich zu CPUs allein, sind GPUs der Prozessor der Wahl für die Verarbeitung großer Daten für Datenwissenschaftler geworden.

NVIDIA logo

Über NVIDIA

Im Jahr 1999 hat NVIDIA das Wachstum des PC-Gaming-Marktes ausgelöst, neue Computergrafiken neu definiert und das Parallel-Computing revolutioniert. Vor kurzem hat GPU tiefes Lernen die moderne AI - die nächste Ära des Rechnens - entzündet - mit der GPU, die als Gehirn von Computern, Robotern und selbstfahrenden Autos fungiert, die die Welt wahrnehmen und verstehen können.