Die Technologie heißt Computer Vision. Sie ermöglicht Computern, Objekte in Bildern zu erkennen und in Kategorien einzuteilen – beispielsweise in die Kategorien "Hund" oder "Katze" – aber auch die Kategorien "Auge", "Mund", "Nase" und so weiter.

Gesichtsmerkmale werden in Zahlenreihen übersetzt

Um Objekte auf einem Bild zu finden und ihnen die richtige Kategorie zuzuordnen, muss ein Algorithmus sehr viele Bilder von Gesichtern gesehen haben - mit den unterschiedlichsten Augen, Mündern, Nasen und Augenbrauen. "Gesehen" bedeutet in dem Fall, dass der Algorithmus die Farbwerte (aka Zahlen) der Bildpunkte (aka Pixel) verarbeiten muss. Für einen Computer ist auch das bunteste oder originellste Selfie am Ende nur eine lange Zahlenreihe.

Computer lernen ähnlich wie kleine Kinder

Das Programm muss die Gesichter aber nicht nur "sehen". Es muss auch "wissen", wo genau auf den Bildern wichtige Punkte wie die Augen oder die Mitte und die Endpunkte der Oberlippe liegen. So lernt der Computer - ähnlich wie kleine Kinder - anhand der unterschiedlichsten Beispiele, was ein Auge, was eine Nase oder eine Lippe ist. Ähnlich wie ein Kind kann auch der Computer nach einer erfolgreichen Lernphase bekanntes Wissen auf bisher ungesehene Gesichter übertragen. Irgendwann wissen Kind und Algorithmus, wo bei jedem gezeigten Gesicht die Augen liegen.