Betere gezichtsherkenningssoftware

Voor wetenschappers en ingenieurs die zich bezighouden met gezichtsherkenningstechnologie, waren de onlangs vrijgegeven resultaten van de Face Recognition Grand Challenge - meer volledig, de Face Recognition Vendor Test (FRVT) 2006 en de Iris Challenge Evaluation (ICE) 2006 - een stille triomf. Gesponsord door de Nationaal Instituut voor Standaarden en Technologie (NIST), toonde de match-up van gezichtsherkenningsalgoritmen aan dat machinale herkenning van menselijke individuen vertienvoudigd is sinds 2002 en honderdvoudig sinds 1995. Inderdaad, de beste gezichtsherkenningsalgoritmen presteren nu nauwkeuriger dan de meeste mensen aankunnen. Over het algemeen gaat de gezichtsherkenningstechnologie snel vooruit.





Gezichtsfeiten: De bovenste 3D-afbeelding toont alleen de informatie die verband houdt met de vorm van het gezicht van een man. De onderste afbeelding toont zowel de textuur als de vorm.

Jonathon Phillips, programmamanager voor de NIST-tests en hoofdauteur van het rapport van het bureau , zegt dat het beoogde doel van de Face Recognition Grand Challenge altijd een verbetering in de orde van grootte van de herkenningsprestaties was ten opzichte van de resultaten van 2002. Phillips is van mening dat de noodzakelijke daling van het foutenpercentage om dat doel te bereiken grotendeels te danken was aan de ontwikkeling van stilstaande beelden met hoge resolutie en 3D-algoritmen voor gezichtsherkenning. Voor de FRVT 2006 en de ICE 2006 werden reeksen gezichtsbeelden met hoge resolutie, 3D-gezichtsscans en irisbeelden verzameld van dezelfde mensen, zegt Phillips. De FRVT 2006 heeft voor het eerst de prestaties gemeten van zes 3D-algoritmen op een set 3D-gezichtsscans. De ICE 2006 heeft de prestaties van tien algoritmen op een reeks irisbeelden gemeten. 3D gezichtsherkenning komt de laatste jaren goed tot zijn recht doordat 3D sensoren voor gezichtsherkenning pas sinds kort beschikbaar zijn. Wat 3D-gezichtsherkenning bijdraagt, is dat het direct informatie over de vormen van gezichten vastlegt.

Naast andere voordelen identificeert 3D-gezichtsherkenning individuen door gebruik te maken van onderscheidende kenmerken van het oppervlak van een menselijk gezicht, bijvoorbeeld de rondingen van de oogkassen, neus en kin, waar weefsel en bot het duidelijkst zijn en die niet veranderen in de tijd. Bovendien, zegt Phillips, hebben veranderingen in de verlichting een negatief effect gehad op de gezichtsherkenning van stilstaande beelden. Maar de vorm van een gezicht wordt niet beïnvloed door veranderingen in de verlichting. Daarom kan 3D-gezichtsherkenning zelfs worden gebruikt in bijna-donkere omstandigheden.



Volgens Ralph Gross, een onderzoeker aan het Carnegie Mellon Robotics Institute, in Pittsburgh, kan 3D-gezichtsherkenning ook onderwerpen herkennen in verschillende kijkhoeken tot 90 graden, met andere woorden, gezichten in profiel. Gezichtsherkenning is behoorlijk goed geworden bij volledige frontale gezichten en 20 graden uit, maar zodra je naar profiel gaat, zijn er problemen geweest. Gross zegt dat de verklaring voor de problemen van gezichtsherkenningssoftware met profielen misschien niet ingewikkelder is dan het feit dat niemand zich op het probleem concentreerde. De belangrijkste toepassingen van gezichtsherkenning waren in contexten zoals ID-kaarten en gezichtsscanners, waarvoor het doel was de volledige frontale gezichten van coöperatieve onderwerpen onder gecontroleerde verlichting te herkennen.

Stilstaande beelden met een hoge resolutie zijn een andere factor geweest in de verbetering van gezichtsherkenningstechnologie, deels omdat zeer gedetailleerde huidtextuuranalyse mogelijk is geworden. Met een dergelijke analyse kan elk stukje huid, een huidafdruk genaamd, worden vastgelegd als een afbeelding en vervolgens worden opgedeeld in kleinere blokken die door algoritmen worden omgezet in wiskundige, meetbare ruimtes waarin lijnen, poriën en de werkelijke huidtextuur worden vastgelegd. Het kan verschillen tussen identieke tweelingen identificeren, wat nog niet mogelijk is met alleen gezichtsherkenningssoftware, legt Gross uit. Door gezichtsherkenning te combineren met oppervlaktetextuuranalyse, kan nauwkeurige identificatie met 20 tot 25 procent toenemen.

Hoe zit het met de bewering van het FRVT-rapport dat sommige gezichtsherkenningsalgoritmen de herkenningsmogelijkheden van mensen evenaren of overtreffen? Phillips legt uit: Mensen zijn erg goed in het herkennen van gezichten van bekende mensen. Ze zijn echter niet zo goed in het herkennen van onbekende mensen. Aangezien veel voorgestelde gezichtsherkenningssystemen mensen zouden aanvullen of vervangen, waren de vergelijkende tests van de FRVT van de gezichtsherkenningscapaciteiten van mensen en software - de eerste dergelijke tests - belangrijk voor het meten van de potentiële effectiviteit van toepassingen. Phillips zegt dat bij lage foutieve acceptatiepercentages (een foutieve acceptatiegraad is de maatstaf voor de waarschijnlijkheid dat een biometrisch beveiligingssysteem een ​​toegangspoging van een onbevoegd persoon ten onrechte zal accepteren), zes van de zeven automatische gezichtsherkenningsalgoritmen vergelijkbaar of beter waren met dan menselijke herkenning. Dit waren algoritmen van Neven Vision, Viisage, Cognitec, Identix, Samsung Advanced Institute for Technology en Tsinghua University. Helaas voegt Phillips eraan toe dat, omdat de meerderheid van de FRVT 2006-deelnemers de details van hun methoden niet heeft bekendgemaakt, het nog niet mogelijk is om te beoordelen wat er zo kenmerkend is aan deze algoritmen.



Hoe ziet de commerciële beloning voor gezichtsherkenning eruit? Veelbelovend, want tientallen bedrijven willen het potentieel van gezichtsherkenning als biometrisch voor referentie- en verificatiedoeleinden verzilveren. Voor de FRVT streden eerbiedwaardige bedrijven zoals Toshiba en Samsung naast bedrijven als Neven Visie -net overgenomen door Google-en Visa en Identix (die net zijn gefuseerd tot L1 Identity Solutions), evenals samen met onderzoekers van universiteiten zo divers als Beijing, Cambridge en Carnegie Mellon. Welke toepassingen voorziet een bedrijf als Google voor de technologie die is ontwikkeld door de recente overname, Neven Vision? Volgens een PR-medewerker van Google zijn we van mening dat het veelbelovende integratiemogelijkheden biedt met de diensten van Google, zoals Picasa en Picasa Webalbums, met name wat betreft het helpen van gebruikers bij het ordenen en doorzoeken van hun eigen foto's.

Bij Carnegie Mellon zegt Ralph Gross dat hij en zijn collega's onder andere betrokken zijn geweest bij lokale RDW's om afbeeldingen te scannen voor rijbewijzen. Ik heb rapporten van het staatsniveau gekregen dat ze met behulp van gezichtsherkenningstechnologie een behoorlijk aantal mensen hebben gepakt die een vergunning aanvroegen in verschillende staten of in dezelfde staat onder een andere naam omdat hun vorige vergunning was opgeschort. Het is een groeiende trend. Staten die dergelijke technologie gebruiken, zijn Massachusetts, Illinois, West Virginia, Wisconsin, Colorado, Noord- en Zuid-Carolina, Oklahoma, North Dakota, Arkansas en Mississippi. Desalniettemin, benadrukt Gross, is het toepassen van gezichtsherkenningstechnologie op identiteitsfoto's nog lang niet in staat om de wetshandhavers in staat te stellen de webcamnetwerken van een stad te doorzoeken op specifieke personen. Met rijbewijsfoto's heb je een gecontroleerde achtergrond, een operator die je precies vertelt hoe je je gezicht moet positioneren; de beelden zijn verzameld onder vergelijkbare omstandigheden. Het is veel beperkter dan het random-face-in-the-crowd-probleem, waarbij je een camera op een gebouw plakt.

Toch, zegt Gross, zie je het padgebouw al. Tot voor kort vertrouwde de videobewakingsindustrie nog steeds voornamelijk op analoge camera's, waarvoor kabels voor lange afstanden nodig waren om die camera's op bewakingsapparatuur aan te sluiten. Nu stapt de industrie over op IP-gebaseerde camera's, waarmee je vrij eenvoudig al bestaande Ethernet-netwerken kunt aanboren, zegt Gross. U hebt dus draadloze camera's en camera's die gebruikmaken van POE [Power over Ethernet-technologie maakt het mogelijk dat IP-telefoons, draadloze LAN-toegangspunten en andere apparaten stroom en gegevens ontvangen via bestaande LAN-bekabeling] waarbij u geen aparte stekker nodig hebt. Je kunt commerciële oplossingen kopen die in wezen een TiVo zijn voor deze camera's, met ingebouwde bewegingssensoren, zodat ze alleen opnemen als er beweging is. Met digitale opslag kunt u de gegevens voor onbepaalde tijd bewaren en verbeteren op manieren die niet mogelijk zijn met analoge afbeeldingen. Dus al deze dingen komen samen.



In principe zal het daarom, aangezien gezichtsherkenningssoftware zijn snelle opmars voortzet, waarschijnlijk mogelijk zijn om naar specifieke gezichten te zoeken via een netwerk van webcams. Het recente werk van Gross bij Carnegie Mellon, in samenwerking met collega's van de Lab voor gegevensprivacy daar is de ontwikkeling van algoritmen geweest om beschermen privacy van personen terwijl ze onder videobewaking staan. De gebruikelijke methoden die de menselijke herkenning van de kenmerken van een persoon op video dwarsbomen - bijvoorbeeld die gepixelde velden die soms gezichten en lichaamsdelen bedekken in reality-tv-shows - zullen al niet veel gezichtsherkenningssoftware voor de gek houden. Elk gezicht in een videoclip volledig zwart maken zou het werk doen, maar dit zou van beperkt nut zijn als wetshandhavingsinstanties bewijs van verdacht gedrag wilden opvolgen zodra ze een gerechtelijk bevel hadden. De functie van de privacybeschermende algoritmen die Gross helpt te creëren, legt hij uit, is om automatisch de gemiddelde waarden van de gezichten van individuen te nemen en daaruit nieuwe gezichtsbeelden te synthetiseren, en die nieuwe beelden vervolgens over de originelen te leggen. Het lijkt misschien de tegenovergestelde technologie, zegt Gross, maar eigenlijk is het gewoon de andere kant van gezichtsherkenning.

zich verstoppen