Bedre software til ansigtsgenkendelse

For forskere og ingeniører, der er involveret i ansigtsgenkendelsesteknologi, har de nyligt udgivne resultater af Face Recognition Grand Challenge – mere fuldstændigt, Face Recognition Vendor Test (FRVT) 2006 og Iris Challenge Evaluation (ICE) 2006 – været en stille triumf. Sponsoreret af National Institute of Standards and Technology (NIST), match up af ansigtsgenkendelsesalgoritmer viste, at maskingenkendelse af menneskelige individer er blevet tidoblet siden 2002 og hundrede gange siden 1995. Faktisk udfører de bedste ansigtsgenkendelsesalgoritmer nu mere præcist, end de fleste mennesker kan klare. Generelt udvikler ansigtsgenkendelsesteknologien sig hurtigt.





Fakta i ansigtet: Det øverste 3D-billede viser kun de oplysninger, der er forbundet med formen på en mands ansigt. Det nederste billede viser teksturen såvel som formen.

Jonathan Phillips, programleder for NIST-testene og hovedforfatter af styrelsens rapport , siger, at det tilsigtede mål med Face Recognition Grand Challenge altid var en forbedring af størrelsesordenen i genkendelsesydelsen i forhold til resultaterne fra 2002. Phillips mener, at det nødvendige fald i fejlprocenten for at nå dette mål i høj grad skyldtes udvikling af højopløselige stillbilleder og 3-D ansigtsgenkendelsesalgoritmer. Til FRVT 2006 og ICE 2006 blev der indsamlet sæt af ansigtsbilleder i høj opløsning, 3-D ansigtsscanninger og irisbilleder af de samme mennesker, siger Phillips. FRVT 2006 målte for første gang ydeevnen af ​​seks 3-D algoritmer på et sæt 3-D ansigtsscanninger. ICE 2006 målte ydeevnen af ​​ti algoritmer på et sæt irisbilleder. 3-D ansigtsgenkendelse er kommet til sin ret i de sidste par år, fordi 3-D sensorer til ansigtsgenkendelse først er blevet tilgængelige for nylig. Hvad 3-D ansigtsgenkendelse bidrager med er, at den direkte fanger information om ansigtsformerne.

Blandt andre fordele identificerer 3-D ansigtsgenkendelse individer ved at udnytte karakteristiske træk ved et menneskes ansigts overflade – for eksempel kurverne af øjenhuler, næse og hage, som er der, hvor væv og knogler er mest tydelige, og som ikke gør det. ændre sig med tiden. Desuden, siger Phillips, har ændringer i belysningen negativt påvirket ansigtsgenkendelsesydelsen fra stillbilleder. Men et ansigts form påvirkes ikke af ændringer i belysningen. Derfor kan 3-D ansigtsgenkendelse endda bruges under næsten mørke forhold.



Ifølge Ralph Gross, en forsker ved Carnegie Mellon Robotics Institute i Pittsburgh, kan 3-D ansigtsgenkendelse også genkende emner i forskellige synsvinkler op til 90 grader – med andre ord ansigter i profil. Ansigtsgenkendelse er blevet ret god ved hele frontale ansigter og 20 grader fri, men så snart du går mod profil, har der været problemer. Gross siger, at forklaringen på ansigtsgenkendelsessoftwares vanskeligheder med profiler måske ikke er mere kompliceret end det faktum, at ingen fokuserede på problemet. De vigtigste anvendelser af ansigtsgenkendelse har været i sammenhænge som ID-kort og ansigtsscannere, hvor målet har været genkendelse af de fulde frontale ansigter af samarbejdsvillige motiver under kontrolleret belysning.

Stillbilleder i høj opløsning har været en anden faktor i forbedringen af ​​teknologien til ansigtsgenkendelse, blandt andet fordi meget detaljeret hudteksturanalyse også er blevet mulig. Med en sådan analyse kan enhver hudlap – kaldet et hudprint – fanges som et billede og derefter opdeles i mindre blokke, som algoritmer forvandler til matematiske, målbare rum, hvor linjer, porer og den faktiske hudtekstur registreres. Det kan identificere forskelle mellem identiske tvillinger, hvilket endnu ikke er muligt ved hjælp af software til ansigtsgenkendelse alene, forklarer Gross. Ved at kombinere ansigtsgenkendelse med overfladeteksturanalyse kan nøjagtig identifikation øges med 20 til 25 procent.

Hvad med FRVT-rapportens påstand om, at nogle ansigtsgenkendelsesalgoritmer svarer til eller overstiger menneskers genkendelsesevner? Phillips forklarer: Mennesker er meget gode til at genkende ansigter på kendte mennesker. De er dog ikke så gode til at genkende ukendte mennesker. Da mange foreslåede ansigtsgenkendelsessystemer ville komplementere eller erstatte mennesker, var FRVT's komparative test af ansigtsgenkendelsesevner hos mennesker og software - den første sådanne test - vigtige for at måle applikationernes potentielle effektivitet. Phillips siger, at ved lave falske acceptfrekvenser (en falsk acceptrate er et mål for sandsynligheden for, at et biometrisk sikkerhedssystem forkert vil acceptere et adgangsforsøg fra en uautoriseret person), var seks ud af syv automatiske ansigtsgenkendelsesalgoritmer sammenlignelige med eller bedre end menneskelig anerkendelse. Disse var algoritmer fra Neven Vision, Viisage, Cognitec, Identix, Samsung Advanced Institute for Technology og Tsinghua University. Desværre tilføjer Phillips, fordi flertallet af FRVT 2006-deltagere ikke har afsløret detaljerne i deres metoder, er det endnu ikke muligt at vurdere, hvad der er karakteristisk ved disse algoritmer.



Hvordan ser det kommercielle udbytte for ansigtsgenkendelse ud? Ganske lovende, fordi snesevis af virksomheder sigter mod at indkassere ansigtsgenkendelses potentiale som en biometrisk til legitimations- og verifikationsformål. For FRVT konkurrerede ærværdige virksomheder som Toshiba og Samsung sammen med virksomheder som Neven Vision – netop erhvervet af Google – og Visa og Identix (som netop er fusioneret til L1 Identity Solutions), samt sammen med forskere fra så forskellige universiteter som Beijing, Cambridge og Carnegie Mellon. Hvilke applikationer forudser en virksomhed som Google for teknologien udviklet af dets nylige opkøb, Neven Vision? Ifølge en Google PR-person mener vi, at det tilbyder lovende integrationsmuligheder med Googles tjenester, såsom Picasa og Picasa Web Albums, især med hensyn til at hjælpe brugere med at organisere og søge i deres egne billeder.

Hos Carnegie Mellon siger Ralph Gross, at han og hans kolleger blandt andet har været involveret med lokale DMV'er for at scanne billeder til kørekort. Jeg har fået rapporter fra delstatsniveau for at sige, at de ved hjælp af ansigtsgenkendelsesteknologi fangede en hel del mennesker, der ansøgte om licenser i enten forskellige stater eller i samme stat under et andet navn, fordi deres tidligere licens blev suspenderet. Det er en stigende tendens. Stater, der bruger sådan teknologi, omfatter Massachusetts, Illinois, West Virginia, Wisconsin, Colorado, North og Southern Carolina, Oklahoma, North Dakota, Arkansas og Mississippi. Ikke desto mindre understreger Gross, at anvendelse af ansigtsgenkendelsesteknologi på ID-billeder er langt fra at have den kapacitet, der ville lade retshåndhævende myndigheder søge i en bys webcam-netværk for specifikke personer. Med kørekortbilleder har du en kontrolleret baggrund, en operatør fortæller dig præcis, hvordan du skal placere dit ansigt; billederne er indsamlet under sammenlignelige forhold. Det er meget mere begrænset end problemet med tilfældigt ansigt i folkemængden, hvor du sætter et kamera på en bygning.

Alligevel, siger Gross, kan man allerede se stibygningen. Indtil for nylig var videoovervågningsindustrien stadig for det meste afhængig af analoge kameraer, hvilket krævede, at kabler blev sat op til lange afstande for at forbinde disse kameraer med overvågningsudstyr. Nu skifter industrien til IP-baserede kameraer, som du ret nemt kan benytte dig af allerede eksisterende Ethernet-netværk med, siger Gross. Så du har trådløse kameraer og kameraer, der bruger POE [Power over Ethernet-teknologi tillader IP-telefoner, trådløse LAN-adgangspunkter og andre apparater at modtage strøm såvel som data over eksisterende LAN-kabler], hvor du ikke behøver et separat strømstik. Du kan købe kommercielle løsninger, der i det væsentlige er en TiVo til disse kameraer, med indbyggede bevægelsessensorer, så de kun optager, når der sker bevægelse. Med digital lagring kan du beholde dataene på ubestemt tid og forbedre dem på måder, som du ikke kan med analoge billeder. Så alle disse ting hænger sammen.



I princippet vil det derfor sandsynligvis være muligt at søge efter specifikke ansigter på tværs af et netværk af webcams, efterhånden som software til ansigtsgenkendelse fortsætter sin hurtige fremgang. Derfor har Gross' seneste arbejde hos Carnegie Mellon, i samarbejde med kolleger på Databeskyttelseslaboratorium der, har været udvikling af algoritmer til beskytte enkeltpersoners privatliv, mens de er under videoovervågning. De sædvanlige metoder, der forhindrer menneskelig genkendelse af en persons træk på video - for eksempel de pixelerede felter, der nogle gange dækker ansigter og kropsdele på reality-tv-shows - vil allerede ikke narre meget ansigtsgenkendelsessoftware. Fuldstændig mørklægning af hvert ansigt i et videoklip ville gøre jobbet, men dette ville være til begrænset nytte, hvis retshåndhævende myndigheder ønskede at følge op på beviser for mistænkelig adfærd, når de havde en retskendelse. Funktionen af ​​de privatlivsbevarende algoritmer, som Gross er med til at skabe, forklarer han, er automatisk at tage gennemsnitsværdierne af enkeltpersoners ansigter og, ud fra dem, syntetisere nye ansigtsbilleder og derefter overlejre de nye billeder over originalerne. Det kan virke som den modsatte teknologi, siger Gross, men faktisk er det bare den anden side af ansigtsgenkendelse.

skjule