211service.com
Biologisk inspirerede synssystemer
Neurovidenskabsmænd ved MIT har udviklet en computermodel, der efterligner det menneskelige synssystem til nøjagtigt at detektere og genkende objekter i et travlt gadebillede, såsom biler og motorcykler.

Det kan være en udfordring for computere at genkende objekter i en scene, såsom bilen i gadebilledet. En model af, hvordan hjernen behandler visuel information, giver en vellykket tilgang.
Sådanne biologisk inspirerede synssystemer kan snart bruges i overvågningssystemer eller i smarte sensorer, der kan advare bilister om fodgængere og andre forhindringer. Det kan også hjælpe i udviklingen af såkaldte visuelle søgemaskiner, siger Thomas Serre , en neuroforsker ved Center for biologisk og beregningsmæssig læring på MITs McGovern Institute for Brain Research, som var involveret i projektet.
Forskere har i årevis været interesseret i at prøve at kopiere biologiske synssystemer, simpelthen fordi de er så gode, siger David Hogg, en computersynsekspert ved Leeds University i Storbritannien. Dette er et meget vellykket eksempel på [efterligning af biologisk syn], siger han.
At lære en computer at klassificere objekter har vist sig meget sværere end oprindeligt forventet, siger Serre, der har udført arbejdet med Tomaso Poggio , meddirektør for centret. På den ene side, for at genkende en bestemt type objekt, såsom en bil, skal en computer have en skabelon eller en beregningsrepræsentation, der er specifik for det pågældende objekt. En sådan skabelon gør det muligt for computeren at skelne en bil fra genstande i andre klasser – ikke-biler. Alligevel skal denne repræsentation være tilstrækkelig fleksibel til at omfatte alle typer biler – uanset hvor varierede de ser ud – i forskellige vinkler, positioner og positurer og under forskellige lysforhold.
Man vil gerne kunne genkende et objekt overalt i synsfeltet, uanset hvor det er og uanset dets størrelse, siger Serre. Men hvis du analyserer billeder kun ud fra deres mønstre af lyse og mørke pixels, så kan to portrætbilleder af forskellige mennesker ende med at ligne mere end to billeder af den samme person taget fra forskellige vinkler.
Den mest effektive metode til at komme uden om sådanne problemer er at træne en indlæringsalgoritme på et sæt billeder og lade den udtrække de funktioner, de har til fælles; to hjul på linje med vejen kunne for eksempel signalere en bil. Serre og Poggio mener, at det menneskelige synssystem bruger en lignende tilgang, men en der afhænger af et hierarki af på hinanden følgende lag i den visuelle cortex. De første lag af cortex registrerer et objekts enklere funktioner, såsom kanter, og højere lag integrerer denne information for at danne vores opfattelse af objektet som helhed.
For at teste deres teori arbejdede Serre og Poggio sammen med Stanley Bileschi, også ved MIT, og Lior Wolf, et medlem af datalogiafdelingen ved Tel Aviv University i Israel, for at skabe en computermodel bestående af 10 millioner beregningsenheder, der hver især er designet til at opføre sig. som klynger af neuroner i den visuelle cortex. Ligesom i cortex er klyngerne organiseret i lag.
Når modellen først lærer at se, uddrager nogle af de cellelignende enheder rudimentære træk fra scenen, såsom orienterede kanter, ved at analysere meget små grupper af pixels. Disse neuroner er typisk som nålehuller, der ser på en lille del af synsfeltet, siger Serre. Mere komplekse enheder er i stand til at optage en større del af billedet og genkende funktioner uanset deres størrelse eller placering. For eksempel, hvis de simple enheder registrerer lodrette og vandrette kanter, kan en mere kompleks enhed bruge denne information til at detektere et hjørne.
Med hvert efterfølgende lag udtrækkes stadig mere komplekse funktioner fra billedet. Det samme er forhold mellem funktioner, såsom afstanden mellem to dele af et objekt eller de forskellige vinkler, som de to dele er orienteret i. Denne information gør det muligt for systemet at genkende det samme objekt i forskellige vinkler.
Det var en overraskelse for os, da vi anvendte denne model til visuelle opgaver i den virkelige verden, og den konkurrerede godt med de bedste systemer, siger Serre. Faktisk genkendte deres model i nogle test objekter mere end 95 procent af tiden i gennemsnit. Jo flere billeder systemet trænes på, jo mere præcist præsterer det.
Måske skal vi ikke være overraskede, siger David Lowe , en ekspert i computersyn og objektgenkendelse ved University of British Colombia i Vancouver. Menneskesyn er langt bedre til genkendelse end nogen af vores nuværende computersystemer, så ethvert tip om, hvordan man kommer videre fra biologi, vil sandsynligvis være meget nyttige.
I øjeblikket er systemet designet til kun at analysere stillbilleder. Men det er meget i tråd med den måde, det menneskelige synssystem fungerer på, siger Serre. Indgangene til den visuelle cortex deles af et system, der beskæftiger sig med former og teksturer, mens et separat system beskæftiger sig med bevægelse, siger han. Teamet arbejder nu på at indarbejde et parallelt system til at klare video.