Bedre computerchips, før

Forskere ved University of Michigan har udviklet software, der jager efter fejl i chips og foreslår den bedste måde at rette dem på. Deres tilgang tackler et voksende problem for chipproducenter som AMD og Intel. Efterhånden som transistorer krymper og chips får mere komplekse designs, bliver hardwarefejl mere udbredt. I øjeblikket kan det tage op til et år at fejlfinde prototypechips og gøre dem klar til masseproduktion. Den nye software kan forkorte den tid, det tager at få en chip på markedet, reducere omkostningerne ved at reducere antallet af prototyper og testcyklusser og i sidste ende give chips med færre fejl.





Digital udrydder: Ny software kan finde fejl i computerchips og foreslå måder at rette dem på, meget hurtigere end ingeniører, der bruger den traditionelle manuelle tilgang. Softwaren kan spare millioner af dollars i prototypeomkostninger og gøre chips mere sikre.

Dette er stadig et uløst problem, siger Rob Rutenbar , en professor i elektro- og computerteknik ved Carnegie Mellon University, som tilføjer, at der er meget lidt videnskabelig litteratur om debugging af silicium. Intel har måske noget sofistikeret teknologi, men de taler ikke om det. For alt hvad vi ved, gør folk det i hånden, siger Rutenbar. Den fornemmelse, jeg får, er, at det ikke er særlig godt automatiseret.

Manuel fejlretning giver mere plads til fejl. Stort set alle chips, inklusive mikroprocessorer, er buggy, siger Igor Markov , professor i elektroteknik og datalogi ved University of Michigan. Intels hjemmeside, for eksempel, viser omkring 130 kendte hardwarefejl på kommercielle bærbare computere. De fleste kan rettes med softwaredownloads, men omkring 20 af dem kan ikke være det, siger Markov, og de efterlader maskiner sårbare over for virus.

Markov og hans kollega Valeria Bertacco , professor i elektroteknik og datalogi ved Michigan, udviklede software, der tackler fejlrettelsesproblemet, efter at den første runde af prototyper er kommet tilbage til chipproducenten. Når du har en første version af en chip, er den ikke klar til at give til forbrugeren, siger Bertacco. Ingeniører skal prøve at køre operativsystemer og software på det for at se, om det virker, og denne proces kan tage alt fra et par timer til en uge, afhængigt af antallet af fejl i chipsene.

Det er meget svært at finde ud af, hvad der er galt, siger Bertacco. Og når først en ingeniør har identificeret en fejl – som kan være alt fra ledninger placeret for tæt sammen til malplacerede transistorer – er det ikke altid klart, hvad den bedste løsning vil være. Ofte reparerer ingeniører ét problem kun for i den næste runde af prototyper at opdage, at deres løsninger utilsigtet har tilføjet andre fejl. Prototyper kan tage måneder at bygge, og de er dyre: at ændre designs på maskerne, der bruges til at mønstre lag af transistorer og ledninger på chipsene, koster millioner af dollars.

I øjeblikket, når en prototype kommer tilbage til en chipproducent, kobler ingeniører den op til elektriske sonder, der sender elektriske signaler gennem den og registrerer outputtet, forklarer Bertacco. Forskellige signaler går til forskellige dele af chippen, og ved at afprøve tusindvis af signaler kan ingeniører normalt lokalisere et problem. Derefter foreslår de en række mulige løsninger. Nogle gange skal de simpelthen fjerne en forbindelse mellem to ledninger i et af de øverste lag af chippen. Dette kan gøres ved hjælp af udstyr, der er let tilgængeligt i laboratoriet, og chippen kan hurtigt testes igen. Andre gange er der behov for rettelser på lavere lag i chippen, hvor transistorerne udgør logiske porte. Disse transistorer kan ikke så let justeres og gentestes.

Michigan-forskerne skrev software, der automatisk specificerer det elektriske input til chips, der testes, og analyserer deres output for at finde problemområder. Ideelt set ville ingeniører gerne vide outputtet af hver transistor på en chip. Men forbrugerchips vil snart have mere end en milliard transistorer, hvilket vil gøre en sådan præcis test alt for tidskrævende, forklarer Bertacco. Så Michigan-algoritmen tester en række input på tværs af en stor del af chippen. Baseret på outputfejlene ved den, hvilken del af chippen den skal koncentrere sig om, og indsnævrer en søgning til et par lovende kandidatfejl, siger Bertacco. På lignende måde identificerer softwaren måder at rette fejlene på, og kører gennem en række simuleringer for at finde en designvariation, der tilbyder den hurtigste og mest omkostningseffektive løsning.

En af de store fordele ved Michigan-forskernes tilgang, siger Rutenbar, er, at deres software nogle gange kan komme med kontraintuitive løsninger. En ingeniør, siger han, vil måske se, at den logiske måde at rette en fejl på er at omkoble en række kredsløb. Men softwaren kan fortælle, når vending af et par ledninger vil få det samme resultat. Når mennesker ser på det, er det slet ikke indlysende, siger Rutenbar.

I casestudier viste forskerne, at deres software automatisk kan reparere omkring 70 procent af større siliciumfejl, og de hævder, at de kunne reducere den tid, det krævede at finde en bestemt fejl fra uger til dage.

Intel holder øje med arbejdet, da det altid leder efter bedre måder at forbedre chipfremstillingsprocessen på. Debugging silicium er et alvorligt problem, siger Shekhar Borkar , en Intel-forsker. Han siger, at Intel bruger den samme slags teknikker, som Michigan-forskerne gør, men måske i en anden form. Borkar tilføjer, at der er nogle fremskridt i [Michigan]-avisen. Han siger, at Michigan-forskningen er en god start på at løse problemet, men stadig skal bevises uden for laboratoriet.

skjule