211service.com
Computerhøjttalere kun til dine ører
Flere og flere mennesker bruger deres computere til stemmekommunikation, såsom Skype og lyd-instant messaging. For det meste kræver brugen af disse funktioner dog, at man enten er bundet til sin computer med et headset eller taler direkte ind i en mikrofon og holder højttalerlydstyrken lav, især i delte kontorlokaler.

Hør dette: Microsoft-forskere har udviklet en algoritme, der justerer timingen af lydbølger, der udsendes fra hver højttaler i et array (se her). Som et resultat ophæver lydbølger hinanden i nogle dele af rummet og forstærker hinanden i andre, hvilket effektivt skaber en fokuseret lydstråle, der fungerer som virtuelle hovedtelefoner.
I lyset af dette problem forsøger forskere hos Microsoft at gøre lydoutput mere sofistikeret. Et team, ledet af Ivan Tashev, en softwarearkitekt hos Microsoft, begyndte for nylig at arbejde på en algoritme, der i teorien vil være i stand til effektivt at lede lyd fra et sæt højttalere – ideelt indlejret i en computerskærm – ind i en persons ører. skabe virtuelle hovedtelefoner; blot et par centimeter uden for lydbølgernes brændpunkt forsvinder lydstyrken dramatisk. Afgørende, siger Tashev, kunne hans algoritme bruges af en bred vifte af billige højttalere, der kunne sættes i computerskærme.
Målet, siger han, er at målrette fokuseret lyd, så en person kan gå rundt på et kontor og høre, mens han er på et video- eller computerstøttet lydkonferenceopkald. Oplysninger om en persons placering kan indsamles af periferiudstyr og føres tilbage til højttalersoftwaren, så de virtuelle hovedtelefoner kan bevæge sig med brugeren i realtid. For eksempel, siger Tashev, kan et kamera, enten monteret på eller indlejret i en computerskærm, og billedbehandlingssoftware bestemme en persons position. Derudover kan et array af fire eller flere mikrofoner på eller i nærheden af en computerskærm programmeres til at lokalisere lyd ved at måle de subtile tidsforskelle mellem hvornår lyden ankommer til hver højttaler i arrayet. Faktisk har Tashevs tidligere arbejde været at designe sådanne lydlokaliserende algoritmer til de typer mikrofoner, der almindeligvis findes i rammen af bærbare computere. Brug af både et kamera og en mikrofon kan forbedre nøjagtigheden og afstanden, som en person kan strejfe, mens han bruger højttalerne.
For at være sikker er ideen om at fokusere lyd ikke ny: militære radarsystemer og almindeligt ultralydsudstyr, der bruges til at afbilde fostre i utero og finde kræftsvulster, har gjort dette i årevis. Teknologien kaldes beamforming, og den opnås, når lydbølgerne fra visse højttalere i et array oplever mikrosekundersforsinkelser, forklarer Jiashu Chen, teknisk chef hos Finisar Corporation, et datakommunikationsfirma med base i Sunnyvale, Californien. De forsinkede lydbølger kombineres på en sådan måde, at lyden i nogle dele af rummet ophæves, og i andre bliver lyden højere.
Imidlertid er stråleformende systemer, der dirigerer hørbar lyd, såsom musik eller menneskestemmer, mere teknisk udfordrende at bygge end radar og ultralyd er, siger Chen, fordi de skal rumme et bredere frekvensområde; lavere frekvenser kræver andre hardware- og softwareovervejelser, end højere frekvenser gør. Signalbehandlingsteknologi er forbedret til det punkt, at nogle kommercielle produkter bruger stråleformning. Yamaha, for eksempel, sælger højttalere til hjemmeunderholdning, der afviser fokuseret lyd fra væggene for at skabe virtuelle højttalere bag en lytters hoved. Men sådanne systemer er stadig sjældne og altid dyre.
En grund til, at lydstråleformning er dyrt, er fordi det er tidskrævende at kalibrere et givet system i den virkelige verden, siger Microsofts Tashev. Hver højttaler har små variationer i den lyd, den udsender, og da fokusering af en lydstråle kræver ekstrem præcision i timing, kan disse små variationer forårsage store forvrængninger i lyden. Derfor er softwaren, der bruges til at fokusere lyden, kalibreret til at fungere med specifik hardware, og når den er købt, skal hele systemet kalibreres til formen af det rum, hvor det er installeret.
Microsoft ønsker at udvikle software, der er god nok til at fungere med alle højttalere, med en minimal mængde kalibrering, der kræves på fabrikken eller af brugere. For at give generiske højttalere mulighed for at fokusere lyden, har Tashev og hans gruppe ændret velkendte beamforming-algoritmer. De designede en del af en signalbehandlingsalgoritme, kaldet et filter, til at rumme en bred vifte af fremstillingstolerancer eller de data, der beskriver højttalerens ydeevne ved forskellige frekvenser. Du skal vide, hvordan disse parametre varierer, siger Tashev. Når du designer algoritmen, gør du det til flere forekomster af højttalerarrays.
Tricket, siger han, er at forsøge at finde et lykkeligt medium blandt de forskellige tolerancer, så den resulterende lyd er sammenlignelig på tværs af højttalere. Dette kræver en vis finjustering, og forskerne er stadig i gang med at bestemme den bedste måde at implementere højttalertolerancerne på. Tashev indrømmer dog, at ved at lave en generisk stråleformende algoritme, vil der højst sandsynligt være en afvejning i ydeevnen. Man skal indgå nogle kompromiser, siger han.
Tashev påpeger, at projektet stadig er i sin tidlige fase. Selvom du har en god stråleformer, er det ikke nok, siger han. Du skal også have en lydlokalisering [såsom et kamera eller et specialiseret mikrofonsystem], der fortæller dig, hvor du skal pege strålen. Desuden siger han, for at stråleformningsalgoritmen skal lykkes, skal den tage højde for lydrefleksioner fra vægge og vinduer på et kontor.
Det ville være pænt at se dette derude, siger Stan Birchfield, professor i elektro- og computerteknik ved Clemson University i Clemson, SC. Birchfield arbejder på billedbehandlingsteknikker, der bruger kameraer til at identificere en persons placering for at forbedre fokus på mikrofonarrays. Sporing er et virkelig svært problem, siger han, et som ingen har fundet en måde at løse for et miljø som et kontor. Det er opmuntrende, at Microsoft udforsker området, tilføjer Birchfield, men indtil virksomheden har planer for produkter, er han forsigtig med at blive entusiastisk.
Tashev siger, at kommercialisering af denne teknologi vil kræve en kompleks koordinering af mange faktorer, der kan tage op til tre år at opnå, selvom en forskningsprototype er blevet perfektioneret. Selv det skridt vil tage tid: Tashev siger, at gruppen stadig skal teste pålideligheden af algoritmen med en række højttalerarrays. Så, for at gøre arbejdet til et produkt, bliver Microsoft nødt til at finde den bedste måde at integrere algoritmen i Windows Media Player, sørge for, at drivere til hardwaren er inkluderet i operativsystemet, og, siger Tashev, finde virksomheder, der er interesseret i at fremstille højttalere til en sådan applikation. Men hvis og når alt dette sker, vil udbyttet være stort, siger han. Folk behøver ikke længere headset for at have en privat Skype-samtale eller videokonference.