Computerluidsprekers alleen voor uw oren

Steeds meer mensen gebruiken hun computer voor spraakcommunicatie, zoals Skype en audio instant messaging. Om deze functies te gebruiken, moet men echter voor het grootste deel ofwel via een headset aan haar computer zijn vastgemaakt of rechtstreeks in een microfoon spreken en het luidsprekervolume laag houden, vooral in gedeelde kantoorruimte.





Hoor dit: Microsoft-onderzoekers hebben een algoritme ontwikkeld dat de timing aanpast van geluidsgolven die door elke luidspreker in een array worden uitgezonden (hier te zien). Dientengevolge heffen geluidsgolven elkaar in sommige delen van de ruimte op en versterken ze elkaar in andere, waardoor in feite een gerichte geluidsstraal wordt gecreëerd die als virtuele hoofdtelefoon fungeert.

In het licht van dat probleem proberen onderzoekers van Microsoft de audio-uitvoer geavanceerder te maken. Een team, geleid door Ivan Tashev, een software-architect bij Microsoft, is onlangs begonnen met het werken aan een algoritme dat, in theorie, in staat zal zijn om geluid van een set luidsprekers - idealiter ingebed in een computermonitor - effectief in de oren van een persoon te sturen. virtuele hoofdtelefoons maken; slechts enkele centimeters buiten het brandpunt van de geluidsgolven, vervaagt het volume dramatisch. Cruciaal, zegt Tashev, is dat zijn algoritme kan worden gebruikt door een breed scala aan goedkope luidsprekers die in computermonitoren kunnen worden geplaatst.

Het doel, zegt hij, is om gericht geluid te richten, zodat een persoon door een kantoor kan lopen en kan horen tijdens een video- of computerondersteunde audioconferentie. Informatie over de locatie van een persoon kan worden verzameld door hardware-randapparatuur en teruggevoerd naar de luidsprekersoftware, zodat de virtuele hoofdtelefoon in realtime met de gebruiker kan meebewegen. Tashev zegt bijvoorbeeld dat een camera, gemonteerd op of ingebed in een computermonitor, en beeldverwerkingssoftware de positie van een persoon kunnen bepalen. Bovendien kan een reeks van vier of meer microfoons op of in de buurt van een computermonitor worden geprogrammeerd om geluid te lokaliseren door de subtiele tijdsverschillen te meten wanneer het geluid bij elke luidspreker in de reeks aankomt. In feite was het eerdere werk van Tashev het ontwerpen van dergelijke algoritmen voor het lokaliseren van geluid voor de soorten microfoons die vaak worden aangetroffen in de rand van laptops. Het gebruik van zowel een camera als een microfoon kan de nauwkeurigheid en de afstand verbeteren die een persoon kan zwerven tijdens het gebruik van de luidsprekers.



Het idee om geluid te focussen is natuurlijk niet nieuw: militaire radarsystemen en gewone ultrasone apparatuur, die worden gebruikt om foetussen in utero in beeld te brengen en kankergezwellen te vinden, doen dit al jaren. De technologie wordt beamforming genoemd en wordt bereikt wanneer de geluidsgolven van bepaalde luidsprekers in een array microseconden vertraging oplopen, legt Jiashu Chen uit, technisch manager bij Finisar Corporation, een datacommunicatiebedrijf gevestigd in Sunnyvale, CA. De vertraagde geluidsgolven combineren op een zodanige manier dat in sommige delen van de ruimte het geluid wordt opgeheven en in andere delen het geluid harder wordt.

Beamforming-systemen die hoorbaar geluid sturen, zoals muziek of menselijke stemmen, zijn echter technisch uitdagender om te bouwen dan radar en ultrageluid zijn, zegt Chen, omdat ze een groter frequentiebereik moeten accommoderen; lagere frequenties vereisen andere hardware- en softwareoverwegingen dan hogere frequenties. Signaalverwerkingstechnologie is zodanig verbeterd dat sommige commerciële producten beamforming gebruiken. Yamaha verkoopt bijvoorbeeld luidsprekers voor home-entertainment die gericht geluid van muren weerkaatsen om virtuele luidsprekers achter het hoofd van een luisteraar te creëren. Maar dergelijke systemen zijn nog steeds zeldzaam en altijd prijzig.

Een van de redenen dat audio beamforming duur is, is omdat het tijdrovend is om een ​​bepaald systeem in de echte wereld te kalibreren, zegt Tashev van Microsoft. Elke luidspreker heeft kleine variaties in het geluid dat hij uitstraalt, en aangezien het scherpstellen van een geluidsbundel extreme precisie in timing vereist, kunnen deze kleine variaties grote vervormingen in het geluid veroorzaken. Daarom is de software die wordt gebruikt om het geluid te focussen, gekalibreerd om met specifieke hardware te werken, en wanneer het wordt gekocht, moet het hele systeem worden gekalibreerd naar de vorm van de kamer waarin het is geïnstalleerd.



Microsoft wil software ontwikkelen die goed genoeg is om met alle luidsprekers te werken, met een minimale hoeveelheid kalibratie die vereist is in de fabriek of door gebruikers. Om generieke luidsprekers geluid te laten focussen, hebben Tashev en zijn groep bekende beamforming-algoritmen aangepast. Ze ontwierpen een deel van een signaalverwerkingsalgoritme, een filter genaamd, om tegemoet te komen aan een breed scala aan fabricagetoleranties, of de gegevens die luidsprekerprestaties op verschillende frequenties beschrijven. Je moet weten hoe die parameters variëren, zegt Tashev. Wanneer u het algoritme ontwerpt, doet u het voor meerdere instanties van luidsprekerarrays.

De truc, zegt hij, is om te proberen een gulden middenweg te vinden tussen de verschillende toleranties, zodat het resulterende geluid vergelijkbaar is tussen luidsprekers. Dit vereist wat finetuning en de onderzoekers zijn nog aan het bepalen hoe de speakertoleranties het beste kunnen worden geïmplementeerd. Tashev geeft echter toe dat door een generiek bundelvormend algoritme te maken, er hoogstwaarschijnlijk een compromis in de prestaties zal zijn. Je moet compromissen sluiten, zegt hij.

Tashev wijst erop dat het project nog in de kinderschoenen staat. Zelfs als je een goede beamformer hebt, is dat niet genoeg, zegt hij. Je moet ook een geluidslokalisator hebben [zoals een camera of gespecialiseerde microfoonarray] die je vertelt waar je de straal moet richten. Om het beamforming-algoritme succesvol te laten zijn, zegt hij, moet het bovendien rekening houden met geluidsreflecties van muren en ramen in een kantoor.



Het zou leuk zijn om dit daar te zien, zegt Stan Birchfield, hoogleraar elektrische en computertechniek aan de Clemson University in Clemson, SC. Birchfield werkt aan beeldverwerkingstechnieken die camera's gebruiken om de locatie van een persoon te identificeren om de focus van microfoonarrays te verbeteren. Traceren is een heel moeilijk probleem, zegt hij, en niemand heeft een manier gevonden om het op te lossen voor een omgeving als een kantoor. Het is bemoedigend dat Microsoft het gebied verkent, voegt Birchfield toe, maar totdat het bedrijf plannen heeft voor producten, is hij voorzichtig om enthousiast te worden.

Tashev zegt dat de commercialisering van deze technologie een complexe coördinatie van vele factoren vereist, die tot drie jaar kan duren, zelfs als een onderzoeksprototype is geperfectioneerd. Zelfs die stap zal tijd kosten: Tashev zegt dat de groep de betrouwbaarheid van het algoritme nog moet testen met een aantal luidsprekerarrays. Om het werk vervolgens in een product om te zetten, moet Microsoft de beste manier vinden om het algoritme te integreren in Windows Media Player, ervoor zorgen dat stuurprogramma's voor de hardware in het besturingssysteem zijn opgenomen en, zegt Tashev, bedrijven vinden die geïnteresseerd zijn in het vervaardigen van luidsprekers voor een dergelijke toepassing. Maar als en wanneer dit allemaal gebeurt, zal de uitbetaling geweldig zijn, zegt hij. Mensen hebben geen headsets meer nodig om een ​​privé Skype-gesprek of videoconferentie te voeren.

zich verstoppen