211service.com
Hoe Apple Siri personaliseert zonder je gegevens op te zuigen
Een vrouw gebruikt haar stemassistent op haar telefoon. Kyonntra/Getty Images
Als je een iPhone hebt, heb je het afgelopen jaar misschien een verandering in het gedrag van Siri opgemerkt. De stemassistent op de telefoon wordt wakker als je Hey Siri zegt, maar niet als dezelfde zin van je vrienden of familie komt.
De reden waarom Apple dit deed was verstandig: het wilde een manier om te voorkomen dat alle iPhones in een kamer zouden reageren wanneer één persoon de wake-frase uitsprak. Je zou kunnen denken dat Apple hiervoor veel van je audiogegevens zou moeten verzamelen. Verrassend genoeg niet.
In plaats daarvan vertrouwt het voornamelijk op een techniek die federated learning wordt genoemd, vertelde Julien Freudiger, hoofd van de privacy van Apple, een publiek op de Neural Processing Information Systems-conferentie op 8 december. Federated learning is een privacybeschermende machinale leermethode die werd voor het eerst geïntroduceerd door Google in 2017 . Hiermee kan Apple verschillende exemplaren van een luidsprekerherkenningsmodel op alle apparaten van zijn gebruikers trainen, waarbij alleen de lokaal beschikbare audiogegevens worden gebruikt. Vervolgens stuurt het alleen de bijgewerkte modellen terug naar een centrale server om te worden gecombineerd tot een mastermodel. Op deze manier verlaat onbewerkte audio van Siri-verzoeken van gebruikers hun iPhones en iPads nooit, maar de assistent wordt steeds beter in het identificeren van de juiste spreker.
Naast federatief leren, gebruikt Apple ook iets dat differentiële privacy wordt genoemd om een extra beschermingslaag toe te voegen. De techniek injecteert een kleine hoeveelheid ruis in alle onbewerkte gegevens voordat deze worden ingevoerd in een lokaal machine learning-model. De extra stap maakt het buitengewoon moeilijk voor kwaadwillende actoren om de originele audiobestanden van het getrainde model te reverse-engineeren.
Hoewel Apple is geweest differentiële privacy gebruiken sinds 2017 is het alleen gecombineerd met federatief leren vanaf iOS 13, dat in september van dit jaar voor het publiek werd uitgerold. Naast het personaliseren van Siri, worden beide technieken nu ook gebruikt voor een paar andere toepassingen, waaronder QuickType (het gepersonaliseerde toetsenbord van Apple) en de functie Found In Apps, die uw agenda en e-mail-apps scant op de namen van sms-ers en bellers wiens nummers staan niet in je telefoon. Freudiger zei dat het bedrijf van plan is om de privacymethoden binnenkort uit te rollen naar meer apps en functies.
In het afgelopen jaar is federatief leren steeds populairder geworden binnen de AI-onderzoeksgemeenschap naarmate de zorgen over gegevensprivacy zijn toegenomen. In maart Google vrijgelaten een nieuwe set tools om het voor ontwikkelaars gemakkelijker te maken om hun eigen federatieve leermodellen te implementeren. Naast vele andere toepassingen hopen onderzoekers dat het zal helpen bij het overwinnen van privacy-uitdagingen bij de toepassing van AI in de gezondheidszorg. Bedrijven zoals Owkin, Doc.ai en Nvidia zijn geïnteresseerd om het op deze manier te gebruiken.
Hoewel de techniek nog relatief nieuw is en verder moet worden verfijnd, biedt de nieuwste toepassing van Apple nog een casestudy over hoe deze op grote schaal kan worden toegepast. Het markeert ook een fundamentele verschuiving in de afweging die de tech-industrie traditioneel heeft aangenomen tussen privacy en nut: in feite is het nu mogelijk om beide te bereiken. Laten we hopen dat andere bedrijven snel aanslaan.
Meld u aan voor onze Webby-genomineerde AI-nieuwsbrief The Algorithm om meer van dit soort verhalen rechtstreeks in uw inbox te ontvangen. Het is gratis.