Computers Leer nieuwe ABC's

Voor tientallen miljoenen mensen over de hele wereld - van West-Afrika tot Zuidoost-Azië tot het Midden-Oosten - is internet niet zo'n vriendelijke plek. Dat komt omdat veel van 's werelds schrijfsystemen nog steeds niet zijn gecodeerd in software, wat betekent dat miljoenen mensen geen e-mail kunnen schrijven, websites kunnen bouwen of databases kunnen doorzoeken in hun eigen scripts. Een groep taalkundigen van de University of California, Berkeley, probeert daar verandering in te brengen door ervoor te zorgen dat bijna 100 extra scripts een plaats krijgen in een cruciale internationale standaard waarmee computers tekstgegevens kunnen weergeven, verwerken en verzenden.





Het initiatief van de universiteit is een poging om een ​​vaak over het hoofd gezien aspect van de digitale kloof te corrigeren: veel scripts die tegenwoordig worden gebruikt door talen van minder dan vijf miljoen sprekers in de wereld zijn niet vertegenwoordigd in de internationale standaard, zegt Deborah Anderson, een taalkundige bij Berkeley die leiding geeft aan de moeite. Die standaard heet Unicode, die een uniek ID-nummer toekent aan elk geschreven teken, symbool en leesteken in een geschreven taal. De ID-nummers zorgen ervoor dat tekens niet verkeerd worden geïnterpreteerd als gegevens tussen softwareprogramma's of over internet worden verplaatst - een probleem dat soms verschijnt als een reeks vraagtekens op uw scherm en het vermogen van hele bevolkingsgroepen om via internet te communiceren kan verlammen . Unicode maakt bijvoorbeeld radicale economische transformaties in Vietnam mogelijk. Vóór dit jaar hadden computer- en softwarefabrikanten 43 verschillende manieren bedacht om Vietnamese tekst te coderen, wat betekende dat computers niet op betrouwbare wijze gegevens konden uitwisselen. Toen, begin dit jaar, nam de Vietnamese regering Unicode aan als haar nationale standaard.

Boeing

Dit verhaal maakte deel uit van ons nummer van september 2003

  • Zie de rest van het nummer
  • Abonneren

Het probleem is dat de meer obscure schrijfsystemen nog niet zijn gecodeerd in de Unicode-standaard. Het toevoegen van nog eens 100 scripts is een grote taak; slechts 52 zijn gecodeerd vandaag. Om het werk te doen, rekruteert en financiert Berkeley taalkundigen, evenals gebruikers van scripts zoals N'Ko (gebruikt in West-Afrika), Balinees (gebruikt in Indonesië) en Tifinagh (gebruikt in delen van Noord-Afrika), om te bepalen hoe veel karakters die elk script bevat, ontwerp lettertypen en begeleid voorstellen door een bureaucratisch doolhof van overheidsinstanties en computerstandaarden. Het voordeel zal zichtbaar zijn voor internetgebruikers zoals Mamady Doumbouya, een uitgever uit Philadelphia die voor het eerst een online versie van zijn krant in N'Ko zou kunnen aanbieden. Zonder Unicode kost het zoveel tijd om je computer in te stellen om een ​​krant in N'Ko te lezen, zegt Doumbouya.



Dergelijke veranderingen zullen niet van de ene op de andere dag plaatsvinden. Anderson schat dat het project, dat vorig jaar werd gelanceerd, tien jaar in beslag zal nemen. Tot voor kort hielden computerbedrijven de coderingsinspanningen vol, maar hun interesse neemt af omdat gebruikers van ongecodeerde alfabetten een te kleine markt vertegenwoordigen. Het Berkeley-project maakt deel uit van een grotere inspanning om internet wereldwijd beschikbaar te maken; het World Wide Web Consortium heeft het al mogelijk gemaakt om domeinnamen in deze nieuwe scripts te registreren, wat onder andere betekent dat de URL's van websites de schrijfsystemen kunnen weerspiegelen van de mensen die ze bezitten.

Amerikaanse nationale veiligheidsexperts zijn ook geïnteresseerd. Everette Jordan, hoofd van het National Virtual Translation Center, een nieuw opgerichte Amerikaanse regering die informatie in vreemde talen levert aan de inlichtingengemeenschap, wijst erop dat we technologisch gezien doof, stom en blind zijn als we deze dingen niet kunnen lezen . Maar al snel konden zowel Amerikaanse veiligheidsdiensten als Afrikaanse krantenuitgevers een nieuwe standaard bereiken.

zich verstoppen