Dominantie Engelse Taal in AI Werpt Schaduw op Taalkundige Inclusiviteit

Bewerkt door: Vera Mo

De invloed van kunstmatige intelligentie (AI) op de arbeidsmarkt versterkt de positie van het Engels, wat mogelijk leidt tot ongelijkheid. Ongeveer 90% van de trainingsdata voor generatieve AI-systemen is Engelstalig. Deze afhankelijkheid van Engelse data kan niet-Engels sprekenden marginaliseren.

De dominantie van het Engels in AI-trainingsdata komt voort uit historische en technologische ontwikkelingen. AI-systemen die getraind zijn op Engelse data, presteren vaak minder goed in andere talen, wat kan leiden tot uitsluiting. Grote taalmodellen (LLM's) werken goed voor Engelstaligen, maar presteren minder voor sprekers van andere talen.

Er zijn initiatieven om meertalige AI-modellen te ontwikkelen. Microsoft investeert in Europese taaltechnologie met initiatieven rond meertalige modellen. Het bedrijf wil de dominantie van Engelstalige AI-systemen doorbreken door te investeren in datatoegang, cloudinfrastructuur en lokale partnerschappen. Microsoft stelt meertalige datasets beschikbaar via platforms zoals GitHub.

Het is cruciaal dat de voordelen van AI toegankelijk zijn voor iedereen, ongeacht de taal.

Bronnen

  • Financial Post

  • University of Western Australia

  • ITPro

Heb je een fout of onnauwkeurigheid gevonden?

We zullen je opmerkingen zo snel mogelijk in overweging nemen.