Microsoft lanceert drie interne AI-modellen in concurrentiestrijd met OpenAI en Google

Bewerkt door: Aleksandr Lytviak

Op donderdag 2 april 2026 heeft Microsoft een strategische stap gezet met de introductie van drie nieuw ontwikkelde fundamentele AI-modellen. Deze lancering positioneert het bedrijf in directe concurrentie met toonaangevende laboratoria zoals OpenAI en Google. De modellen worden beschikbaar gesteld via het Microsoft Foundry-platform en de MAI Playground, wat duidt op een verschuiving naar wat CEO Mustafa Suleyman van Microsoft AI 'AI-zelfvoorziening' noemt. Deze ontwikkeling volgt op een reorganisatie in maart, waarbij CEO Satya Nadella de focus van Suleyman verlegde naar de ontwikkeling van grensverleggende modellen en superintelligentie.

De nieuwe reeks omvat MAI-Transcribe-1 voor spraak-naar-tekst, MAI-Voice-1 voor stemgeneratie en MAI-Image-2 voor beeldcreatie, waarmee Microsoft zijn eigen technologische infrastructuur verstevigt. MAI-Transcribe-1, een model van de eerste generatie, claimt een nieuw nauwkeurigheidsniveau voor transcriptie in de 25 meest gebruikte talen. Microsoft stelt dat dit model een gemiddelde Word Error Rate (WER) van 3,8% behaalt op de FLEURS-benchmarks, waarmee het beter presteert dan OpenAI's Whisper-large-v3 (4,2%) en Gemini 3.1 Flash (4,9%). Daarnaast opereert het model naar verluidt met ongeveer 50% lagere GPU-kosten en is de batch-transcription snelheid 2,5 keer sneller dan het bestaande Azure Fast-aanbod. Dit model wordt momenteel getest in de Spraakmodus van Copilot en voor conversietranscriptie in Microsoft Teams.

MAI-Voice-1 is een geavanceerd spraakgeneratiemodel dat in staat is om 60 seconden aan natuurlijke audio te produceren in één seconde, met behoud van de identiteit van de spreker, zelfs bij langere content. Ontwikkelaars kunnen via Microsoft Foundry aangepaste stemmen creëren met slechts enkele seconden aan voorbeeldmateriaal; de prijsstelling is vastgesteld op $22 per miljoen tekens. Samen met MAI-Transcribe-1 vormt deze audiostack een oplossing ter ondersteuning van workflows in callcenters en andere spraakgestuurde diensten, zoals live ondertiteling. MAI-Image-2, de tweede generatie van Microsofts beeldgeneratiemodel, biedt een verdubbeling van de generatiesnelheid ten opzichte van zijn voorganger en is gedebuteerd als een top-drie familie op het Arena.ai-leaderboard. Dit model wordt momenteel uitgerold in Bing en PowerPoint, met een focus op het leveren van natuurlijke belichting en accurate huidtinten.

De beschikbaarheid van deze drie modellen via Foundry en de MAI Playground, waarbij de Playground momenteel alleen toegankelijk is in de VS, positioneert Microsoft agressief in de markt met prijzen die zijn ontworpen om interne kosten te verlagen en druk uit te oefenen op gespecialiseerde startups. Parallel hieraan wordt Microsoft geconfronteerd met kritiek over de consumentenvoorwaarden van Copilot, die de tool 'uitsluitend voor amusementsdoeleinden' bestempelen en gebruikers 'op eigen risico' laten handelen. Deze clausule, die dateert van een overeenkomst uit februari 2023 en werd bijgewerkt in oktober 2025, staat in contrast met de marketing van Copilot als een essentieel hulpmiddel voor zakelijke productiviteit binnen Microsoft 365. Een woordvoerder van het bedrijf heeft deze formulering bestempeld als 'legacy taal' die niet langer de huidige functionaliteit weerspiegelt en die in de volgende update zal worden aangepast. Concurrenten hanteren vergelijkbare aansprakelijkheidsbeperkingen, maar vermijden de expliciete term 'amusement', wat de aanhoudende juridische en marketingambiguïteit rond consumentgerichte generatieve AI-tools benadrukt.

5 Weergaven

Bronnen

  • Business Insider

  • VentureBeat

  • AI Business

  • The Register

  • Business Insider

  • Mashable

Heb je een fout of onnauwkeurigheid gevonden?We zullen je opmerkingen zo snel mogelijk in overweging nemen.