Microsoft führt drei Basismodelle für KI-Wettbewerb mit OpenAI und Google ein

Bearbeitet von: Aleksandr Lytviak

Microsoft hat am Donnerstag, dem 2. April 2026, einen strategischen Schritt zur forcierten KI-Selbstständigkeit vollzogen und drei neu entwickelte, proprietäre Basismodelle für die kommerzielle Nutzung freigegeben. Diese Modelle, die über die Plattform Microsoft Foundry und den MAI Playground bereitgestellt werden, sollen die Abhängigkeit des Unternehmens von externen Entwicklungslaboren wie OpenAI und Google reduzieren und Microsoft als unabhängigen Akteur in zentralen Bereichen der künstlichen Intelligenz etablieren.

Die Einführung der Modelle fällt in eine Zeit, in der Microsoft auch die jüngste Kontroverse um die Nutzungsbedingungen des Verbraucher-Copilots aufarbeiten muss, was die doppelte Herausforderung des Konzerns – technologische Führung und rechtliche Klarheit – verdeutlicht. Die drei Modelle decken kritische kommerzielle Modalitäten ab: MAI-Transcribe-1 für die Sprachumwandlung, MAI-Voice-1 für die Sprachsynthese und MAI-Image-2 für die Bilderzeugung. Die Entwicklung dieser Modelle, insbesondere des Sprachmodells, das von einem zehnköpfigen Team realisiert wurde, signalisiert eine Effizienzsteigerung innerhalb der Microsoft AI Superintelligence-Einheit unter der Leitung von CEO Mustafa Suleyman.

MAI-Transcribe-1 setzt laut Unternehmensangaben einen neuen Genauigkeitsstandard und erreichte auf den FLEURS-Benchmarks eine durchschnittliche Wortfehlerrate (WER) von 3,8 Prozent über 25 Hauptsprachen. Dieser Wert übertrifft die Leistung von OpenAIs Whisper-large-v3 in allen 25 Sprachen und liegt vor Googles Gemini 3.1 Flash in 22 der 25 getesteten Sprachen. MAI-Voice-1 ergänzt die Audio-Pipeline und kann 60 Sekunden Audio in weniger als einer Sekunde auf einer einzigen GPU generieren, wobei das Modell die Erstellung kundenspezifischer Stimmen aus kurzen Samples unterstützt. Die Preisgestaltung für MAI-Transcribe-1 beginnt aggressiv bei 0,36 USD pro Stunde, eine bewusste Entscheidung zur Wettbewerbsfähigkeit gegenüber Anbietern wie Amazon und Google.

MAI-Image-2, die zweite Generation des Bildmodells, belegt den dritten Platz in der Arena.ai Text-zu-Bild-Rangliste, hinter den führenden Modellen von Google und OpenAI. Die Entwickler legten bei MAI-Image-2 Wert auf verbesserte Photorealistik und die Fähigkeit, lesbaren Text in generierten Bildern darzustellen. Parallel zu diesen technologischen Fortschritten steht Microsoft wegen der Inkonsistenz seiner Produktkommunikation in der Kritik. Die Nutzungsbedingungen der Verbraucherversion von Copilot enthielten eine Klausel, die das Tool „nur zu Unterhaltungszwecken“ deklarierte, was im Widerspruch zur Vermarktung von Microsoft 365 Copilot als unverzichtbares Produktivitätswerkzeug durch CEO Satya Nadella steht. Ein Unternehmenssprecher erklärte, diese „Legacy-Term“ werde in der nächsten Aktualisierung entfernt, da sie die tatsächliche Nutzung nicht mehr widerspiegele.

Die Strategie von Microsoft AI unter Mustafa Suleyman zielt darauf ab, die Kontrolle über den gesamten KI-Stack zu gewinnen, was durch die Bereitstellung eigener, wettbewerbsfähiger Modelle untermauert wird. Während die Einführung der MAI-Modelle die technologische Unabhängigkeit von OpenAI vorantreibt, wirft die anhaltende Präsenz der Haftungsausschlussklausel Fragen zur rechtlichen Absicherung für Endverbraucher auf. Wettbewerber wie Anthropic und Meta nutzen ähnliche Haftungsausschlüsse, vermeiden jedoch die explizite Einschränkung auf „Unterhaltungszwecke“.

5 Ansichten

Quellen

  • Business Insider

  • VentureBeat

  • AI Business

  • The Register

  • Business Insider

  • Mashable

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.