Microsoft Rilis Tiga Model AI Fondasi Mandiri untuk Persaingan dengan OpenAI dan Google
Diedit oleh: Aleksandr Lytviak
Pada hari Kamis, 2 April 2026, Microsoft secara resmi mengumumkan peluncuran tiga model kecerdasan buatan (AI) fondasi yang dikembangkan secara internal. Manuver strategis ini menegaskan ambisi perusahaan untuk mencapai kemandirian AI dan bersaing langsung dengan laboratorium terkemuka seperti OpenAI dan Google. Inisiatif ini menandai langkah konkret dalam membangun tumpukan AI multimodal milik sendiri, yang mencakup pengenalan ucapan, sintesis suara, dan pembuatan gambar, semuanya tersedia melalui platform pengembangan Microsoft Foundry dan MAI Playground.
Langkah pengembangan ini dipimpin oleh Mustafa Suleyman, CEO Microsoft AI, yang sebelumnya mendirikan DeepMind dan Inflection AI, menunjukkan fokus perusahaan pada inovasi terdepan. Ketiga model baru tersebut adalah MAI-Transcribe-1 untuk konversi suara-ke-teks, MAI-Voice-1 untuk generasi suara, dan MAI-Image-2 sebagai iterasi kedua dari model pembuatan gambar mereka. MAI-Transcribe-1 dilaporkan menetapkan standar akurasi baru di 25 bahasa utama, mencapai Tingkat Kesalahan Kata (WER) rata-rata 3,8% pada tolok ukur FLEURS, melampaui kinerja Whisper-large-v3 milik OpenAI. Model ini juga menawarkan efisiensi signifikan, dengan biaya GPU sekitar 50% lebih rendah dibandingkan alternatif terkemuka, dan kecepatan transkripsi batch 2,5 kali lebih cepat dari penawaran Microsoft Azure Fast sebelumnya.
Di sisi generasi audio, MAI-Voice-1 menunjukkan kemampuan luar biasa dengan dapat menghasilkan 60 detik audio dalam satu detik, sambil mempertahankan nuansa dan identitas pembicara bahkan dalam konten berdurasi panjang. Model ini memungkinkan pengembang membuat suara khusus hanya dari sampel audio singkat, sebuah fitur yang tersedia melalui fitur Suara Pribadi di Azure Speech setelah melalui proses persetujuan kebijakan AI yang bertanggung jawab dari Microsoft. Efisiensi GPU yang tinggi pada MAI-Voice-1 memungkinkan kualitas dan kecepatan yang terjangkau, dengan harga yang diposisikan pada $22 per 1 juta karakter. Sementara itu, MAI-Image-2, model pembuatan gambar generasi kedua, menawarkan peningkatan kecepatan generasi setidaknya dua kali lebih cepat dibandingkan pendahulunya, dan telah menempati posisi tiga besar pada papan peringkat Arena.ai. Model ini dirancang untuk menangani pencahayaan alami, warna kulit yang akurat, dan teks dalam gambar, serta telah diintegrasikan ke dalam produk Microsoft seperti Copilot, Bing, dan PowerPoint, dengan harga ditetapkan pada $5 USD per 1 juta token untuk input teks dan $33 USD per 1 juta token untuk output gambar.
Peluncuran teknologi ini bertepatan dengan upaya Microsoft untuk mengatasi kontroversi seputar Ketentuan Penggunaan (ToS) versi konsumen Copilot, yang secara eksplisit menyatakan bahwa alat tersebut 'hanya untuk tujuan hiburan'. Pernyataan ini menimbulkan kebingungan karena Microsoft secara agresif memasarkan Copilot sebagai alat produktivitas bisnis terintegrasi dalam Microsoft 365. Klausul yang dipermasalahkan ini berakar dari perjanjian yang diperbarui pada Oktober 2025, meskipun tanggal aslinya berasal dari Februari 2023. Sebagai tanggapan atas kritik, seorang juru bicara Microsoft mengonfirmasi bahwa frasa 'hanya untuk tujuan hiburan' adalah 'istilah warisan' yang tidak lagi mencerminkan penggunaan Copilot saat ini dan akan dimodifikasi dalam pembaruan berikutnya. Langkah ini dipandang sebagai upaya perlindungan hukum terhadap masalah halusinasi AI yang umum terjadi pada model bahasa besar (LLM).
Keputusan Microsoft untuk merilis model MAI secara eksklusif di Foundry menunjukkan pergeseran menuju integrasi vertikal yang lebih agresif, mengurangi ketergantungan pada mitra dan memberikan kontrol lebih besar atas tumpukan AI, yang pada akhirnya menawarkan prediktabilitas biaya yang lebih baik bagi pelanggan perusahaan. CEO Satya Nadella sebelumnya telah menekankan pentingnya inovasi produk untuk mendefinisikan dekade mendatang, dan peluncuran ini, yang didukung oleh tim Superintelligence AI yang dipimpin Suleyman, adalah jawaban langsung atas tekanan investor yang menuntut hasil nyata dari pengeluaran infrastruktur AI yang besar.
5 Tampilan
Sumber-sumber
Business Insider
VentureBeat
AI Business
The Register
Business Insider
Mashable
Baca lebih banyak artikel tentang topik ini:
Apakah Anda menemukan kesalahan atau ketidakakuratan?Kami akan mempertimbangkan komentar Anda sesegera mungkin.



