Google DeepMind Tingkatkan Veo 3.1: Hadirkan Kontrol Profesional dan Dukungan Video Vertikal Native

Diedit oleh: Veronika Radoslavskaya

Pada tanggal 13 Januari 2026, Google DeepMind secara resmi memperkenalkan pembaruan fitur yang signifikan untuk model kecerdasan buatan generatif video mereka, Veo 3.1. Fokus utama dari pembaruan ini adalah peluncuran rangkaian alat "Ingredients to Video", yang dirancang untuk memberikan presisi tingkat profesional bagi para kreator konten. Inovasi ini memungkinkan transformasi gambar referensi menjadi gerakan sinematik yang jauh lebih akurat dan terkendali dibandingkan versi sebelumnya.

Salah satu perubahan yang paling dinantikan adalah optimalisasi Veo 3.1 untuk era konten seluler melalui dukungan format vertikal 9:16 secara native. Dengan fitur ini, para pembuat konten dapat menghasilkan video layar penuh berkualitas tinggi yang dioptimalkan untuk platform seperti YouTube Shorts secara langsung. Hal ini mengeliminasi masalah penurunan resolusi atau kehilangan detail visual yang biasanya terjadi ketika kreator terpaksa memotong (cropping) rekaman horizontal untuk menyesuaikan dengan format vertikal.

Selain dukungan format vertikal, Google juga memperkenalkan teknologi peningkatan skala atau 4K upscaling yang sangat canggih. Fitur ini dirancang untuk memenuhi standar tinggi industri produksi video profesional dengan mempertajam tekstur dan memperjelas detail-detail halus dalam setiap bingkai. Hasilnya, klip video yang dihasilkan oleh AI kini memiliki kualitas yang memadai untuk digunakan dalam alur kerja produksi kelas atas maupun untuk ditayangkan di layar lebar dengan kejernihan yang luar biasa.

Pembaruan inti pada sistem "Ingredients to Video" membawa terobosan besar dalam hal konsistensi identitas karakter dan gaya visual. Melalui kerangka kerja yang telah ditingkatkan ini, para pengguna kini memiliki kendali yang lebih mendalam dalam mengarahkan estetika video mereka. Sistem ini memungkinkan integrasi berbagai elemen visual yang berbeda ke dalam satu hasil akhir yang harmonis dan terlihat profesional.

Fitur unggulan pertama dalam sistem ini adalah Triple-Image Referencing. Kemampuan ini memungkinkan pengguna untuk memberikan hingga tiga gambar referensi sekaligus sebagai panduan bagi AI, misalnya gambar karakter tertentu, latar belakang lingkungan, dan referensi gaya visual. Dengan cara ini, Veo 3.1 dapat memastikan bahwa kemiripan wajah atau ciri khas karakter tetap terjaga secara konsisten meskipun karakter tersebut ditempatkan dalam berbagai adegan atau situasi yang berbeda.

Fitur kedua yang tidak kalah revolusioner adalah kontrol bingkai awal dan akhir (First and Last Frame Control). Kemampuan baru yang sangat kuat ini memberikan wewenang kepada kreator untuk menentukan dengan tepat bagaimana sebuah video dimulai dan berakhir. Veo 3.1 kemudian akan bekerja secara cerdas untuk menghasilkan transisi sinematik yang mulus di antara kedua titik tersebut, sambil tetap mempertahankan logika visual dan kesinambungan elemen di sepanjang durasi video.

Untuk memfasilitasi pembuatan narasi yang lebih panjang dan kompleks, Google juga menyertakan fitur Scene Extension. Dengan fitur ini, model dapat memperpanjang durasi video dengan menghasilkan segmen-segmen baru yang didasarkan pada bingkai terakhir dari klip sebelumnya. Hal ini memastikan bahwa kesinambungan visual, pencahayaan, dan dinamika gerakan tetap terjaga dengan sempurna, sehingga memudahkan para pembuat film dalam menyusun cerita yang berkelanjutan.

Veo 3.1 kini juga dilengkapi dengan kecerdasan sinematik yang lebih mumpuni dalam memahami perintah teknis perfilman. Perintah seperti "dolly-in", "pan", atau pengaturan "pencahayaan sinematik" kini dapat diinterpretasikan dengan tingkat akurasi yang jauh lebih tinggi. Hal ini memungkinkan para sutradara digital untuk mendapatkan hasil visual yang sesuai dengan visi artistik mereka tanpa perlu melakukan banyak pengulangan proses generasi.

Melengkapi aspek visualnya, model ini sekarang mampu menghasilkan audio yang tersinkronisasi secara otomatis dengan gerakan dalam video. Audio yang dihasilkan mencakup suara lingkungan (ambient), efek suara (SFX), hingga fitur eksperimental sinkronisasi bibir atau lip-sync untuk karakter. Integrasi audio ini menciptakan pengalaman menonton yang jauh lebih imersif, di mana suara dan gambar bekerja secara sinergis untuk menghidupkan suasana dalam video tersebut.

Mengenai ketersediaannya, fitur-fitur terbaru dari Veo 3.1 ini sedang diintegrasikan secara bertahap ke dalam seluruh ekosistem layanan Google. Para pengguna individu dapat mengakses teknologi ini melalui aplikasi Gemini dan platform pembuatan film Flow. Sementara itu, bagi pengguna skala perusahaan dan pengembang, fitur-fitur ini tersedia melalui Gemini API dan juga Vertex AI, memberikan fleksibilitas penggunaan yang luas di berbagai sektor industri.

Sebagai bagian dari komitmen terhadap keamanan dan transparansi, setiap konten yang dihasilkan oleh Veo 3.1 akan secara otomatis disisipkan dengan tanda air digital SynthID. Teknologi watermarking ini tidak kasat mata namun dapat dideteksi oleh sistem keamanan. Selain itu, pengguna kini memiliki kemampuan untuk memverifikasi asal-usul sebuah video dengan mengunggahnya ke aplikasi Gemini guna memastikan apakah video tersebut merupakan hasil kreasi dari alat kecerdasan buatan milik Google.

50 Tampilan

Sumber-sumber

  • Digital Trends Español

  • Techmeme

  • Veo 3.1 Ingredients to Video: More consistency, creativity and control

  • Google Announces Veo 3.1 and New Flow Capabilities - Thurrott.com

  • Google DeepMind

  • The Best AI Video Generators in 2026: Tested, Reviewed & Ranked - by Jim Clyde Monge

Apakah Anda menemukan kesalahan atau ketidakakuratan?Kami akan mempertimbangkan komentar Anda sesegera mungkin.