Kuaishou Onthult Kling AI 3.0 met Universele Multimodale Architectuur en Native Audio

Bewerkt door: Veronika Radoslavskaya

Op 5 februari 2026 heeft Kuaishou Technology een belangrijke mijlpaal bereikt in de evolutie van kunstmatige intelligentie met de officiële introductie van de Kling 3.0-modelfamilie. Deze uitgebreide suite omvat Video 3.0, Video 3.0 Omni, Image 3.0 en Image 3.0 Omni. De lancering markeert een fundamentele verschuiving in de industrie: de focus ligt niet langer op het genereren van losstaande, korte fragmenten, maar op het bieden van een volledig geïntegreerd instrumentarium voor het regisseren van complexe, narratieve scènes die voorheen onmogelijk waren met AI.

Een van de meest revolutionaire aspecten van Kling 3.0 is de integratie van geavanceerde Native Audio-mogelijkheden. Waar AI-gegenereerde video's voorheen vaak beperkt bleven tot stille beelden die achteraf van geluid moesten worden voorzien, transformeert deze nieuwe architectuur video's in volledig meeslepende audiovisuele ervaringen. De audio wordt nu gelijktijdig met de beelden gegenereerd, wat zorgt voor een ongekende synergie tussen wat we zien en wat we horen.

  • Meertalige dialoog en accenten: Het systeem ondersteunt de generatie van spraak in het Engels, Chinees, Japans, Koreaans en Spaans. De AI is in staat om subtiele nuances in verschillende accenten te verwerken, zoals het verschil tussen Brits- en Amerikaans-Engels, wat essentieel is voor geloofwaardige storytelling.
  • Complexe interacties tussen personages: De technologie kan dialogen orkestreren tussen maximaal drie verschillende personages binnen een enkele scène. De AI volgt elke spreker nauwgezet, wijst unieke stemtimbres toe en zorgt voor een perfecte lipsynchronisatie die de kijker volledig in het verhaal trekt.
  • Diegetische geluidseffecten en sfeer: Naast gesproken tekst genereert het model ook synchrone geluidseffecten, zoals het geluid van voetstappen op verschillende ondergronden, impactgeluiden en omgevingsruis. Ook de achtergrondmuziek wordt automatisch afgestemd op de visuele sfeer van de scène.

De introductie van de Intelligent Multi-Shot-functionaliteit lost een van de grootste frustraties van AI-videomakers op: het gebrek aan narratieve continuïteit. Gebruikers kunnen nu een samenhangende sequentie van 15 seconden creëren die tot wel zes verschillende camerawisselingen bevat. Dit stelt makers in staat om een verhaal op te bouwen met een begin, midden en eind, allemaal binnen één enkele generatiecyclus.

De AI beschikt over een diepgaand begrip van de wetten van de cinematografie. Hierdoor kan het systeem naadloos schakelen tussen verschillende soorten shots, zoals een wijds overzichtsshot om de locatie te introduceren, gevolgd door een indringende close-up van een personage. Zelfs complexe technieken zoals de shot-reverse-shot, waarbij de camera wisselt tussen twee sprekers in een gesprek, worden met een professionele precisie uitgevoerd.

Een cruciaal aspect van het Video 3.0 Omni-model is de consistentie van het onderwerp. In eerdere AI-modellen veranderden personages of omgevingen vaak van uiterlijk zodra de camerahoek wijzigde, het zogenaamde 'morphing'-effect. Kling 3.0 behoudt de identiteit en de kenmerkende eigenschappen van personages en decors over alle cuts heen, wat een professionele standaard van continuïteit garandeert die voorheen onbereikbaar was.

Ook op het gebied van statische beelden zet Kuaishou nieuwe maatstaven met Image 3.0 Omni. Dit model is specifiek ontwikkeld voor high-end visuele output en ondersteunt resoluties van 2K en 4K. De nadruk ligt hierbij op een superieure naleving van de ingevoerde prompts, waarbij vooral de verwerking van complexe belichtingsinstellingen en de weergave van hyperrealistische texturen indruk maken op professionals in de grafische sector.

Een ander opvallend verbeterpunt is de weergave van tekst binnen beelden en video's. Waar generatieve modellen in het verleden vaak moeite hadden met leesbare letters, tonen de nieuwe modellen van Kuaishou een enorme vooruitgang. Tekst op straatnaamborden, logo's op bedrijfskleding en informatie op digitale schermen wordt nu scherp en correct weergegeven. Bovendien levert Video 3.0 native 1080p-output met een hoge framerate-stabiliteit, wat essentieel is voor vloeiende actiescènes.

Wat betreft de beschikbaarheid is Kling 3.0 op dit moment toegankelijk via een exclusieve vroege toegangsperiode op de officiële webinterface van Kling AI. Voor ontwikkelaars en zakelijke gebruikers die de kracht van deze modellen willen integreren in hun eigen applicaties of workflows, is de technologie beschikbaar via een API-koppeling via de externe partner Fal AI. Hiermee positioneert Kuaishou zich stevig in de voorhoede van de AI-revolutie.

12 Weergaven

Bronnen

  • TechBullion

  • PRNewswire

  • AI NEWS

  • NDTV

  • YouTube

  • Focal

Heb je een fout of onnauwkeurigheid gevonden?We zullen je opmerkingen zo snel mogelijk in overweging nemen.