Google's Gemini 2.5 Computer Use: Nieuwe Architectuur Verandert Digitale Interactie

Bewerkt door: Veronika Radoslavskaya

De technologiegemeenschap observeert met grote aandacht de recente introductie van het Gemini 2.5 Computer Use model door Google, in het bijzonder door de divisie Google DeepMind. Deze ontwikkeling belooft een fundamentele verschuiving in de benadering van software-automatisering teweeg te brengen. Het gespecialiseerde kunstmatige intelligentiemodel, dat voortbouwt op de visuele en redeneervermogens van Gemini 2.5 Pro, is specifiek ontwikkeld om menselijke interactie met digitale interfaces nauwkeurig na te bootsen.

De kerninnovatie, die op 7 oktober 2025 werd aangekondigd, behelst een continue, cyclische werking. De AI-agent ontvangt een verzoek, analyseert vervolgens een actuele schermafbeelding van de gebruikersinterface (UI), genereert een specifieke actie zoals typen of klikken, en voert deze direct uit. Dit proces herhaalt zich totdat de volledige taak is afgerond. Deze methode overbrugt de kloof tussen het begrijpen van een opdracht en de fysieke uitvoering ervan binnen een browseromgeving, wat cruciaal is voor complexe digitale taken die directe visuele feedback vereisen.

De prestaties van Gemini 2.5 Computer Use tonen een duidelijke verbetering ten opzichte van voorgangers op het gebied van web- en mobiele besturing, bevestigd door interne en onafhankelijke metingen op benchmarks zoals Online-Mind2Web. gepaard gaande met een significant gereduceerde latentie. Deze snelheid is het resultaat van geoptimaliseerde inferentiepaden binnen de onderliggende Gemini 2.5 Pro-architectuur. Naar schatting overtreft het ook Claude Sonnet 4.5 in bepaalde tests.

Ontwikkelaars krijgen via de Gemini API toegang tot deze nieuwe functionaliteiten, beschikbaar via zowel Google AI Studio als het enterprise-platform Vertex AI. Dit faciliteert de creatie van autonome digitale agenten die complexe workflows aankunnen, zoals het navigeren door meervoudige webpagina's of het uitvoeren van geautomatiseerde UI-tests, waarbij het in staat is om tot 70% van de storingen in testruns te herstellen. De mogelijkheid om achter inlogschermen te opereren en dynamische elementen te manipuleren, opent nieuwe perspectieven voor de automatisering van repetitieve digitale processen.

De introductie van deze krachtige instrumenten brengt de noodzaak van verantwoorde implementatie met zich mee, gezien het vermogen om menselijke interactie te spiegelen. De focus ligt op het inzetten van deze efficiëntie om menselijke inspanning bij visueel belastende en repetitieve taken te verminderen. Hierdoor ontstaat ruimte voor mensen om zich te concentreren op creatieve en strategische aspecten die de technologie nog niet kan overnemen, wat leidt tot een gestroomlijnde digitale omgeving.

Bronnen

  • El Español

  • Introducing the Gemini 2.5 Computer Use model

  • Google's AI can now surf the web for you, click on buttons, and fill out forms with Gemini 2.5 Computer Use

  • Google announces Gemini 2.5 Computer Use AI model that can control web browsers like humans do

Heb je een fout of onnauwkeurigheid gevonden?

We zullen je opmerkingen zo snel mogelijk in overweging nemen.