Google lanceert Gemini 3
Google lanceert Gemini 3: het tijdperk van 'Deep Think' en autonome AI-agenten breekt aan
Auteur: Veronika Radoslavskaya
Google heeft, twee jaar na de start van de generatieve AI-hausse, officieel Gemini 3 gelanceerd. Dit model claimt een fundamentele verschuiving teweeg te brengen: van chatbots die enkel tekst voorspellen naar AI-agenten die daadwerkelijk kunnen redeneren, plannen en handelen. De lancering omvat twee hoofdniveaus: Gemini 3 Pro, dat per direct beschikbaar is, en de aanzienlijk krachtigere Gemini 3 Deep Think-modus. Deze laatste is specifiek ontworpen om complexe problemen aan te pakken door eerst grondig te 'denken' voordat het een antwoord formuleert.
Het meest opvallende kenmerk van deze nieuwe generatie is de focus op 'mechanistisch redeneren'. De onmiddellijke beschikbaarheid van Gemini 3 Pro demonstreert de nieuwste stand van zaken op het gebied van redeneervermogen. Het behaalde een indrukwekkende score van 91.9% op de uitdagende GPQA Diamond-benchmark en 37.5% op de Humanity's Last Exam (HLE), zonder gebruik te maken van externe hulpmiddelen. Deze capaciteit stelt het model in staat om diepgang en nuance in zowel wetenschap als wiskunde met een hoge mate van betrouwbaarheid te doorgronden.
De nieuwe Deep Think-modus, die binnenkort beschikbaar zal zijn voor Ultra-abonnees, verlegt deze grenzen nog verder. Deze modus is gebouwd om de meest complexe en onbekende problemen op te lossen. Deep Think behaalde een score van 45.1% op ARC-AGI-2, een strenge benchmark die het vermogen van AI test om logische puzzels op te lossen die het nog nooit eerder heeft gezien, en 41.0% op HLE. Deze verbeterde functionaliteit is gericht op oprechte probleemoplossing, ver voorbij standaard informatie-opvraging en synthese.
Voor softwareontwikkelaars introduceert Google tegelijkertijd een nieuw platform genaamd Google Antigravity. Deze 'agent-first' ontwikkelomgeving stelt ingenieurs in staat om samen te werken met AI-agenten die directe toegang hebben tot terminals, browsers en code-editors. In plaats van slechts een regel code automatisch aan te vullen, kunnen deze agenten autonoom complexe softwaretaken plannen, uitvoeren en valideren. Google omschrijft dit als het ultieme hulpmiddel voor 'vibe coding' – een programmeerstijl waarbij de ontwikkelaar zich richt op de creatieve intentie op hoog niveau, terwijl de AI de implementatiedetails afhandelt.
Aan de consumentenkant maakt Gemini 3 gebruik van zijn multimodale capaciteiten en een gigantisch 1 miljoen-token contextvenster. Dit stelt het model in staat om enorme hoeveelheden data te verwerken, wat gelijk staat aan meer dan 1.500 pagina's tekst of complete videocolleges.
Dankzij deze kracht kan Gemini 3 fungeren als een persoonlijke coach. Het model kan bijvoorbeeld een video van een pickleball-wedstrijd van een gebruiker analyseren, specifieke fouten in hun techniek identificeren en vervolgens een trainingsplan op maat genereren. Voor studenten kan het academische papers of lange videotutorials verwerken en interactieve studiehulpmiddelen genereren, zoals flashcards of visualisaties, om hen te helpen de materie onder de knie te krijgen. Het kan zelfs handgeschreven recepten ontcijferen en omzetten in digitale formaten.
Google claimt ook dominantie op de ranglijsten. Gemini 3 Pro heeft de eerste plaats veroverd op LMArena, een crowdsourced benchmarkingsite waar gebruikers AI-modellen blind beoordelen, met een Elo-score van 1501. De onmiddellijke opmars van het model naar de top zet de erfenis voort van zijn voorganger, Gemini 2.5 Pro, die voorheen de zeer competitieve ranglijst aanvoerde.
Het model wordt momenteel uitgerold binnen het hele Google-ecosysteem, inclusief de Gemini-app, Vertex AI en een nieuwe 'AI Mode' in Google Search die interactieve simulaties on-the-fly genereert. Hoewel de 'Deep Think'-modus nog wordt vastgehouden voor de laatste veiligheidscontroles, is het kernmodel Gemini 3 Pro vandaag live. Dit signaleert dat Google klaar is om 'agentic' AI in handen van miljoenen gebruikers te leggen.
Lees meer nieuws over dit onderwerp:
Heb je een fout of onnauwkeurigheid gevonden?
We zullen je opmerkingen zo snel mogelijk in overweging nemen.
