De Chinese AI-ontwikkelaar DeepSeek heeft op 29 september 2025 de lancering aangekondigd van hun experimentele AI-model, DeepSeek-V3.2-Exp. Dit model is ontworpen om de efficiëntie bij het verwerken van lange tekstsequenties aanzienlijk te verbeteren, wat een belangrijke stap is voor toekomstige AI-architecturen. Tegelijkertijd heeft DeepSeek de prijzen van hun ontwikkelaars-API met meer dan 50% verlaagd, wat de toegang tot geavanceerde AI-oplossingen vergroot.
Het DeepSeek-V3.2-Exp model bouwt voort op de V3.1-Terminus architectuur en introduceert DeepSeek Sparse Attention (DSA). Deze innovatieve techniek maakt selectievere berekeningen van aandachtsgewichten mogelijk, wat resulteert in een drastische vermindering van de computationele complexiteit en het geheugengebruik, vooral bij lange teksten. Traditionele modellen hebben vaak moeite met het behouden van context over langere invoer, maar DSA verbetert de efficiëntie van training en inferentie aanzienlijk zonder de outputkwaliteit significant aan te tasten. De prestaties van V3.2-Exp zijn vergelijkbaar met die van V3.1-Terminus, met lichte verbeteringen op sommige benchmarks.
De prijsverlaging van meer dan 50% op de API is een strategische zet om de marktpositie van DeepSeek te versterken en een bredere gemeenschap van ontwikkelaars en bedrijven te bedienen. Deze prijsdaling, die per 29 september 2025 van kracht is, maakt geavanceerde AI-oplossingen toegankelijker voor startups en kleinere organisaties. Met deze actie positioneert DeepSeek zich als een belangrijke speler die betaalbare, hoogwaardige AI-oplossingen biedt voor data-intensieve taken.
De aankondiging werd gedaan op het Hugging Face developer forum, een belangrijk platform voor de AI-gemeenschap. De beschikbaarheid van het V3.2-Exp model via dit platform, samen met open-source code en kernels, verlaagt de drempel voor adoptie en innovatie. DeepSeek's focus op efficiëntie bij lange tekstsequenties sluit aan bij de groeiende vraag naar AI-toepassingen in sectoren zoals financiën en gezondheidszorg, waar real-time verwerking van grote datasets essentieel is.