Novy model DeepSeek V3.1 bol oficialne vydany 21. augusta 2025. DeepSeek V3.1 je hybridny model, ktory podporuje dva rezimy - rezim uvazovania (thinking) a bez uvazovania (non-thinking), co zlepsuje rychlost a efektivitu odpovedi. Model ma 685 miliard parametrov a rozsirenu kontextovu dlzku az na 128 tisic tokenov, co umoznuje spracovanie vyrazne dlhsich textov ci kodov. Model taktiez prinasa silnejsie schopnosti agenta pre komplexne viackrokove ulohy a lepsie vyuzivanie nastrojov.
Pri vyvoji modelu DeepSeek celila spolocnost viacerym problemom, najma pri ich ocakavanom modeli R2. Podla clankov vo Financial Times a South China Morning Post sa oneskoril kvoli technickym problemom s trenovanim na cipoch Huawei Ascend. Trening sa preto presunul na Nvidia cipy, zatial co cipy Ascend zostali vyuzivane iba pre inferenciu. Tento problem bol hlavnym dovodom odkladu vydania modelu R2 od povodne planovaneho maja 2025. Narusenie nastalo aj v dosledku obmedzeni v exporte americkych cipov do Ciny.
Kvoli tymto problemom prisla spolocnost o cast svojich zakaznikov, ktori presli na nove cinske modely Qwen 3, Kimi K2 ci GLM 4.5. Od 5. septembra sa znacne tiez zvysi cena modelu, hoci stale je jeho cena zlomkom cien poprednych modelov.
Novy model uz je dostupny na testovanie cez oficialnu stranku aj API a prinasa zlepsenu efektivitu, dlhsi kontext a lepsie agentne funkcie. Model som stihol testovat len velmi kratko, vygenerovana Flappy Bird hra bolo o poznanie lepsia ako predchadzajuce verzia.