Deep Seek V3.1 stiže bez pompe
Kineski AI startup DeepSeek objavio je 20. avgusta novo izdanje svog modela V3.1, ali ne kroz klasične promotivne kanale, već preko zatvorene WeChat grupe. Najvažnije unapređenje odnosi se na ogroman kontekstualni kapacitet od 128.000 tokena, što omogućava analizu i obradu sadržaja dužine čitave knjige. Međutim, uz tehnički skok stiglo je i iznenađenje – iz chatbot funkcije uklonjene su oznake vezane za prethodni R1 model, dok o R2 nema novih informacija.
R2 pod znakom pitanja
R2 je prvobitno planiran za lansiranje u maju 2025, ali je više puta odlagan. Najveći izazov bila je odluka da se treniranje obavi na kineskim Huawei Ascend čipovima, u skladu sa državnim pritiscima da se smanji zavisnost od američkog Nvidija. Međutim, problemi poput nestabilne performanse i nedostatka softverske podrške doveli su do neuspeha. Zbog toga je DeepSeek bio prinuđen da se vrati Nvidia hardveru za trening, dok Ascend ostaje u igri samo za inference, objavio je SCMP.
Ni dodatno angažovanje Huawei inženjera nije rešilo problem, a dugotrajan proces obeležavanja podataka dodatno je produžio rokove. Sve to učinilo je da R2 i dalje ostane u fazi čekanja, bez jasnog datuma lansiranja.
Nezadovoljstvo u vrhu kompanije
Prema izveštajima iz kineskih medija, osnivač Liang Wenfeng nije zadovoljan trenutnim performansama R2 modela. On insistira na dodatnim poboljšanjima pre nego što da zeleno svetlo za lansiranje, iako konkurencija, poput Alibaba Qwen3, već koristi priliku da osvoji deo tržišta.
Šira slika: politika i tržište
Ova situacija osvetljava dublje geopolitičke i tehnološke tenzije. S jedne strane, Kina želi da podstakne domaći hardver, ali kvalitet Ascend čipova još uvek ne može da parira Nvidia ekosistemu. S druge, tržište veštačke inteligencije razvija se brže nego što DeepSeek može da odgovori.


