DeepSeek: Rekordni kontekst V3.1, tišina oko R2

DeepSeek je lansirao ažuriranje svog osnovnog modela V3.1 sa impresivnim kapacitetom konteksta od 128.000 tokena. Ipak, pažnju je privukla druga stvar – tiho uklanjanje R1 oznaka i potpuna neizvesnost oko sudbine R2 modela.

Vreme Čitanja: < 1 min

deepseek-2840-fi

Izvor: Undplash/ JohnCameron

Deep Seek V3.1 stiže bez pompe

Kineski AI startup DeepSeek objavio je 20. avgusta novo izdanje svog modela V3.1, ali ne kroz klasične promotivne kanale, već preko zatvorene WeChat grupe. Najvažnije unapređenje odnosi se na ogroman kontekstualni kapacitet od 128.000 tokena, što omogućava analizu i obradu sadržaja dužine čitave knjige. Međutim, uz tehnički skok stiglo je i iznenađenje – iz chatbot funkcije uklonjene su oznake vezane za prethodni R1 model, dok o R2 nema novih informacija.

R2 pod znakom pitanja

R2 je prvobitno planiran za lansiranje u maju 2025, ali je više puta odlagan. Najveći izazov bila je odluka da se treniranje obavi na kineskim Huawei Ascend čipovima, u skladu sa državnim pritiscima da se smanji zavisnost od američkog Nvidija. Međutim, problemi poput nestabilne performanse i nedostatka softverske podrške doveli su do neuspeha. Zbog toga je DeepSeek bio prinuđen da se vrati Nvidia hardveru za trening, dok Ascend ostaje u igri samo za inference, objavio je SCMP.

Ni dodatno angažovanje Huawei inženjera nije rešilo problem, a dugotrajan proces obeležavanja podataka dodatno je produžio rokove. Sve to učinilo je da R2 i dalje ostane u fazi čekanja, bez jasnog datuma lansiranja.

Nezadovoljstvo u vrhu kompanije

Prema izveštajima iz kineskih medija, osnivač Liang Wenfeng nije zadovoljan trenutnim performansama R2 modela. On insistira na dodatnim poboljšanjima pre nego što da zeleno svetlo za lansiranje, iako konkurencija, poput Alibaba Qwen3, već koristi priliku da osvoji deo tržišta.

Šira slika: politika i tržište

Ova situacija osvetljava dublje geopolitičke i tehnološke tenzije. S jedne strane, Kina želi da podstakne domaći hardver, ali kvalitet Ascend čipova još uvek ne može da parira Nvidia ekosistemu. S druge, tržište veštačke inteligencije razvija se brže nego što DeepSeek može da odgovori.

Prijavi se na WebMind NJUZLETER, čeka te izbor konkretnih priča i uvida.

Prijavi se na novosti.