Naujasis „Deepseek“ atvirojo kodo AI samprotavimo modelis R1 sukėlė „NVIDIA“ akcijų išpardavimą ir sukėlė vartotojui programą, kuri pakilo į programų parduotuvių viršūnę.
Praėjusį mėnesį „Deepseek“ teigė, kad jis išmokė modelį, naudodamas maždaug 2 000 NVIDIA H800 GPU duomenų centrą per maždaug du mėnesius, kainuojant apie 5,5 mln. USD. Praėjusią savaitę ji paskelbė dokumentą, kuriame parodyta, kad naujausias jo modelio pasirodymas atitiko pažangiausius samprotavimo modelius pasaulyje. Šie modeliai yra mokomi duomenų centruose, kurie išleidžia milijardus greitesniam, labai brangiam NVIDIA, labai brangioms AI lustai.
Technologijų pramonės reakcija į aukštos kokybės ir mažesnių išlaidų modelį „Deepseek“ buvo laukinė. Pvz.
„Gelsinger“, be abejo, yra neseniai buvęs „Intel“, aparatūros inžinieriaus „Intel“ generalinis direktorius ir dabartinis savo „IPO“ sujungto startuolio „GLOO“, pranešimų ir sužadėtuvių platformos bažnyčioms pirmininkas. Jis paliko „Intel“ gruodį po ketverių metų ir bandė vytis „Nvidia“ su „Intel“ alternatyvia AI GPU, „Gaudi 3 AI“.
„Gelsinger“ rašė, kad „Deepseek“ turėtų priminti technologijų pramonei apie tris svarbiausias pamokas: mažesnės išlaidos reiškia platesnį priėmimą; išradingumas klesti suvaržant; ir „Atviros pergalės. „Deepseek“ padės iš naujo nustatyti vis labiau uždarą pagrindinio AI modelio darbo pasaulį “, – rašė jis. „Openai“ ir „Anthropic“ yra uždaras šaltinis.
„Gelsinger“ pasakojo „TechCrunch“, kad R1 yra toks įspūdingas, „Gloo“ jau nusprendė nepriimti ir mokėti už „Openai“. „GLOO“ kuria AI paslaugą, vadinamą Kallm, kuri siūlys pokalbių programą ir kitas paslaugas.
„Šiandien mano klijų inžinieriai veikia R1“, – sakė jis. „Jie galėjo paleisti O1 – gerai, per API jie gali pasiekti tik O1.“
Vietoj to, per dvi savaites „Gloo“ tikisi, kad „Kallm“ atstatys „Kallm“ nuo mūsų pačių pagrindinio modelio, kuris yra visas atviras kodas “, – sakė jis. „Tai įdomu“.
Jis sakė, kad, jo manymu, „Deepseek“ padarys AI tokią prieinamą, o AI nebus tik visur. Gerai PG bus visur. „Aš noriu geresnio AI savo„ Oura “žiede. Noriu geresnio AI savo klausos aparate. Noriu daugiau AI savo telefone. Aš noriu geresnio AI savo įterptuose įrenginiuose, pavyzdžiui, balso atpažinimas mano EV “, – sako jis.
Laiminga Gelsingerio reakcija galbūt prieštaravo kitiems, kurie buvo mažiau sužavėti, kad samprotavimai pagrindiniai modeliai dabar turi aukštesnio efektyvumo ir kur kas prieinamesnį iššūkį. PG augo brangiau, o ne mažiau.
Kiti reagavo, nurodydami, kad „Deepseek“ turėjo kažkaip suklaidinti savo numerius, ir mokymai turėjo būti brangesni. Kai kurie manė, kad ji negalėjo pasakyti, kad ji naudojo aukštesnės klasės lustus dėl mūsų AI mikroschemų eksporto apribojimų į Kiniją. Kiti savo pasirodyme pakėlė skylutes, ieškodami vietų, kuriose kiti modeliai sekėsi geriau. Dar kiti mano, kad kitas „Openai“ modelis „O3“ taip pralys R1, kai jis bus išleistas, kad status quo bus suremontuotas.
Gelsingeris visa tai gūžčioja pečiais. „Niekada neturėsite visiško skaidrumo, atsižvelgiant į didžiąją dalį darbo Kinijoje“, – sakė jis. „Tačiau vis dėlto visi įrodymai yra tai, kad jų mokymuose yra 10–50 kartų pigiau nei O1“.
„Deepseek“ įrodo, kad AI gali būti perkelta į priekį „inžinerinio kūrybiškumo metu, neišmesdami daugiau aparatūros galios ir apskaičiuojant problemą. Taigi tai jaudina “, – sakė jis.
Kalbant apie tai, kad tai yra Kinijos kūrėjas, turintis viską, kas reiškia, pavyzdžiui, susirūpinimą dėl privatumo ir cenzūros, Gelsingeris metaforiškai sukrėtė galvą.
„Tai, kad kinai mums primena atvirų ekosistemų galią, galbūt yra gėda mūsų bendruomenei, Vakarų pasauliui“, – sakė jis.
„TechCrunch“ turi AI orientuotą informacinį biuletenį! Prisiregistruokite čia, kad gautumėte gautuosius kiekvieną trečiadienį.