TRT Global - Kan Kinas lågkostnads- och öppenkällbaserade DeepSeek demokratisera AI-scenen?

30 januari 2025

Ett tidigare relativt okänt kinesiskt företag har skakat om teknikvärlden med sitt banbrytande tillvägagångssätt för träning och tillgänglighet av stora språkmodeller, och utmanar amerikanska AI-jättar till en bråkdel av kostnaden.

Det Hangzhou-baserade AI-företaget DeepSeek hävdar att det bara tog två månader och mindre än 6 miljoner dollar att bygga en AI-modell med hjälp av Nvidias mindre avancerade H800-chip. Samtidigt har OpenAI, Meta och Google spenderat miljarder på liknande AI-modeller.

Det som verkligen fick DeepSeek att sticka ut var dock inte bara den låga kostnaden utan också deras open source-filosofi, ett radikalt drag som har rört om i den snabbt växande sektorn.

Modellen R1, som släpptes under MIT-licensen, gör det möjligt för vem som helst att ladda ner, anpassa och finjustera den. Medan den följer kinesiska regler för innehållsmoderering inom landet, har användare utanför Kina full frihet att modifiera modellen – en funktion som även anammats av Perplexity AI.

Efter tillkännagivandet av R1-modellen föll aktierna för amerikanska teknikjättar, inklusive Nvidia och företag som stöds av OpenAI, kraftigt, med ett sammanlagt värde på 1 biljon dollar i förlorat marknadsvärde.

USA:s tidigare president Donald Trump beskrev DeepSeek som en “positiv utveckling” men varnade för att det borde fungera som en “väckarklocka” för amerikanska industrier att behålla sin konkurrenskraft.

Nvidia kallade R1 för “ett utmärkt AI-framsteg”, medan en av Silicon Valleys mest inflytelserika riskkapitalister, Marc Andreessen, beskrev det som “AI:s Sputnik”.

OpenAIs VD Sam Altman berömde också den kinesiska konkurrenten och sa att det var “inspirerande att ha en ny konkurrent.”

Nu väcker DeepSeeks kostnadseffektiva tillvägagångssätt en intressant möjlighet: kan detta markera början på en mer inkluderande och tillgänglig AI-era, där innovation inte längre är förbehållen endast teknikjättarna?

‘Förstärkningsinlärning’

DeepSeeks framgång bygger på deras användning av förstärkningsinlärning (RL), en metod som har gjort det möjligt för företaget att undvika de resurskrävande metoder som deras konkurrenter föredrar.

RL-metoden gör det möjligt för system att utveckla avancerade resonemangsförmågor genom att belöna korrekta resultat utan att behöva förmärkta dataset.

Företagets R1-rapport avslöjar att deras modell tränades helt genom denna försök-och-misstag-metod.

Trots denna okonventionella metod uppnådde modellen resultat som är jämförbara med OpenAIs senaste lanseringar och utmärkte sig inom områden som kodningsutmaningar, matematiska problemlösningar och generella resonemangsuppgifter.

“Open source-modeller kan ha en långsammare initial utveckling på grund av begränsade resurser, men de drar nytta av ett bredare spektrum av bidrag och perspektiv, vilket potentiellt leder till mer robusta och anpassningsbara lösningar på lång sikt,” säger Cagatay Odabasi, forskningsingenjör vid Fraunhofer IPA i Stuttgart, Tyskland.

Han tillade att stora företag inte kan matcha den “massiva skalan av mänskliga resurser” som naturligt kommer från ett community-drivet tillvägagångssätt, även om de kan sakna den enorma finansiering som stora företag besitter.

Företagets open source-modell, som börjar på bara 0,50 dollar per månad, har börjat utmana dominansen av dyra, slutna AI-modeller och blev den mest nedladdade gratisappen på Apples App Store i måndags.

“Denna öppenhet sätter utan tvekan press på AI-leverantörer att innovera mer aggressivt för att förbli konkurrenskraftiga, sänka priser och erbjuda bättre villkor gällande användarens integritet,” säger Odabasi till TRT World.

“Det demokratiserar tillgången till kraftfull AI, vilket gör det möjligt för mindre aktörer och forskare att bygga vidare på befintligt arbete och bidra till fältets utveckling.”

Denna störning är särskilt tydlig när den kontrasteras med tidigare kommentarer från Sam Altman, VD för OpenAI.

År 2023 avfärdade Altman idén att ett litet team med en budget på 10 miljoner dollar skulle kunna konkurrera inom AI och kallade det “helt hopplöst.”

DeepSeeks prestationer utmanar nu det påståendet och visar att innovation inte enbart är teknikjättarnas domän.

“Jag tror att när en så kraftfull modell görs öppen, kommer communityn alltid att hitta innovativa sätt att använda och till och med förbättra den effektivt,” tillägger Odabasi.

Skrivet av Edibe Betul Yucer, TRT World skribent.