Een voorheen weinig bekend Chinees bedrijf heeft de techwereld opgeschud met zijn baanbrekende aanpak van training en toegankelijkheid van grote taalmodellen, waarmee het Amerikaanse AI-giganten uitdaagt tegen slechts een fractie van de kosten.
Het in Hangzhou gevestigde AI-bedrijf DeepSeek beweert dat het slechts twee maanden en minder dan $6 miljoen heeft gekost om een AI-model te bouwen met behulp van Nvidia's minder geavanceerde H800-chips. Ter vergelijking: OpenAI, Meta en Google hebben miljarden uitgegeven aan vergelijkbare AI-modellen.
Wat DeepSeek echter echt onderscheidt, is niet alleen de lage kosten, maar ook de open-sourcefilosofie. Deze radicale stap heeft flink wat opschudding veroorzaakt in de snelgroeiende sector.
Het R1-model, uitgebracht onder de MIT-licentie, stelt iedereen in staat om het te downloaden, aan te passen en te verfijnen. Hoewel het model binnen China voldoet aan de regels voor inhoudsmoderatie, hebben gebruikers buiten China volledige vrijheid om het model te wijzigen — een kenmerk dat ook wordt toegepast door Perplexity AI.
Na de aankondiging van het R1-model daalden de aandelen van grote Amerikaanse techbedrijven, waaronder Nvidia en door OpenAI gesteunde bedrijven, scherp. Gezamenlijk verloren ze een marktwaarde van $1 biljoen.
De Amerikaanse president Donald Trump noemde DeepSeek een “positieve ontwikkeling”, maar waarschuwde dat het een “wake-up call” zou moeten zijn voor Amerikaanse industrieën om hun concurrentiepositie te behouden.
Nvidia beschreef R1 als “een uitstekende AI-vooruitgang”, terwijl een van de meest invloedrijke durfkapitalisten in Silicon Valley, Marc Andreessen, het omschreef als “AI’s Sputnik”. OpenAI-CEO Sam Altman prees ook de Chinese concurrent en noemde het “verfrissend om een nieuwe concurrent te hebben”.
De kostenbesparende aanpak van het Chinese bedrijf roept nu een intrigerende vraag op: zou dit het begin kunnen zijn van een meer inclusieve en toegankelijke AI-tijdperk, waarin innovatie niet langer het exclusieve domein is van techreuzen?
‘Reinforcement learning’
Het succes van DeepSeek is te danken aan het gebruik van reinforcement learning (RL), een methode waarmee het bedrijf de middelenintensieve methoden van zijn concurrenten heeft kunnen vermijden.
De RL-methode stelt systemen in staat om geavanceerde redeneervaardigheden te ontwikkelen door correcte uitkomsten te belonen zonder dat vooraf gelabelde datasets nodig zijn. Het R1-paper van het bedrijf onthult dat het model volledig is getraind via deze trial-and-error-methode.
Ondanks deze onconventionele aanpak behaalde het model resultaten die vergelijkbaar zijn met de nieuwste releases van OpenAI. Het excelleerde in gebieden zoals programmeeruitdagingen, wiskundige probleemoplossing en algemene redeneertaken.
“Open-sourcemodellen kunnen in het begin langzamer ontwikkelen vanwege beperkte middelen, maar ze profiteren van een breder scala aan bijdragen en perspectieven, wat op de lange termijn kan leiden tot robuustere en beter aanpasbare oplossingen,” zegt Cagatay Odabasi, onderzoeksingenieur bij Fraunhofer IPA in Stuttgart, Duitsland.
Hij voegde eraan toe dat grote bedrijven niet kunnen tippen aan de “massale schaal van menselijke middelen” die van nature voortkomt uit een gemeenschapsgerichte aanpak, terwijl ze ook vaak niet beschikken over de enorme financiering die grote bedrijven hebben.
Het open-sourcemodel van het bedrijf, dat begint bij slechts $0,50 per maand, heeft de dominantie van dure, gesloten AI-modellen uitgedaagd en werd maandag de nummer 1 gratis gedownloade app in de Apple App Store.
“Deze openheid zet AI-aanbieders ongetwijfeld onder druk om agressiever te innoveren om concurrerend te blijven, prijzen te verlagen en betere voorwaarden te bieden met betrekking tot gebruikersprivacy,” vertelt Odabasi aan TRT World.
“Het democratiseert de toegang tot krachtige AI, waardoor kleinere spelers en onderzoekers kunnen voortbouwen op bestaand werk en kunnen bijdragen aan de vooruitgang van het vakgebied.”
Deze verstoring is vooral zichtbaar in contrast met eerdere opmerkingen van Sam Altman, de CEO van OpenAI. In 2023 verwierp Altman het idee dat een klein team met een budget van $10 miljoen zou kunnen concurreren in AI en noemde het “volledig hopeloos”.
De prestaties van DeepSeek dagen die bewering nu uit en tonen aan dat innovatie niet uitsluitend het domein is van techreuzen.
“Ik geloof dat zodra zo'n krachtig model open wordt gemaakt, de gemeenschap altijd innovatieve manieren zal vinden om het efficiënt te gebruiken en zelfs te verbeteren,” voegt Odabasi toe.