
Kína AI csillaga rekordidő alatt tört az élre az almás piactéren
A kínai DeepSeek AI asszisztense váratlanul az Apple App Store és a Google Play listák élére kúszott fel az elmúlt hetekben. A kínai mesterséges intelligencia fejlesztő cég neve nem csengett ismerősen a szélesebb közönség számára, mostanra viszont több tekintetben is felkavarta az állóvizet a nagy amerikai techcégek által dominált piacon.
Pénzügyi háttér és fiatalos lendület
A DeepSeek mögött a High-Flyer Capital Management áll, egy kínai kvantitatív hedge fund, amely AI algoritmusokat használ kereskedési döntéseinek meghozatalához. A pénzügyi vállalkozás maga is viszonylag újnak számít, hiszen csak 2019-ben indult, alapítója Liang Wenfeng, aki már egyetemi évei alatt is foglalkozott algoritmikus kereskedéssel. A befektetési cég 2023-ban hozta létre a DeepSeek labort a pénzügyi üzletágtól elkülönülve, ami aztán önálló vállalattá alakult.
Hirdetés:
A cég fejlesztői csapata meglepően fiatal szakemberekből áll. A DeepSeek agresszívan toboroz doktori végzettségű AI kutatókat a legjobb kínai egyetemekről, de olyan munkatársakat is alkalmaz, akiknek nincs programozói hátterük, hogy modelljei minél szélesebb szakterületeken nyújthassanak releváns válaszokat.
Modellek, amelyek felvették a versenyt a nagyokkal
Bár a DeepSeek első modelljei (DeepSeek Coder, DeepSeek LLM és DeepSeek Chat) már 2023 novemberében megjelentek, az igazi áttörést a 2024 tavaszán bemutatott DeepSeek-V2 modellek hozták el. Ezek a generatív AI rendszerek nemcsak jól teljesítettek a különböző teljesítményteszteken, de jóval olcsóbban voltak üzemeltethetők, mint a versenytársak hasonló megoldásai.
Decemberben bemutatkozó DeepSeek-V3 modell csak tovább növelte a cég hírnevét. A vállalat saját tesztjei szerint felülmúlja mind a nyílt forrású modelleket, mint például a Meta Llama-t, mind a „zárt” megoldásokat, köztük az OpenAI GPT-4o-t.
Különösen figyelemreméltó a januárban kiadott DeepSeek R1 „reasoning” (érvelő) modell. Ez a típusú AI másodpercekkel vagy akár percekkel hosszabb idő alatt jut el a megoldásig, mint a hagyományos modellek, viszont megbízhatóbb eredményeket produkál fizikai, tudományos és matematikai feladatoknál. A fejlesztő szerint teljesítménye eléri az OpenAI o1 modelljének szintjét.
Természetesen a kínai fejlesztésű mesterséges intelligencia sem tökéletes. A kínai internetszabályozó hatóság ellenőrzi, hogy a modellek „megtestesítsék a szocialista alapértékeket”, így például a DeepSeek chatbotja nem válaszol a Tienanmen térrel vagy Tajvan autonómiájával kapcsolatos kérdésekre.
Felforgató üzleti stratégia
A DeepSeek üzleti modellje meglehetősen szokatlan. Szolgáltatásait jóval a piaci ár alatt kínálja, sőt, bizonyos termékeit ingyen is elérhetővé teszi. Mindezt annak ellenére, hogy a beszámolók szerint rengeteg kockázati tőkés érdeklődik a cég iránt. A vállalat szerint hatékonysági áttöréseik teszik lehetővé, hogy ilyen versenyelőnyt élvezzenek a költségek terén, bár egyes szakértők vitatják a cég által közölt számokat.
A fejlesztők mindenesetre kedvelik a DeepSeek modelljeit, amelyek nem nyílt forrásúak a szó hagyományos értelmében, de olyan engedélyekkel érhetők el, amelyek kereskedelmi felhasználást is lehetővé tesznek. A Hugging Face vezérigazgatója, Clem Delangue szerint platformjukon a fejlesztők több mint 500 származékos modellt hoztak létre az R1 alapján, és ezeket összesen 2,5 millió alkalommal töltötték le.
A kínai AI cég sikere megosztja a technológiai szektort. Míg a Microsoft bejelentette, hogy a DeepSeek szolgáltatásai elérhetők lesznek Azure AI Foundry platformján, addig az OpenAI „államilag támogatott” és „államilag irányított” rendszerként jellemezte a DeepSeek-et, és javasolta az amerikai kormánynak, hogy fontolja meg betiltását.
Több kormányzat, köztük Dél-Korea és New York állam már megtiltotta a DeepSeek használatát hivatalos eszközökön. Márciusban az amerikai kereskedelmi minisztérium több hivatala is hasonló lépést tett. A Wall Street Journal beszámolója szerint várhatóan az egész amerikai kormányzaton belül betiltják majd a kínai AI használatát.
A borító képet FLUX.1-dev képgenerátor készítette az alábbi prompt alapján: A professional businessman using AI on a digital tablet, with neon blue Chinese and English writing reflected in his glasses, futuristic urban setting, depth of field.