Meta berobban a piacra az új Llama 4 mesterséges intelligencia modellcsaláddal

Meta berobban a piacra az új Llama 4 mesterséges intelligencia modellcsaláddal

Szokatlan időzítéssel, szombaton jelentette be a Meta az új Llama 4 mesterséges intelligencia modellcsaládját. A bejelentés három új modellről szól: ezek a Llama 4 Scout, a Llama 4 Maverick, és a még fejlesztés alatt álló Llama 4 Behemoth. Mindhárom modellt szövegek, képek és videók hatalmas mennyiségén tanították, ami széleskörű vizuális értelmezési képességeket biztosít számukra.

Kínai kihívásra válaszolva

Szakmai körökben már régóta beszélik, hogy a kínai DeepSeek AI laboratórium nyílt modelljeinek sikere jelentősen befolyásolta a Meta stratégiáját. A DeepSeek modelljei ugyanis hasonló vagy jobb teljesítményt nyújtanak, mint a Meta korábbi zászlóshajó Llama modelljei, ráadásul alacsonyabb működtetési költségekkel. Válaszul a Meta állítólag „háborús szobákat” állított fel, hogy megfejtsék, hogyan csökkentette a DeepSeek az R1 és V3 modellek futtatási és telepítési költségeit.


Hirdetés:



Elérhetőség és korlátozások

A Scout és a Maverick már elérhető a Llama.com oldalon és a Meta partnereinél, beleértve a Hugging Face AI fejlesztői platformot is. A Meta AI asszisztens, amely a WhatsApp, Messenger és Instagram alkalmazásokban működik, már 40 országban frissült a Llama 4 technológiával, bár a multimodális funkciók egyelőre csak az Egyesült Államokban érhetők el angol nyelven.

Érdekes fejlemény, hogy az EU-ban székhellyel vagy „fő üzleti tevékenységgel” rendelkező felhasználók és vállalatok számára tilos a modellek használata és terjesztése. Ez valószínűleg a régió szigorú AI és adatvédelmi törvényeinek köszönhető, amelyeket a Meta korábban túlzottan megterhelőnek nevezett. Ahogy a korábbi Llama kiadásoknál, a 700 millió havi aktív felhasználónál nagyobb vállalatoknak külön engedélyt kell kérniük a Meta-tól, amit a vállalat saját belátása szerint adhat vagy tagadhat meg.

Technikai újítások

A Llama 4 a Meta első olyan modellcsaládja, amely „szakértők keveréke” (mixture of experts, MoE) architektúrát alkalmaz, ami hatékonyabb számítási teljesítményt biztosít mind a betanítás, mind a lekérdezések során. Ez az architektúra gyakorlatilag felosztja az adatfeldolgozási feladatokat részfeladatokra, majd kisebb, specializált „szakértő” modellekhez rendeli őket.

A Maverick például összesen 400 milliárd paraméterrel rendelkezik, de csak 17 milliárd aktív paramétere van 128 „szakértő” között elosztva. A Scout 17 milliárd aktív paraméterrel, 16 szakértővel és összesen 109 milliárd paraméterrel büszkélkedhet. A Meta belső tesztjei szerint a Maverick, amely a vállalat szerint legjobban az olyan általános asszisztensi és csevegési felhasználási esetekre alkalmas, mint a kreatív írás, bizonyos kódolási, érvelési, többnyelvű, hosszú kontextusú és képfeldolgozási feladatokban felülmúlja az OpenAI GPT-4o és a Google Gemini 2.0 modelljeit.

Scout: a dokumentumkezelés bajnoka

A Scout erősségei a dokumentumok összefoglalása és a nagy kódbázisok értelmezése. Egyedülálló tulajdonsága a rendkívül nagy kontextusablak: 10 millió token. Ez azt jelenti, hogy képes képeket és akár több millió szót is feldolgozni, lehetővé téve rendkívül hosszú dokumentumok feldolgozását és értelmezését. A Scout egyetlen Nvidia H100 GPU-n futtatható, míg a Maverick Nvidia H100 DGX rendszert vagy azzal egyenértékű hardvert igényel.

Behemoth: a gigász a láthatáron

A Meta még kiadatlan Behemoth modellje még komolyabb hardvert igényel majd. A vállalat szerint a Behemoth 288 milliárd aktív paraméterrel, 16 szakértővel és közel két billió összes paraméterrel rendelkezik. A Meta belső tesztjei szerint a Behemoth felülmúlja a GPT-4.5-öt, a Claude 3.7 Sonnet-et és a Gemini 2.0 Pro-t (de a 2.5 Pro-t nem) számos olyan értékelésen, amely a STEM-készségeket, például a matematikai problémamegoldást méri.

Politikai semlegesség kérdése

Érdekes módon a Meta azt állítja, hogy a Llama 4 modelleket úgy hangolták, hogy ritkábban utasítsák el a „vitatott” kérdésekre való válaszadást. A vállalat szerint a Llama 4 olyan vitatott politikai és társadalmi témákra is válaszol, amelyekre a korábbi Llama modellek nem reagáltak volna. Emellett a vállalat szerint a Llama 4 „drámaian kiegyensúlyozottabb” abban a tekintetben, hogy mely kérdéseket utasítja kategorikusan el.

Ez a fejlesztés akkor történik, amikor az USA-ban egyes politikai szereplők, köztük Donald Trump elnök szövetségesei, azzal vádolják az AI chatbotokat, hogy politikailag túlságosan „woke” szemléletűek. Elon Musk és David Sacks, Trump kripto és AI „cárja” például azt állította, hogy a népszerű AI chatbotok cenzúrázzák a konzervatív nézeteket.

A borító képet FLUX.1-dev képgenerátor készítette az alábbi prompt alapján: Modern AI lab with advanced computer servers, engineers working on AI models, blue and white glowing screens showing data patterns, professional setting, photorealistic, high detail.