A 12 legfontosabb mesterségesintelligencia-modell, ami idén eddig megjelent

2025.03.31.2025.03.31. Hartung Ariel Szövegírás

Az idei év első negyedére a nagy technológiai vállalatok már mind előrukkoltak legújabb MI-modelljeikkel. A várakozásoknak megfelelően a fejlesztők közötti verseny még intenzívebbé vált: a gondolkodó modellek dominálnak, miközben a multimodális képességek alapelvárássá váltak.

Az árazási stratégiák egyre inkább szétválnak. Míg néhány vállalat az alap funkcionalitást ingyenesen kínálja, a leginnovatívabb modellek előfizetési díjai már a havi 200 dollárt is elérik. Különösen figyelemreméltó az a tendencia, hogy az infrastruktúra fejlődésével a kontextusablakok mérete exponenciálisan növekszik – egyes modellek már egymillió tokent is képesek feldolgozni.

Hirdetés:

Ha tetszett ez a cikk, kövess minket a Facebookon is!

Google Gemini 2.5

A Google által fejlesztett Gemini 2.5 Pro Experimental, egy kifejezetten gondolkodásra tervezett modell, webapplikációk építésében és kódolási feladatokban jeleskedik. Érdekes módon egyik népszerű programozási tesztsorozaton alulteljesít a Claude Sonnet 3.7-hez képest. A modell használatához havi 20 dolláros Gemini Advanced előfizetés szükséges.

ChatGPT-4o képgenerátor

Az OpenAI továbbfejlesztette meglévő GPT-4o modelljét, így már nemcsak szöveget, hanem képeket is képes létrehozni. A felturbózott modell gyorsan virálissá vált, miután bárki könnyedén Studio Ghibli stílusú anime-karakterekké alakíthatja saját fotóit – nyilvánvaló szerzői jogi aggályok ellenére. A GPT-4o használatához minimum havi 20 dolláros ChatGPT Plus előfizetés szükséges.

Stability AI Stable Virtual Camera

A képgenerálásra szakosodott Stability AI olyan modellt dobott piacra, amely a cég állítása szerint képes egyetlen 2D képből 3D jeleneteket és kameraállásokat generálni. Azonban továbbra is nehezen birkózik meg a komplexebb elemeket – például embereket vagy mozgó vizet – tartalmazó jelenetekkel. A modell nem kereskedelmi célú kutatásokhoz ingyenesen elérhető a HuggingFace platformon.

Cohere Aya Vision

A Cohere multimodális modellje, az Aya Vision a cég szerint kategóriájában a legjobb képfeliratozásban és fotókkal kapcsolatos kérdések megválaszolásában. A versenytársaktól eltérően az angol mellett más nyelveken is kiválóan teljesít. Ingyenesen elérhető WhatsApp-on keresztül.

OpenAI GPT 4.5

Az OpenAI eddigi legnagyobb modelljének nevezi az 4.5-öt, kiemelve erős lexikális tudását és érzelmi intelligenciáját. Ugyanakkor bizonyos teszteken gyengébben teljesít az újabb gondolkodó modellekhez képest. Az GPT 4.5 az OpenAI havi 20 dolláros előfizetői csomagjával érhető el.

Claude Sonnet 3.7

Az Anthropic szerint ez az iparág első „hibrid” gondolkodó modellje, mivel képes gyors válaszokat adni, de szükség esetén alaposan átgondolni a problémákat. A felhasználók szabályozhatják, mennyi ideig „gondolkodhat” a modell. A Sonnet 3.7 minden Claude-felhasználó számára elérhető, de a rendszeres használathoz havi 20 dolláros Pro előfizetés ajánlott.

xAI Grok 3

A Grok 3 az Elon Musk által alapított xAI startup legújabb zászlóshajó modellje. Állítólag felülmúlja a többi vezető modellt matematika, természettudományok és programozás területén. A modell használatához X Premium előfizetés szükséges (havi 50 dollár). Miután egy tanulmány baloldali elfogultságot talált a Grok 2-ben, Musk megígérte, hogy a Grok „politikailag semlegesebbé” válik, de egyelőre nem világos, sikerült-e ezt megvalósítani.

OpenAI o3-mini

Az OpenAI legújabb gondolkodó modellje, amelyet STEM-területekre (programozás, matematika, természettudományok) optimalizáltak. Nem ez az OpenAI legerősebb modellje, de kisebb mérete miatt jelentősen olcsóbb üzemeltetésű. Ingyenesen elérhető, de gyakori használathoz előfizetés szükséges.

OpenAI Deep Research

Az OpenAI Deep Research mélyreható kutatásra tervezték, egyértelmű forrásmegjelöléssel. A szolgáltatás a ChatGPT havi 20 dolláros Plus előfizetésével érhető el. Az OpenAI mindenféle kutatáshoz ajánlja a tudományos területektől a vásárlási döntésekig, de érdemes figyelembe venni, hogy a hallucinációk továbbra is problémát jelentenek a mesterséges intelligencia számára.

Mistral Le Chat

A Mistral piacra dobta Le Chat nevű multimodális személyi asszisztensének applikációs verzióit. A cég állítása szerint a Le Chat gyorsabban reagál, mint bármely más chatbot. Fizetős verziója naprakész hírekkel szolgál az AFP hírügynökségtől. A Le Monde tesztjei szerint a Le Chat teljesítménye lenyűgöző, bár több hibát vétett, mint a ChatGPT.

OpenAI Operator

Az OpenAI Operator célja, hogy önálló személyi asszisztensként funkcionáljon, amely például bevásárlásban segít. Használatához havi 200 dolláros ChatGPT Pro előfizetés szükséges. Az MI-ágensek sok lehetőséget rejtenek, de még kísérleti fázisban vannak: a Washington Post újságírója szerint az Operator önállóan döntött úgy, hogy 31 dollárért rendel egy tucat tojást, amelyet az újságíró hitelkártyájával fizetett ki.

Google Gemini 2.0 Pro Experimental

A Google régóta várt zászlóshajó modellje állítólag kiváló programozásban és általános ismeretekben. Rendkívül hosszú, 2 millió tokenes kontextusablakkal rendelkezik, ami különösen hasznos hatalmas szövegmennyiségek gyors feldolgozásához. A szolgáltatás használatához legalább havi 19,99 dolláros Google One AI Premium előfizetés szükséges.

A borítóképet Midjourney képgenerátor készítette az alábbi prompt alapján: Surreal tech laboratory, blurred boundaries between human and machine, fluorescent blue brainwaves flowing into crystal-structured chips, biomechanical interfaces, glowing neural networks, holographic projections, deep perspective, cinematic lighting, hyperrealistic, 8K rendering