
Elon Musk bejelentette a Grok AI új képértelmezési funkcióját
Elon Musk, az X (korábban Twitter) tulajdonosa a héten hivatalosan is bejelentette, hogy az xAI cége által fejlesztett Grok chatbot hamarosan képes lesz képeket elemezni és értelmezni. A vállalkozó egy Twitter-bejegyzésben tudatta, hogy az X platformon rövidesen elérhetővé válik az új Grok-Vision funkcionalitás.
A bejelentés szerint a Grok mostantól nemcsak a szöveges kérdésekre tud majd válaszolni, hanem a képek tartalmát is értelmezni tudja – hasonlóan az OpenAI GPT-4o vagy a Google Gemini modelljeihez. Ez jelentős előrelépés az eredetileg csak szöveges formátumban működő Grok chatbot képességeiben.
Hirdetés:
Versenyfutás a technológiai óriások között
Az xAI mindössze tavaly indult Musk vezetésével, és a Grok chatbotot is csak néhány hónapja mutatták be a nagyközönségnek. A fejlesztés egyértelműen azt a célt szolgálja, hogy versenyképessé tegye a Grokot a piacvezető AI modellek között.
Érdekes fordulat, hogy Musk, aki korábban élesen bírálta az OpenAI működését és üzleti gyakorlatát, most hasonló technológiai megoldást fejleszt. A milliárdos vállalkozó egykor az OpenAI társalapítója volt, de később kivált a cégből, és több alkalommal is kritizálta a vállalat működését.
Az AI chatbotok között egyre komolyabb verseny bontakozik ki a fejlettebb képértelmezési és multimodális funkciók területén. Az OpenAI és a Google már korábban bevezette saját modelljeinek képértelmezési képességeit, most az xAI is csatlakozik ehhez a trendhez.
Előfizetéshez kötött szolgáltatás
A Grok chatbot eddig is csak az X platform Premium előfizetői számára volt elérhető, és ez várhatóan a képértelmezési funkcióval kiegészített verzióra is igaz lesz. Az X Premium szolgáltatás havi előfizetési díj ellenében biztosít hozzáférést különböző extra funkciókhoz, amelyek közé mostantól a Grok-Vision is bekerül.
Szakértői véleményem szerint Musk lépése jól mutatja, hogy mennyire kiélezett a verseny a nagy technológiai cégek között a fejlett AI modellek területén. A multimodális képességek – vagyis a különböző formátumú információk (szöveg, kép, hang) együttes kezelése – egyre fontosabb versenyelőnyt jelentenek.
Musk bejelentése ugyan nem tartalmaz konkrét technikai részleteket a Grok-Vision működéséről, de várhatóan a következő hetekben több információ is napvilágra kerül majd az új funkció képességeiről és korlátairól. Az biztos, hogy az AI chatbotok körüli verseny tovább fokozódik, és a felhasználók egyre fejlettebb eszközöket kapnak a kezükbe.
A borító képet FLUX.1-dev képgenerátor készítette az alábbi prompt alapján: Elon Musk standing in a futuristic lab, looking at a screen displaying an AI analyzing images, professional lighting, serious expression, technology innovation, photorealistic style.