Az OpenAI megnyitotta az utat a testre szabható AI ügynökök fejlesztése előtt

Az OpenAI megnyitotta az utat a testre szabható AI ügynökök fejlesztése előtt

Kedden az OpenAI jelentős lépést tett az automatizált rendszerek fejlesztésének irányába a Responses API kiadásával, amely lehetővé teszi fejlesztők és vállalatok számára olyan mesterséges intelligencia alapú ügynökök létrehozását, amelyek önállóan hajtanak végre feladatokat.

Az új eszközkészlet segítségével a fejlesztők olyan AI ügynököket alakíthatnak ki, amelyek webes kereséseket végezhetnek, vállalati fájlokat vizsgálhatnak át, és webhelyeken navigálhatnak – hasonlóan az OpenAI saját Operator termékéhez. A Responses API idővel teljesen felváltja majd a vállalat Assistants API-ját, amelyet a tervek szerint 2026 első felében vezetnek ki.


Hirdetés:



Pontosabb válaszok keresési képességekkel

Az új rendszer részeként a fejlesztők hozzáférhetnek azokhoz a modellekhez, amelyek a ChatGPT keresési funkcióját is működtetik: a GPT-4o search és GPT-4o mini search. Ezek a modellek képesek a weben információt keresni, és a források megjelölésével válaszolni a kérdésekre.

Az OpenAI saját mérései szerint ezek a keresési modellekkel kiegészített rendszerek jelentősen pontosabbak a hagyományos AI modellekhez képest. A vállalat SimpleQA teljesítménymérő rendszerén, amely a tényszerű kérdések megválaszolásának képességét méri, a GPT-4o search 90%-os, míg a GPT-4o mini search 88%-os pontosságot ért el. Összehasonlításképpen, a nemrég kiadott nagyobb GPT-4.5 modell mindössze 63%-ot.

A keresési képességgel rendelkező AI eszközök magasabb pontossága nem meglepő, hiszen közvetlenül hozzáférnek a helyes válaszokhoz. Azonban ez nem jelenti azt, hogy a hallucináció problémája teljesen megoldódott – a GPT-4o search még mindig 10%-ban téved a tényszerű kérdések megválaszolásánál. Ezen felül a ChatGPT hivatkozásai sem mindig megbízhatóak, és a rövid, navigációs jellegű keresések (mint például „Lakers mai eredménye”) továbbra is kihívást jelentenek.

Számítógépes műveletek automatizálása

A Responses API magában foglalja a Computer-Using Agent (CUA) modellt is, amely az Operator funkció motorja. Ez a modell egér- és billentyűzetműveleteket képes generálni, így a fejlesztők automatizálhatnak adatbeviteli feladatokat és alkalmazásfolyamatokat.

A vállalatok opcionálisan helyben is futtathatják a CUA modellt saját rendszereiken, ami jelentős előrelépés az adatvédelem szempontjából. Az OpenAI nyíltan elismeri, hogy a CUA modell „még nem teljesen megbízható az operációs rendszereken végrehajtott feladatok automatizálásában”, és hajlamos „véletlenszerű” hibákat véteni.

Nyílt forráskódú fejlesztési eszköztár

A Responses API mellett az OpenAI egy nyílt forráskódú eszközkészletet is kiadott Agents SDK néven. Ez ingyenes eszközöket kínál a fejlesztőknek a modellek belső rendszerekbe történő integrálásához, biztonsági intézkedések bevezetéséhez, valamint az AI ügynökök tevékenységeinek monitorozásához, hibakereséshez és optimalizáláshoz.

„Meglehetősen könnyű bemutatni egy ügynököt, de egy ügynök méretezése már sokkal nehezebb, és elérni, hogy az emberek gyakran használják, az igazán nagy kihívás” – nyilatkozta Olivier Godemont, az OpenAI API termékvezetője egy szakmai interjúban.

Godemont szerint „az ügynökök a mesterséges intelligencia leghatásosabb alkalmazásai lesznek”. Ez összhangban van Sam Altman, az OpenAI vezérigazgatójának januári kijelentésével, miszerint 2025 az év, amikor az AI ügynökök belépnek a munkaerőpiacra.

Függetlenül attól, hogy 2025 valóban az „AI ügynök éve” lesz-e, az OpenAI legújabb fejlesztései azt mutatják, hogy a vállalat a látványos demóktól a valóban hasznos eszközök felé kíván elmozdulni.

A borító képet FLUX.1-dev képgenerátor készítette az alábbi prompt alapján: A person using a sleek, futuristic computer terminal with multiple screens displaying AI agents navigating websites and searching information, clean professional office environment, soft lighting, detailed UI elements