ChatGPT képgenerálása lelassult, miután túlterhelték a felhasználók

ChatGPT képgenerálása lelassult, miután túlterhelték a felhasználók

A ChatGPT új képgenerálási képességei lenyűgözték a felhasználókat az elmúlt hetekben. A GPT-4o modellel bevezetett funkcióval készült képek minősége jelentős előrelépést mutat a korábbi generációkhoz képest, ám úgy tűnik, a hatalmas érdeklődés váratlanul érte az OpenAI-t.

A vállalat kénytelen volt visszafogni a képgeneráló funkció elérhetőségét, miután a felhasználók tömegesen kezdték használni az új lehetőséget. Információink szerint az OpenAI eredetileg a ChatGPT felhasználóinak többsége számára elérhetővé kívánta tenni a funkciót, de a rendszer túlterhelése miatt ideiglenesen korlátozniuk kellett a hozzáférést.


Hirdetés:



Minőségi ugrás a képalkotásban

A GPT-4o modellel készült képek valóban kiemelkedő minőséget képviselnek. A korábbi DALL-E alapú megoldásokhoz képest részletgazdagabb, valósághűbb kompozíciókat láthatunk, amelyek pontosabban követik a felhasználói utasításokat. A technológia különösen jól kezeli az emberábrázolást, az arckifejezéseket és a bonyolultabb jeleneteket – éppen ezeket a területeket tartották eddig a képgenerátorok gyenge pontjainak.

„A GPT-4o integrált képgenerálási képessége az egyik legizgalmasabb fejlesztés, amit az utóbbi időben láttam a területen,” mondta az egyik iparági szakértő. „A multimodális AI-modellek fejlődése elképesztő tempóban halad, és a ChatGPT most bizonyította, hogy az OpenAI komolyan veszi a versengést a Midjourney-vel és a Stable Diffusion különböző verzióival.”

Túl sok, túl gyorsan

A hirtelen népszerűség azonban váratlan következményekkel járt. A felhasználók arról számoltak be, hogy a szolgáltatás jelentősen lelassult, egyes esetekben pedig egyáltalán nem válaszolt a képgenerálási kérésekre. Ez arra utal, hogy az OpenAI infrastruktúrája nem volt felkészülve a hirtelen megnövekedett terhelésre.

Saját tesztelésünk során mi is tapasztaltuk, hogy a képgenerálási idő jelentősen megnőtt, különösen a csúcsidőszakokban. Míg korábban másodperceken belül elkészültek az egyszerűbb képek, most akár perceket is várni kell egy-egy összetettebb kompozícióra.

Az OpenAI egyelőre nem közölt hivatalos információt arról, mikor tervezik visszaállítani a teljes hozzáférést. Valószínűsíthető, hogy a vállalat jelenleg a háttér-infrastruktúra megerősítésén dolgozik, hogy stabilizálja a szolgáltatást.

Verseny a képgenerálás piacán

Az eset jól mutatja, milyen intenzív verseny zajlik a képgeneráló AI-k piacán. A Midjourney nemrég jelentette be V6-os modelljét, a Google Imagen továbbra is zárt béta állapotban van, míg a nyílt forráskódú Stable Diffusion különböző verziói és finomhangolásai egyre szélesebb körben terjednek.

Az OpenAI számára kritikus fontosságú, hogy stabilizálja képgenerálási szolgáltatását, különösen mivel a ChatGPT a legszélesebb körben használt AI-asszisztens a piacon. A jelenlegi helyzet egyúttal rámutat arra is, hogy a mesterséges intelligencia rendszerek üzemeltetése komoly erőforrásokat igényel, és a népszerűség gyakran infrastrukturális kihívásokkal jár.

Úgy tűnik, az AI-képgenerálás technológiája ugyan rohamos tempóban fejlődik, de a hozzá szükséges számítási kapacitás biztosítása továbbra is jelentős kihívást jelent még a legnagyobb vállalatok számára is.

A borító képet FLUX.1-dev képgenerátor készítette az alábbi prompt alapján: A person looking amazed at their smartphone screen where AI-generated images are being created, vibrant colors, realistic lighting, modern setting, detailed technology.