Nyilvános a GPT-4 és leesett az állunk

2023.03.14.2023.03.14. Hartung Ariel Szövegírás

Az OpenAI, a mesterséges intelligencia kutatás egyik legjelentősebb szereplője, bemutatta legújabb fejlesztését: a GPT-4-et, amely egy nagy multimodális modell. A GPT-4 képes kép- és szövegbevitelt fogadni, majd szövegkimeneteket generálni, amelyek közel emberi teljesítményt nyújtanak a szakmai és tudományos benchmarkokon.

Az OpenAI az előző GPT modellek tapasztalatai alapján iteratív módon finomította a GPT-4-et az OpenAI tesztelési programjának és a ChatGPT tanulságai alapján. Ennek eredményeképpen a GPT-4 minden idők legjobb eredményét produkálja a tényszerűség, a kormányozhatóság és a korlátokon belül maradás terén.

Hirdetés:

Ha tetszett ez a cikk, kövess minket a Facebookon is!

A GPT-4 mától ChatGPT Plus előfizetői számára korlátozott hozzáféréssel elérhető. A chat.openai.com oldalon mostantól GPT-4 modell is kiválasztható. A GPT-4 modellnek jelenleg 4 óránként 100 üzetenet küldhetünk. A Plus előfizetők jelenleg csak szöveges promptokkal tesztelhetik az új modellt.

A bemutató videót itt lehet megnézni: https://player.vimeo.com/dd4637d3-1221-4dc9-8d5c-ae8b96c1f74c

Az elmúlt két évben az OpenAI teljesen újjáépítette a mély tanulási rendszerét és a Microsoft Azure-rel közösen egy szuperszámítógépet terveztek a munkaterhelés kezelésére. Az OpenAI kb egy éve tanította be a GPT-3.5 modellt, ami stabil felskálázási alapot adott a GPT-4-nek.

Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023

A GPT-4-nek induláskor csak szöveges promptokat adhatunk, amelyet a ChatGPT-n és API-n keresztül lehet elérni. A képbeviteli képesség jelenleg még nem nyilvános.

Az OpenAI egy nyílt forráskódú keretrendszert, az OpenAI Evals-t is bemutatta, amely lehetővé teszi bárki számára, hogy jelentse az OpenAI modellek hiányosságait, és segítséget nyújtson a további fejlesztésekhez.

Az OpenAI GPT-4 modellje egy forradalmi lépés a mesterséges intelligencia fejlesztésében, és számos területen használható, mint például az automatikus fordítás, a virtuális asszisztensek és az intelligens robotok. Az új modell bevezetése jelentős előrelépést jelent az emberi intelligencia szintjének elérése felé.

Képességek

A GPT-4 kreatívabb, árnyaltabb és megbízhatóbb utasításokat tud kezelni, és nagyobb hatékonysággal tudja feldolgozni az emberi nyelvet. Az OpenAI szakértői a modell teljesítményét különféle benchmarkokon tesztelték, beleértve az eredetileg embereknek tervezett szimulált vizsgákat is.

A tesztek a legfrissebb, nyilvánosan elérhető tesztek vagy a 2022-2023-as gyakorlati vizsgák voltak, amire a modellt külön nem készítették fel. Bár a modell betanítása során néhány problémát tapasztaltak a vizsgák során, az OpenAI szakértői úgy vélik, hogy az eredmények reprezentatívak. A technikai jelentést angol nyelven itt lehet letölteni: https://cdn.openai.com/papers/gpt-4.pdf

A GPT-4 érdekessége, hogy az előző modellhez képest jelentős előrelépést jelent a komplex feladatok kezelése terén, és lehetővé teszi az emberek számára, hogy még hatékonyabban használják a mesterséges intelligenciát.

Vizsgaeredmények. A GPT-4 szinte az összes vizsgán jobb eredményt ért el, mint a 3.5-ös verzió.

Kép bevitel

A GPT-4 nem csak szöveges, hanem képi promptokat is képes feldolgozni. A modell természetes nyelvű szöveges kimeneteket állít elő szöveges, képi, vagy vegyes bemenetek alapján.

A GPT-4 az OpenAI szerint kiemelkedő eredményeket ér el képek, diagramok és képernyőképek feldolgozásában. A modell kiegészítő tesztidő-technikákkal is rendelkezik, amelyeket csak szöveges nyelvi modellekhez fejlesztettek ki. Ez azt jelenti, hogy a GPT-4 nem csak szöveges, hanem akusztikus vagy gondolatlánc-felhívással kapcsolatos feladatokat is meg tud oldani.

A GPT-4 még mindig kutatási előzetes fázisban van, ezért a képbemenetek nem érhetők el nyilvánosan, de az OpenAI saját elmondása szerint azon dolgozik, hogy minél hamarabb elérhetővé tegye a képi funkciót is a felhasználók számára.

A GPT-4 megértette a viccet a képen és helyesen elmagyarázta a vicc lényegét is.

Korlátok

Azonban nem minden tökéletes, és a korábbi modellekhez hasonlóan a GPT-4-nek is vannak korlátai.

Az egyik legfontosabb korlát (azon kívül, hogy dög lassú), hogy a modell még mindig nem teljesen megbízható, és előfordulhat, hogy hallucinációkat produkál vagy érvelési hibákat követ el. Ez azt jelenti, hogy nagyon óvatosan kell eljárni, amikor a GPT-4 kimeneteit használjuk, különösen nagy téttel rendelkező kontextusokban. Fontos, hogy a használati eset igényeinek megfelelő protokollt alkalmazzuk, például emberi ellenőrzést, további kontextussal történő alapozást vagy a nagy téttel járó használat teljes elkerülését.

Azonban a GPT-4 számos javulást mutat a korábbi modellekhez képest. A hallucinációk száma jelentősen csökkent, ami nagy előrelépést jelent a modell pontosságának javítása terén. A belső tényértékelési teszteken a GPT-4 akár 40%-kal magasabb pontszámot ért el, mint a legutóbbi GPT-3.5 verzió.

Betanítás

A korábbi GPT-modellekhez hasonlóan a GPT-4 is úgy működik, hogy mindig megtippeli a következő szót egy generált szövegben. Az új modell azonban magában foglalja az internetes adatok és az általunk engedélyezett adatok használatát is, hogy még hatékonyabban működjön (még nem pontosan értjük, hogy ez mit is jelent – a szerk.).

Az adatokat egy web-méretű adathalmaz alkotja, amely matematikai problémákat, gyenge és erős érveléseket, önellentmondásos és következetes állításokat tartalmaz, valamint számos különböző ideológiát és elképzelést képvisel. Ez biztosítja, hogy a modell széles körű adathalmazból tanuljon, és sokoldalú válaszokat adjon a felhasználók kérdéseire.

A modell elsődleges képességei az előképzési folyamatból származnak, és az emberi visszajelzésen alapuló megerősítő tanulás (RLHF) finomhangolja a viselkedését. Ez azt jelenti, hogy a modell képes alkalmazkodni a felhasználók szándékaihoz, hogy pontos és releváns válaszokat adjon a feltett kérdésekre.

API

Az API még nem nyilvános, hozzáféréséhez fel kell iratkozni az openai.com oldalon. A GPT-4 ugynazt a ChatCompletions API rendszerrel működik, amelyet korábban már a GPT-3.5-turbo modell esetében is használtak.

A GPT-4 API-hoz a fejlesztők fokozatosan kapnak hozzáférést. Az igényekkel összhangban bővítik majd a csomagok méretet, hogy a kapacitást az igényekhez igazítsák. A kutatók számára pedig kutatói hozzáférési program is elérhető.

Eleinte a felhasználók csak szöveges kéréseket intézhetnek a GPT-4-hez. A képbevitel jelenleg még korlátozott alfa verzióban van, ezért nem nyilvános. Az stabil modell fejlesztése automatikusan történik új verziók megjelenésével. A jelenlegi verzió a GPT-4-0314, amelyet június 14-ig támogatnak. Az árak 0,03 USD 1 000 prompt tokenenként és 0,06 USD 1 000 befejezési tokenenként vannak meghatározva. Az alapértelmezett sebességkorlátok percenként 40 000 token és percenként 200 kérés. Ez kb tíszer drágább, mint a 3.5-turbo.

A GPT-4 kontextushossza 8192 token, de a 32 768-as szövegkörnyezetű verzióhoz is korlátozottan hozzá lehet férni. Ez utóbbi körülbelül 50 oldal szövegnek felel meg. Az árak itt 0,06 USD 1 000 prompt tokenenként és 0,12 USD 1 000 befejezési tokenenként vannak meghatározva. A jelenlegi 32k-s verzió a GPT-4-32k-0314, amelyet szintén június 14-ig támogatnak.