Mostantól nyilvános a ChatGPT és a Whisper fejlesztői API
Az OpenAI, a ChatGPT és a DALL-E 2 mögött álló csapat olyan újításokat jelentett ma be, amelyek forradalmasíthatják az AI-fejlesztést. Az OpenAI mostantól elérhetővé teszi a fejlesztői API-kat a ChatGPT és a Whisper beszéd-átírási modellhez, így a fejlesztők könnyedén hozzáadhatják az AI-megoldásokat az alkalmazásaikhoz.
De ez nem minden: az OpenAI jelentős változásokat hajtott végre az általános szerződési feltételekben is. Mostantól a fejlesztők leiratkozhatnak adataik fejlesztési célú felhasználásáról, és az adatmegőrzési szabályzat is változott. Az OpenAI mostantól csak 30 napig tárolja a felhasználók adatait, ami nagy előrelépés a felhasználók adatvédelme terén.
Hirdetés:
ChatGPT
Az új ChatGPT API-t a „gpt-3.5-turbo” AI-modell hajtja, amely megegyezik a ChatGPT chatbot népszerű verziójával. Az API használata nem korlátozódik azonban a chatbotokra, bármilyen egyéb szoftveres megoldásra is használható.
Ezek az újítások megerősítik az OpenAI pozícióját az AI-fejlesztés terén, és az AI-technológiai megoldások széles körű elterjedését segítik elő.
Az új ChatGPT API ára kiváló ajánlat: mindössze 0,002 dollár 1000 tokenenként, ami körülbelül 750 szónak felel meg. Emellett dedikált kapacitást is kínál a fejlesztőknek, akik több tokent szeretnének használni, mint amennyit a szabványos API lehetővé tesz. Az új lehetőségek csatlakoznak a ChatGPT Plus-hoz, amely egy havi 20 dolláros szolgáltatás.
Az OpenAI Whisper API-ja is nagy változásokat hoz: a szeptemberben elindított nyílt forráskódú Whisper beszéd-szöveg modell hosztolt változata mostantól rendelkezésre áll a fejlesztők számára. Az új API sokkal gyorsabb és kényelmesebb, és percenként mindössze 0,006 dollárba kerül. Több nyelven biztosít „robusztus” átírást és lehetővé teszi az angol fordítását.
Az OpenAI az ügyfelek visszajelzései alapján módosította a fejlesztői feltételeket is. A vállalat mostantól nem használja fel az API-n keresztül benyújtott adatokat AI modelljei betanításához, hacsak a fejlesztők nem engedélyezik. Ezenkívül a hozzáadtak egy 30 napos adatmegőrzési szabályzatot, miközben lehetőséget biztosítanak szigorúbb megőrzési lehetőségekre is a nagyobb vállalatoknak. Az adatok tulajdonjogára vonatkozó feltételeket egyszerűsítették, és egyértelművé tették, hogy a felhasználók birtokolják a modellek bemenetét és kimenetét.
Az OpenAI azt is bejelentette, hogy lecseréli a bevezetés előtti felülvizsgálati folyamatot egy többnyire automatizált rendszerre, ami tovább javítja a monitorozást és egyszerűsíti a fejlesztők életét. Ezek az újítások jelentősen elősegítik az AI-technológia elterjedését és az OpenAI vezető pozíciójának erősítését az AI-fejlesztés terén.
Whisper
A ChatGPT API-val egyidően az OpenAI megnyitotta a Whisper beszédfelismerő rendszerhez a fejlesztői API hozzáférést is. A tavaly szeptemberben bevezetett nyílt forráskódú Whisper modell továbbfejlesztett változataként a Whisper API képes több nyelven stabil és megbízható átírást biztosítani, beleértve a technikai szakzsargont és az egyedi akcentusokat is.
A Whisper API sokféle fájlformátumot támogat, például az M4A, MP3, MP4, MPEG, MPGA, WAV és WEBM fájlokat. Greg Brockman, az OpenAI elnöke szerint a Whispert 680 000 órányi többnyelvű és többfeladatos információk segítségével képezték ki az internetről. Ez lehetővé teszi az átírások jobb felismerését a háttérzaj, az egyedi akcentusok és a technikai szakzsargon esetében is.
Az OpenAI arra is felhívta a figyelmet, hogy bár a Whisper nagyon hatékony, még mindig vannak korlátai. A rendszer nagy mennyiségű zajos adatra épül, és előfordulhat, hogy olyan szavakat is tartalmaz, amelyeket valójában nem mondtak ki. Ezenkívül a Whisper nem teljesít egyformán jól az összes nyelven, és nagyobb hibaarányt mutat, ha olyan nyelvek beszélőiről van szó, amelyek nem szerepelnek megfelelően a képzési adatokban.
Az OpenAI új API-ja nagy lehetőségeket kínál az olyan szervezetek számára, amelyek hatékonyabb beszédfelismerő rendszereket keresnek. A Whisper API ugyanazt a nagy modellt használja, amelyet nyílt forráskódúan is elérhetővé tettek, de az OpenAI a végletekig optimalizálta a rendszert, hogy sokkal gyorsabb és kényelmesebb legyen. Bár még mindig vannak korlátai, az OpenAI Whisper API-ja egy újabb lépést jelent a hangátírási technológiák fejlesztése terén.