API hívások a ChatGPT legújabb verzióiban
Néha, amikor a számítógépünk, vagy telefonunk egy alkalmazását használjuk, alig vesszük észre, hogy a háttérben milyen komplex folyamatok játszódnak le. Működik a program, megnyomjuk a gombot, és megkapjuk az eredményt. A varázslat mögött álló kulcs az API, vagyis az alkalmazásprogramozási interfész. Ez a „továbbító” a programok között, amelyek így kommunikálni tudnak egymással. De hogyan is működik ez? És mi köze a mesterséges intelligenciának ehhez? Nézzük meg közelebbről.
A kommunikáció szíve: az API hívás
Az API hívás alapvetően egy üzenet, amit a mi alkalmazásunk, a kliens küld a szervernek, hogy egy szolgáltatást, vagy információt kérjen. Mint amikor a pincérnél rendelünk egy étteremben. Az API a pincér, aki elviszi a rendelésünket (API hívás) a konyhába (szerver), majd visszahozza nekünk az ételt (válasz). Például, ha egy alkalmazásban a Facebook API-t használjuk, amikor bejelentkezünk a Facebook fiókunkkal, az alkalmazás egy API hívást küld a Facebooknak a hitelesítési adatokkal, és várja a választ: bejelentkezhetünk-e, vagy sem.
Hirdetés:
Új szintre lépve: a gpt-3.5-turbo-0613 és gpt-4-0613 modellek
A ma hajnalban bejelentett gpt-3.5-turbo-0613 és gpt-4-0613 AI modellek képesek „érzékelni”, mikor kell hívniuk egy funkciót az input alapján, és adnak vissza egy úgynevezett JSON objektumot, amely tartalmazza a funkció argumentumait. Az előnyök? Strukturált adatokat kaphatunk vissza a modelltől, melyeket könnyen feldolgozhatunk. Azonban szükség lehet a felhasználó megerősítésére bizonyos esetekben, mivel a modellek képesek paramétereket „hallucinálni”, vagy érvénytelen JSON-t generálni.
Hogyan működik a funkcióhívás ezekkel a modellekkel?
A folyamat lépésről lépésre az alábbiak szerint zajlik:
- Hívjuk a modellt a felhasználói lekérdezéssel és egy funkciókészlettel a
functions
paraméterben. - A modell dönt arról, hogy hívjon-e egy funkciót; ha igen, a visszaküldött
content
egy stringgé alakított JSON objektum lesz, ami az egyéni sémánknak felel meg. - A programunk ezt a stringet JSON formátumban feldolgozza, majd ha léteznek, a megfelelő funkciót hívja a megadott argumentumokkal.
- A modellt újra hívjuk úgy, hogy hozzáadjuk a funkció válaszát egy új üzenetként, majd a modellt megkérjük, hogy foglalja össze az eredményeket a felhasználónak.
Lehetőségek végtelen tárháza
Az alkalmazási területek száma szinte végtelen: Chatbotok létrehozása, amelyek kérdésekre válaszolnak külső API-k hívásával, természetes nyelv átalakítása API hívásokká, strukturált adatok kinyerése szövegből, és még sorolhatnánk. A gpt-3.5-turbo-0613 és gpt-4-0613 modellek lehetővé teszik a fejlesztőknek, hogy kreatív módon használják a mesterséges intelligenciát, amint azt soha korábban nem tették.