
Mindenki számára elérhetővé vált a Microsoft mesterséges intelligencia alapú látásfunkciója
A Microsoft múlt héten jelentette be, hogy az Edge böngészőben minden felhasználó számára elérhetővé teszi a Copilot Vision funkciót. A számítógépes látással rendelkező mesterséges intelligencia szolgáltatást eredetileg 2023 decemberében mutatták be, de eddig csak a Copilot Pro előfizetők használhatták. Most azonban a redmondi technológiai óriás kiterjeszti ezt az AI-funkciót az összes Edge böngésző felhasználóra, fizetős előfizetés nélkül is.
Mire képes a Copilot Vision?
Az új funkció lényege, hogy a Copilot chatbot látja a weboldalak tartalmát, és valós időben segít a felhasználónak különböző feladatok megoldásában. Mustafa Suleyman, a Microsoft AI vezérigazgatója az X-en (korábbi Twitter) közzétett bejegyzésében így fogalmazott: „Együtt gondolkodik veled, miközben böngészel. Nincs többé hosszas magyarázkodás, másolás-beillesztés vagy küszködés azzal, hogy szavakba öntsd, amit látsz.”
Hirdetés:
A Copilot Vision gyakorlatilag egy valós idejű számítógépes látásfunkció, amely hasonlít a Google Gemini Live képernyőmegosztási képességéhez. Az AI chatbot látja az Edge böngészőben megjelenő weboldalakat és azok teljes tartalmát, majd valós időben képes feldolgozni ezeket az információkat a felhasználó kéréseivel együtt.
Így használhatod a funkciót
A Microsoft figyelembe vette az adatvédelmi aggályokat, ezért a Copilot Vision egy „opt-in” jellegű funkció, amelyet a felhasználóknak maguknak kell aktiválniuk. Az aktiváláshoz az Edge böngészőben kell megnyitni a funkció bekapcsolásához szükséges oldalt, majd követni az utasításokat. A bekapcsolás után a Copilot oldalsávjában található mikrofon ikonra kattintva lehet aktiválni a Vision módot, amely egy lebegő sávot jelenít meg szövegmezővel és mikrofon gombbal.
A szolgáltatás támogatja a hangalapú kommunikációt is, így a felhasználók egyszerűen beszélhetnek a rendszerhez gépelés helyett. Ez megkönnyíti a kérdések feltevését az AI asszisztensnek, miközben a böngésző tartalmát nézzük.
Praktikus segítség a mindennapokban
Suleyman szerint a Copilot Vision számos módon segítheti a felhasználókat. Képes például több értékelést elolvasni és összefoglalni őket. Le tud írni vizuálisan összetett tárgyakat is – például megmondja, hogy egy bútorwebhelyen látott kanapé „görgős karú” vagy „midcentury modern” stílusú-e. Vásárlás során is hasznos lehet, mivel természetes nyelvi leírások alapján képes megtalálni a megfelelő termékeket.
A Microsoft hangsúlyozza, hogy az aktiválás után is teljes ellenőrzést biztosít a felhasználóknak: a Copilot Vision csak akkor látja a képernyőt, amikor a funkció be van kapcsolva. A vállalat állítása szerint a beszélgetési adatokat, beleértve a felhasználói kéréseket, a weboldalakon látható képeket és tartalmakat, minden munkamenet végén törlik. A Copilot válaszait azonban naplózzák, és felhasználják a biztonsági rendszerek fejlesztéséhez.
A borító képet FLUX.1-dev képgenerátor készítette az alábbi prompt alapján: A woman using Microsoft Edge browser with Copilot Vision feature on her laptop, with a glowing AI interface overlay showing visual analysis of webpage content.