A Google kétféle szabályrendszert használ a kiadói tartalmak kezelésére

A Google kétféle szabályrendszert használ a kiadói tartalmak kezelésére

Meglepő beismerést tett a Google DeepMind alelnöke a vállalat ellen folyó antitrösztperben. Eli Collins, a DeepMind termékekért felelős alelnöke vallomásában elmondta, hogy a keresőóriás más-más szabályokat alkalmaz a kiadói tartalmak felhasználására attól függően, hogy AI-modellekről vagy keresési termékekről van szó.

Az amerikai Igazságügyi Minisztérium ügyvédje, Diana Aguilar egy olyan dokumentumot mutatott be a tárgyaláson, amely szerint a Google AI-modelljei betanításához használt 160 milliárd tokenből 80 milliárd olyan tartalomból származott, amelynek kiadói kifejezetten megtiltották tartalmuk AI-képzésre való felhasználását.


Hirdetés:



Collins válaszában hangsúlyozta, hogy a DeepMind modelljei valóban nem használják azokat a tartalmakat, amelyeknek kiadói letiltották az AI-képzésben való részvételt. Amikor azonban Aguilar rákérdezett, hogy ugyanez a tartalom felhasználható-e akkor, ha a Gemini AI-modellt a keresési termékekbe építik be, Collins meglepő módon igennel válaszolt – feltéve, hogy a felhasználás a keresési terméken belül történik. Ez vonatkozik a Google AI áttekintéseire és a nemrég bevezetett AI-módra is.

A kiadók kényszerhelyzetben

Mindez azt jelenti, hogy a hagyományos letiltási módszerek nem elegendőek ahhoz, hogy a kiadók megakadályozzák tartalmaik Google általi felhasználását. A vállalat tavaly júniusban frissítette adatvédelmi irányelveit, jelezve, hogy minden nyilvánosan elérhető internetes adatot felhasznál nyelvi modelljei betanítására. Ez alatt minden olyan weboldalt ért, amely nem rendelkezik fizetőfallal vagy kötelező regisztrációval.

A Google szóvivője később közölte, hogy a keresésen alapuló AI-eszközökre eltérő szabályok vonatkoznak: a kiadók „csak akkor utasíthatják el adataik keresési AI-ben való felhasználását, ha letiltják a keresési indexelést is”. Ezt a robots.txt webszabvány letiltásával tehetik meg, amely megakadályozza, hogy a Google keresőrobotjai hozzáférjenek a tartalomhoz és indexeljék azt a keresési találatok között.

Ez viszont azt is jelenti, hogy ezek a weboldalak nem jelennek meg, amikor egy felhasználó a Google keresőmotorját használja. A kiadók tehát gyakorlatilag választás elé kerülnek: vagy elfogadják, hogy a Google AI-modelljei felhasználják tartalmaikat, vagy teljesen kiesnek a keresési találatokból.

Az antitrösztper tétje

A folyamatban lévő antitrösztper célja annak bizonyítása, hogy a Google monopolhelyzetben van a keresés és az AI területén. Az Igazságügyi Minisztérium arra ösztönzi Amit Mehta amerikai kerületi bírót, hogy kötelezze a technológiai óriást a Google Chrome eladására, valamint arra, hogy ossza meg a keresési eredmények generálásához használt adatokat. Ugyanakkor ilyen intézkedéseket nem javasoltak a vállalat AI-termékeire vonatkozóan.

A jelenlegi helyzet jól mutatja, milyen összetett kérdéseket vet fel a digitális tartalmak felhasználása az AI-forradalom korában. Míg a technológiai cégek igyekeznek minél több adathoz hozzáférni modelljeik fejlesztéséhez, a tartalomkészítők jogosan aggódnak munkájuk felhasználása miatt. Véleményem szerint a Google kétarcú megközelítése – miszerint más szabályok vonatkoznak az AI-modellekre és a keresési termékekre – csak tovább bonyolítja ezt az amúgy is összetett helyzetet, és aligha segíti a kiadók és technológiai cégek közötti bizalom kiépítését.

A borító képet FLUX.1-dev képgenerátor készítette az alábbi prompt alapján: A serious journalist sitting at a computer, investigating Google’s AI content usage policies, surrounded by digital documents, with a worried expression on face, photorealistic, detailed office environment.