Hogyan lehet felismerni a mesterséges intelligencia által készített képeket?

Mutass egy képet, különben nem hiszem el! Néhány hónappal ezelőttig, egy fénykép láttán fel sem merült bennünk, hogy egy kép teljesen hamis lehet. Persze lehetett Photoshoppal finomítani, szépíteni a fotót, de az csak apró részleteket változtatott meg a képen. Az elmúlt időben megjelenő képszerkesztő programok, elsősorban a DALL-E, a Midjourney és a Stable Diffusion, azonban teljesen nonszensz kompozíciókat képes egyre élethűbben előállítani.

Ezek a programok, ahogy korábban már írtuk, szöveges utasításra hoznak létre képeket, ahol minél precízebb utasításokat adunk, annál jobb lesz a végeredmény. Az elmúlt napokban több olyan kép is izgalomba hozta az internet népét, sőt sokakat félrevezetett, amelyeknek semmi köze a valósághoz. Az egyik kép Ferenc pápát ábrázolja egy méregdrága fehér pufi dzsekiben, míg a második képen, ki más szerepelne, mint Donald Trump. A fotók sok olyan embert becsaptak, akik csak egy gyors pillantást vetettek rájuk, de a legtöbb felhasználó valószínűleg csak viccből osztotta tovább. A jövőben egyre profibb kamu képekre számíthatunk, ezért nem árt ha tudjuk, hogy hogyan lehet meggyőződni arról, hogy valós-e egy kép, vagy sem.

Nézzük először Ferenc pápát fehér pufi dzsekiben. A képet a Buzzfeed riportere az első, tömeges MI (mesterséges intelligencia) félrevezetésnek nevezte. A képet egy 31 éves építkezési munkás készítette egy fárasztó nap végén varázsgomba hatása alatt. A célja csak annyi volt, hogy valami vicceset hozzon létre, nem gondolta, hogy ennyire virális lesz a kép. Az ominózus kép itt tekinthető meg. Első látásra igazinak tűnik, de ha megnézünk néhány apróságot, akkor gyorsan kiderül, hogy egy generált képről van szó. Az első hiba a legtöbb embernek valószínűleg fel sem tűnik, pedig a fizika szabályait meghazudtoló lehetetlenség van a képen. Ferenc pápa nyakában egy kereszt lóg, de a láncnak az egyik fele hiányzik. Annyira evidens, hogy ott kellene lennie, hogy az ember meg sem nézi figyelmesen. Ez a hiányzó rész azt demonstrálja, hogy hiába végez kiváló munkát az MI, mégis a fizika legalapvetőbb szabályaival sincsen tisztában. A mesterséges intelligencia tehát hiába tudja, hogy hogy néz ki a pápa és egy pufi dzseki, és hiába vegyíti a kettőt mesterien, megdöbbentő hibákat is csinálhat, mert fogalma sincs, hogy mi a gravitáció például. A másik két hibát a képen a pápa szeménél és a kezénél kell keresni, ugyanis ez a két testrész szokott a legnehezebben menni a MI-nek, amikor emberekről készít képet. A pápa bal keze még rendben van, de a jobb keze, amivel elvileg egy poharat tart, tulajdonképpen csak egy csonk. Az MI-k egyelőre nem tudnak jó kezeket készíteni, mert a képeken, amelyekből tanulnak, a kezek sokszor fognak valamit, gyakran nem látszik az összes ujj és az ujjak sokszor sokféleképpen állnak. Emiatt az MI-nek nincsen egy általános képe, hogy milyennek kell lennie egy kéznek. A harmadik hiba szintén tipikus, de egy kicsit nehezebben észlelhető. Ha alaposan megfigyeljük azonban, akkor kiderül, hogy a pápa jobb szemhéja egybemosódik a szemüveggel. Ezek a hibák tipikusnak mondhatóak, és viszonylag gyorsan meg lehet találni őket, ha valaki veszi a fáradságot, hogy alaposabban megvizsgálja a fotót.

A második képet, amelyiken Donald Trump térdel, maga a volt elnök osztotta meg a közösségi oldalán. Ebben az esetben is egy MI által generált képről van szó, amelyiken szintén megtalálhatóak a tipikus hibák. Nem tökéletes az elnök keze és a térdelő pozíciója is furcsa, olyan mintha egy vonalban lenne a két lába, ami elég nehéz mutatvány lenne az idős politikusnak. A képen van egy harmadik érdekesség is, ami nem egy testrész hibája, hanem egy furcsaság a kompozícióban, ami árulkodó lehet. A képen a Trump körül látható alakokat mintha teljesen hidegen hagyná, hogy az elnök térdre ereszkedett a szoba közepén és imádkozni kezdett; senki még egy pillantást sem vet a nem túl szokványos jelenetre. Ha a kép igazi lenne, akkor valószínűleg mindenki az elnököt nézné.

Ezek a jelek egyelőre viszonylag gyorsan lebuktatják a hamisítványokat, de a technika hónapról-hónapra fejlődik és egyre nehezebb lesz megkülönböztetni a valóságot a szerkesztett képektől. A Midjourney legújabb verziója állítólag már profin generál kezet és arcot, úgyhogy ez az árulkodó jel a jövőben már lehet, hogy nem fog segíteni nekünk, és így csak az egyre nehezebben kiszúrható furcsaságok maradnak támpontnak.

Az eredeti cikk itt olvasható.
Kapcsolódó anyagunk: Valótlan valóság (deepfake) – Barankovics Alapítvány
A szemlét készítette: Papp Gergely

2023. március 30.

← Előző bejegyzés Következő bejegyzés →