Mutass egy képet, különben nem hiszem el! Néhány hónappal ezelőttig, egy fénykép láttán fel sem merült bennünk, hogy egy kép teljesen hamis lehet. Persze lehetett Photoshoppal finomítani, szépíteni a fotót, de az csak apró részleteket változtatott meg a képen. Az elmúlt időben megjelenő képszerkesztő programok, elsősorban a DALL-E, a Midjourney és a Stable Diffusion, azonban teljesen nonszensz kompozíciókat képes egyre élethűbben előállítani.
Ezek a programok, ahogy korábban már írtuk, szöveges utasításra hoznak létre képeket, ahol minél precízebb utasításokat adunk, annál jobb lesz a végeredmény. Az elmúlt napokban több olyan kép is izgalomba hozta az internet népét, sőt sokakat félrevezetett, amelyeknek semmi köze a valósághoz. Az egyik kép Ferenc pápát ábrázolja egy méregdrága fehér pufi dzsekiben, míg a második képen, ki más szerepelne, mint Donald Trump. A fotók sok olyan embert becsaptak, akik csak egy gyors pillantást vetettek rájuk, de a legtöbb felhasználó valószínűleg csak viccből osztotta tovább. A jövőben egyre profibb kamu képekre számíthatunk, ezért nem árt ha tudjuk, hogy hogyan lehet meggyőződni arról, hogy valós-e egy kép, vagy sem.
Nézzük először Ferenc pápát fehér pufi dzsekiben. A képet a Buzzfeed riportere az első, tömeges MI (mesterséges intelligencia) félrevezetésnek nevezte. A képet egy 31 éves építkezési munkás készítette egy fárasztó nap végén varázsgomba hatása alatt. A célja csak annyi volt, hogy valami vicceset hozzon létre, nem gondolta, hogy ennyire virális lesz a kép. Az ominózus kép itt tekinthető meg. Első látásra igazinak tűnik, de ha megnézünk néhány apróságot, akkor gyorsan kiderül, hogy egy generált képről van szó. Az első hiba a legtöbb embernek valószínűleg fel sem tűnik, pedig a fizika szabályait meghazudtoló lehetetlenség van a képen. Ferenc pápa nyakában egy kereszt lóg, de a láncnak az egyik fele hiányzik. Annyira evidens, hogy ott kellene lennie, hogy az ember meg sem nézi figyelmesen. Ez a hiányzó rész azt demonstrálja, hogy hiába végez kiváló munkát az MI, mégis a fizika legalapvetőbb szabályaival sincsen tisztában. A mesterséges intelligencia tehát hiába tudja, hogy hogy néz ki a pápa és egy pufi dzseki, és hiába vegyíti a kettőt mesterien, megdöbbentő hibákat is csinálhat, mert fogalma sincs, hogy mi a gravitáció például. A másik két hibát a képen a pápa szeménél és a kezénél kell keresni, ugyanis ez a két testrész szokott a legnehezebben menni a MI-nek, amikor emberekről készít képet. A pápa bal keze még rendben van, de a jobb keze, amivel elvileg egy poharat tart, tulajdonképpen csak egy csonk. Az MI-k egyelőre nem tudnak jó kezeket készíteni, mert a képeken, amelyekből tanulnak, a kezek sokszor fognak valamit, gyakran nem látszik az összes ujj és az ujjak sokszor sokféleképpen állnak. Emiatt az MI-nek nincsen egy általános képe, hogy milyennek kell lennie egy kéznek. A harmadik hiba szintén tipikus, de egy kicsit nehezebben észlelhető. Ha alaposan megfigyeljük azonban, akkor kiderül, hogy a pápa jobb szemhéja egybemosódik a szemüveggel. Ezek a hibák tipikusnak mondhatóak, és viszonylag gyorsan meg lehet találni őket, ha valaki veszi a fáradságot, hogy alaposabban megvizsgálja a fotót.
A második képet, amelyiken Donald Trump térdel, maga a volt elnök osztotta meg a közösségi oldalán. Ebben az esetben is egy MI által generált képről van szó, amelyiken szintén megtalálhatóak a tipikus hibák. Nem tökéletes az elnök keze és a térdelő pozíciója is furcsa, olyan mintha egy vonalban lenne a két lába, ami elég nehéz mutatvány lenne az idős politikusnak. A képen van egy harmadik érdekesség is, ami nem egy testrész hibája, hanem egy furcsaság a kompozícióban, ami árulkodó lehet. A képen a Trump körül látható alakokat mintha teljesen hidegen hagyná, hogy az elnök térdre ereszkedett a szoba közepén és imádkozni kezdett; senki még egy pillantást sem vet a nem túl szokványos jelenetre. Ha a kép igazi lenne, akkor valószínűleg mindenki az elnököt nézné.
Ezek a jelek egyelőre viszonylag gyorsan lebuktatják a hamisítványokat, de a technika hónapról-hónapra fejlődik és egyre nehezebb lesz megkülönböztetni a valóságot a szerkesztett képektől. A Midjourney legújabb verziója állítólag már profin generál kezet és arcot, úgyhogy ez az árulkodó jel a jövőben már lehet, hogy nem fog segíteni nekünk, és így csak az egyre nehezebben kiszúrható furcsaságok maradnak támpontnak.
Az eredeti cikk itt olvasható.
Kapcsolódó anyagunk: Valótlan valóság (deepfake) – Barankovics Alapítvány
A szemlét készítette: Papp Gergely