Hogyan lehet eltávolítani a SynthID vízjelet a Gemini képeiről
Rábukkantam egy reverse-SynthID nevű projektre, ami arra késztetett, hogy mélyebben utánajárjak, hogyan lehet eltávolítani a SynthID vízjel címkéket a Gemini képeiről, és az őszinte válasz az, hogy sokkal nehezebb, mint egy matricát leszedni egy fotóról.
Rábukkantam egy GitHub repository-ra, ami azt állítja, hogy visszafejtette a Google „unbreakable” AI vízjelét. Ez kiengedte a szellemet a palackból, és ez a poszt az, amit írtam, miközben megpróbáltam eltávolítani a SynthID vízjelvédelmet egy Gemini által generált képről. Azt is megvizsgáltam, hogy egyáltalán jó ötlet-e.
Mi is az a SynthID?
A SynthID a Google DeepMind AI képvízjel-rendszere, és szövegre, hangra és videóra is kiterjed. Csendben beágyaz egy jelet a tartalomba abban a pillanatban, amikor olyan eszközök hozzák létre, mint a Gemini, az Imagen, a Veo és a Lyria.
Képeknél a vízjel nem logó és nem bélyeg. Egy minta, ami közvetlenül a pixelértékekbe van sütve, az egész képre szétterülve, nem pedig egy sarokban ül. Ez nagyon különbözik attól a kis sparkling ikontól, amit a Gemini szintén a kép sarkára rak, ami csupán egy látható logó a tetején.
A Google azért építette a SynthID-t, hogy a jel túlélje a hagyományos szerkesztést: átméretezést, vágást, újratömörítést, képernyőképként való lementést, még színkorrekciót is. Egy detektor később átvizsgálhatja a fájlt, és meglehetősen magas biztonsággal jelölheti AI-generáltként, a Google DeepMind szerint.
Miért nem elég a látható vízjel eltávolítása
Itt akad el sok ember. Ha levágod a kis Gemini logót, vagy ráfestesz, csak a kozmetikai réteggel foglalkoztál. A láthatatlan SynthID jel még mindig ott ül a pixelekben, érintetlenül!
Ez azért számít, mert a látható logó és a láthatatlan vízjel két teljesen külön rendszer. Az egyik törlése semmit sem tesz a másikkal. Bárki, aki SynthID detektort futtat a „megtisztított” képeden, még mindig pozitív találatot kap, mert magát a vízjeladatot soha nem érintetted.
Oké, néha elég a vizuális eltávolítás
Őszintén szólva sok embernek csak a látható logó számít, nem a láthatatlan származási jel. Ha a célod csupán egy tiszta kinézetű kép a sarokban lévő sparkling ikon nélkül, pár ingyenes eszköz ezt simán megoldja.
- A Photopea, egy ingyenes Photoshop alternatíva, ami a böngészőben fut, rendelkezik egy Spot Healing Brush Tool eszközzel, ami a vízjel területét a környező pixelekkel keveri össze pár másodperc alatt. Jól működik kis logó vízjeleken, egyszerű háttereken.
- A geminiwatermarkremover.io egy ingyenes Gemini vízjel eltávolító, kifejezetten a Gemini logóhoz. Minden helyben fut a böngésződben, szóval a kép soha nem hagyja el az eszközödet.
Ha csak egy képernyőképre van szükséged saroklogó nélkül egy prezentációhoz vagy mockuphoz, ezek az eszközök teljesen ésszerűek és gyorsak.
Mi az a reverse-SynthID GitHub repo?
Itt kezd igazán érdekessé válni a dolog. A reverse-SynthID egy nyílt forráskódú kutatási projekt, amit Alosh Denny fejlesztő készített, és megpróbálja visszafejteni a Google Gemini SynthID-t tiszta jelfeldolgozással, anélkül, hogy hozzáférne a Google tényleges kódolójához vagy dekódolójához.
Hogyan működik
Ahelyett, hogy a vízjelet egy lefestendő képként kezelné, a projekt rejtett jelként kezeli, ami egy kép frekvenciatartományába van elásva. Minden kép frekvencia-reprezentációvá alakítható FFT-vel, vagyis Gyors Fourier-transzformációval, ami egy képet hullámminták összegeként ír le pixelek helyett. A SynthID jele ebben a reprezentációban néhány konkrét, ismétlődő hullámfrekvenciaként jelenik meg, hordozókként, állandó pozíciókban.
A hordozó pozíciók megtalálásához a Google saját detektora nélkül a kutatók tiszta fekete és tiszta fehér képeket etettek a Gemininek. Egy sima fekete képen szinte az egész pixeltartalom maga a vízjel, mivel nincs valódi fotótartalom, amibe el lehetne rejteni. A fekete és fehér verziók összehasonlítása lehetővé tette, hogy megerősítsék, mely frekvenciák voltak valóban a SynthID részei, nem pedig zaj, azáltal, hogy ellenőrizték: a fázisértékek úgy illeszkednek, ahogy egy invertált jeltől várnád.

Két megállapítás tette nehézzé. Először is, a hordozó pozíciók felbontásfüggőek, vagyis egy 1024x1024-es kép teljesen más frekvenciapozíciókban rejti a vízjelét, mint egy 1536x2816-os, szóval egy adott méretre épített ujjlenyomat használhatatlan egy másikon. Másodszor, a vízjel fázismintája konzisztens minden képen ugyanabból a Gemini modellből, és a zöld színcsatornában jelenik meg a legerősebben, ezért a projekt eltérően súlyozza a zöld, piros és kék csatornákat az eltávolításkor.
Ezeket a megállapításokat a projekt egy SpectralCodebook nevű struktúrában tárolja, lényegében egy keresőtáblában a hordozófrekvenciákról és fázisértékekről minden felbontáshoz, amit a Gemini ki tud adni. Eltávolításkor az eszköz a képet a codebook legközelebbi felbontási profiljához párosítja, majd közvetlenül kivonja az ismert vízjeljelet a kép frekvenciaspektrumából több körben, mindegyik gyengébb, mint az előző, hogy ne korrigáljon túl. A projekt három verzión ment keresztül ezzel a megközelítéssel: egyszerű JPEG újratömörítéssel kezdett, szélesebb többlépcsős transzformációkra váltott, és végül ezen a közvetlen spektrális kivonáson landolt, amit a repo saját benchmarkjai a legerősebbnek tartanak: nagyjából 75 százalékos csökkenés a hordozóenergiában és több mint 90 százalékos csökkenés a fáziskoherenciában, miközben a képminőség (PSNR) 43 dB felett marad, vagyis a kép az emberi szemnek gyakorlatilag ugyanúgy néz ki.
Hogyan használhatod?
A projekt Python scriptek gyűjteménye, nem egy kattintásos app, szóval a használata kicsit beállítást igényel. Nagy vonalakban:
- Klónozd a repositoryt a GitHubról, és telepítsd a repóban felsorolt Python függőségeket.
- Töltsd le a referencia fekete-fehér Gemini képeket a projekt Hugging Face adatkészletéből a mellékelt letöltő scripttel.
- Építs egy SpectralCodebook-ot ezekből a referenciaképekből, ami feltérképezi a hordozófrekvenciákat minden felbontáshoz.
- Futtasd a V3 bypass scriptet a saját képeden, a codebook fájlra mutatva, és válassz erősségi szintet a finomtól a maximálisig.
- Opcionálisan futtasd utána a mellékelt detektor scriptet, hogy ellenőrizd, tényleg csökkent-e a vízjeljel.
A karbantartó aktívan kéri a közreműködőket, hogy küldjenek be több tiszta fekete-fehér Gemini kimenetet a Hugging Face-re, mivel több referenciakép több felbontáson pontosabbá teszi a codebookot.
A projekt saját README-je egyenes beszédű a hatókörről: ez jelfeldolgozási kutatás, a Google zárt kódolója és dekódolója nélkül készült, és az eredmények felbontástól és attól függnek, mennyire agresszíven távolítod el a jelet.
Miért nem is kellene eltávolítanod a SynthID-t
Íme az őszinte véleményem, miután mindezt végigolvastam. A SynthID és hasonló vízjelező rendszerek azért léteznek, hogy segítsenek megkülönböztetni a valódi fotókat az AI-generáltaktól. Ennek a jelnek a levágása teljesen legyőzi a célt, és valódi kárt okozhat.
Újságírók, tényellenőrök és platformok ezekre a jelekre támaszkodnak, hogy elkapják az AI-generált dezinformációt, mielőtt elterjedne. Ha egy hamis kép egy közszereplőről vagy eseményről megkapja a SynthID vízjel lemosását, sokkal könnyebb hitelesként átadni, ami pontosan az a forgatókönyv, amit a vízjelezés meg akart akadályozni.
Van egy méltányossági szempont is. Néhány művész és fotós saját vízjellel igazolja a munkája tulajdonjogát. Bármilyen vízjel, AI vagy emberi készítésű, levágása és az eredmény saját eredeti alkotásként való átadása félrevezetésbe csúszik, és bizonyos kontextusokban komoly szellemi tulajdoni kérdéseket vethet fel.
Még a reverse-SynthID repo is egyenesen kimondja, hogy a projekt kutatási és oktatási célokat szolgál, és kifejezetten figyelmeztet, hogy ne használd arra, hogy AI-generált tartalmat emberi készítésűként mutass be. Ez jó tanács, függetlenül attól, melyik eszközt használod.