Összegyűrtem Orbán Viktort

Fotó: MTI / Beliczay László

-

Már egy otthoni gépen is elfut a Google képfelismerő, illetve -remixelő intelligenciája, igaz, az elindítása nem egyszerű. Jól megetettem magyar politikusokkal.


Néhány hete felszántották az internetet azok a képek, amelyeket a képaláírás szerint a számítógép vagy a mesterséges intelligencia álmodott. Pár nappal később a Google megírta, hogy az egyik kísérleti képfelismerő kódjukkal generálták a képeket, majd július elején elérhetővé is tették a DeepDream nevű programot. Ez nagyjából azt jelenti, hogy a normál esetben képeken szereplő dolgok azonosítására használt Google-kódot megfordították, ami így a számára ismerős részleteket úgy rajzolja át, hogy az a programnak még egyértelműbben felismerhető legyen. Például szemek, állatokra utaló jegyek, épületrészek tűnnek fel a képen ott, ahol nem is számítanánk rá, az eredmény pedig meglehetősen szórakoztató.


Minden egy Orbán-fotóval kezdődött


A kód nem volt annyira könnyen használható, mint a Chrome böngésző vagy más tipikus Google-termék, így elsőre bele is tört a bicskám. Másodjára, egy emberbarátibb leírással felfegyverkezve viszont sikerrel jártam, és wookie-t csinálhattam Schmitt Pálból, ufót a miniszterelnökből. Rettentően élveztem, próbálják ki, ha van két felesleges órájuk!


Szemekből talált a legtöbbet a kód, de egy-két pagodát is sikerült kialakítania


Ki itt belépsz...

A DeepDream futtatása még úgy sem gyerekjáték, hogy minden építőkockát legyártottak nekünk. Másfél-két óra parancssoros matatás és szentségelés kellett ahhoz, hogy a Google játéka elinduljon a számítógépemen. Amikor pedig elindult, őrületesen lassan történt minden. A kódot alapvetően arra írták, hogy egy erős, nagy teljesítményű számításokra alkalmas videokártyát tartalmazó gépen fusson, én ehhez képest egy alapvetően irodai használatra tervezett laptopon próbáltam szemeket varázsolni Orbán Viktorra.


Az egyik kód köröket szeret rajzolni, össze is amőbázta Habony Árpád kabátját


  • először a Docker nevű ingyenes szoftvert kell letölteni, ezt a legfelhasználóbarátabb módon a Boot2Docker virtuálisgépes futtatókörnyezet részeként lehet beszerezni
  • utána futásra kell bírni, ami vagy azonnal megy, vagy a hibaüzenetekre való ráguglizással töltjük a következő másfél órát (nekem a második forgatókönyv vált be)
  • amikor a környezet már fut, akkor le kell tölteni a DeepDreamet tartalmazó virtuális gépet, amihez Kennedy szerencsére ad egy egysoros parancsot (docker pull ryankennedyio/deepdream)
Végül a dockerbe belépve (Mac OS X-en a boot2docker ssh parancs ezt megteszi nekünk) el kell indítani a Kennedy által használhatóvá tett Google-féle kódot.


Ha ezt látják, akkor már csak a jó rész van hátra


Ha a fenti, tényleg nem egyszerű lépéseken túljutottunk, akkor a gépünk IP-címét a böngésző címsávjába bemásolva már grafikus felületen kattoghatunk. A Google által kiadott kód még mindig nem igazán kényelmes. Az egyes részegységeket külön el kell indítani a play gombbal. A módosítani vágyott kép nevét nekünk kell átírni a kódban.


deepdream

Ebből a listából lehet válogatni, a többségük remekül működik


Ráadásul alapból csak egy-két mintát futtathatunk végig a képeinken, de elég pár karaktert átírnunk a fenti képernyőfotó szürke részeiben (ezeket a program ki is listázza nekünk, lásd az fenti képernyőfotót), és máris új mintákkal próbálkozhatunk. Nagyon elrontani nem lehet a dolgot, ha mégis sikerülne, csak újraindítjuk a virtuális gépet és kezdhetjük elölről a játékot.


Orbán Viktor; Csányi Sándor;Schmitt Pál; Orbán Győző; Kósa Lajos; Polt Péter

Fél-háromnegyed óra futás után megjelennek a nem evilági épületek is


A cikkben szereplő képek – ideértve a maga nemében csodálatos ezer szemű Orbánt – messze nem merítik ki a DeepDream kínálta lehetőségeket. A különböző mesterségesintelligencia-kutató laborok honlapjáról le lehet tölteni a Caffe-hoz – ez a szoftver áll a DeepDream mögött – előállított úgynevezett neurális hálókat.


Orbán Viktor; Csányi Sándor;Schmitt Pál; Orbán Győző; Kósa Lajos; Polt Péter

A DeepDream több tucatnyi funkcióval rendelkezik, nem mindegyik gyárt szemeket (cserébe wookie-kat meg igen)


Ezek a mesterséges neurális hálók a biológiai idegi hálózatok tanulási képességét próbálják lemásolni. A hálókat nagy képadatbázisokon tanítják be, és később arra használják, hogy képek tartalmát állapítsák meg. Amikor arról szólnak a hírek, hogy a Flickr képtárhely címkézője focipályának nézte Auschwitzot, vagy a Google Photos képtárhely afroamerikaiakat ábrázoló fotókat majmok nevű mappába másolt automatán, ezek a neurális hálók hibáznak. Vagy ha nem a hálók, akkor a hibáik kiküszöbölésére szolgáló programon csúsznak át kiszűrendő dolgok.


Deutsch Tamás

Álmodnak-e a Google szerverei Deutsch Tamással? (Nem.)


A DeepDream különlegessége, hogy máshogy használja a neurális hálókat, mint szokás. Ez a kód is apróságok alapján azonosít képeket, keres részleteket, de utána ezeket rajzolja úgy tovább, hogy ismerősebb legyen neki. Azután, hogy kutyákra emlékeztető részleteket keres, az állatra legjobban hasonlító részletet továbbalakítja még jobb kutyává. Nézzék csak meg a fenti képen Deutsch Tamás haját.


Élek kiemelésére is rá lehet venni a hálót


Ezért tűnnek fel szemek, kutyák vagy épp épületek az emberi arcok helyén: ezeket tudja az a háló, amit használunk. Még véletlenül sem azért viszont, mert a számítógépnek, amikor nem figyelünk rá, amikor csak a képernyővédő fut, kutyák járnának a fejében.

Ha egy másik hálót töltünk le például a Model Zoo nevű gyűjteményből, akkor egészen más mintákat fog generálni a program. Persze ehhez először be kell merészkedni a Docker belsejébe. Ha megcsinálták, mindenképpen küldjenek egy-két fotót a jobban sikerültek közül a foto@vs.hu-ra.