SZTE Digitális jövő

szeged

Képkészítés mesterséges intelligenciával: bemutatjuk a DALL-E 2-t

Képkészítés mesterséges intelligenciával: bemutatjuk a DALL-E 2-t

2023. november 30.
2 perc

A ChatGPT nevű modellt manapság senkinek sem szükséges bemutatni, használata a mindennapokban egyre inkább elterjed. A DALL-E 2 nevű képgeneráló generatív modell ugyanerre a GPT (Generative Pre-trained Transformer) technológiára épül, de ebben az esetben a beírt parancsra (prompt) nem szöveges, hanem képi válasz érkezik.

A DALL-E 2 használata során elegendő leírni akár magyarul, akár angolul, hogy milyen képet készítsen a modell, és pár másodperc feldolgozási idő alatt kész képek generálódnak a felhasználó számára. A képen szereplő elemek átrendezése mellett a modell képes azok stílusát is igény szerint megváltoztatni, sőt, ismert képzőművészek egyedi stílusában is képesek új témákat feldolgozni.

A DALL-E 2 modell használata könnyű és felhasználóbarát, azonban a komplex képek generálása időbe telik, és bizonyos felhasználói készségeket (ún. promptolási ismeretek) igényel. A program előnye, hogy „okosmegoldásokat” kínál azon felhasználók számára, akik másodpercek alatt szeretnének képeket készíteni: ebben az esetben előre megadott promptok segítségével generálhatunk képeket gyorsan.

A DALL-E 2 mindenki számára hozzáférhető, azonban ingyenes verziója már nem elérhető asztali gépen. Kizárólag az okostelefonokra készült változat ingyenes a cikk írásának időpontjában.

Végezetül néhány, a DALL-E 2 modellel készült képet mutatunk be:

krokodil
Itt egy kártyázó krokodilt kértünk

Természetesen vannak olyan kérések, amelyeket nem teljesíti megfelelően a modell, lásd a lenti képet "az esős Szegedről". Ez legtöbbször a nem megfelelően megfogalmazott prompt miatt fordul elő, de számos esetben a modell nem rendelkezik elegendő adattal az output elkészítéséhez.

szeged
Az esős Szegedet kértük a Dómmal és az egyik híddal

Harmadszorra egy kicsit nehezebb feladatott bíztunk rá, kipróbálva, mennyire ismer kitalált, fiktív karaktereket. A Yu-Gi-Oh! GX főszereplőjét, Jaden Yukiról szerettünnk volna egy képet, amin a Fairy Tail című animesorozat egyik szereplőjével, Wendy Marvellel kártyázik. A két karakterből, valamint a kártyapartijukból végül csak egy dolgot „fogott fel” az outputban, Wendyt

anime
Wendy kártyaparti közben

A képeken természetesen utólag is lehet finomítani. Ennél a képnél két új instrukcióval (prompt) próbálkoztunk. Előszőr esős hátteret kértünk, de az újragenerálás után is szép idő volt az ablakon túl. Másodszorra viszont szerencsével jártunk, ekkor azt szerettük volna, hogy a karakter mosolyogjon.
wendy
Wendy mosolyog.

Szerző: Czető Richárd Alex