A ChatGPT nevű modellt manapság senkinek sem szükséges bemutatni, használata a mindennapokban egyre inkább elterjed. A DALL-E 2 nevű képgeneráló generatív modell ugyanerre a GPT (Generative Pre-trained Transformer) technológiára épül, de ebben az esetben a beírt parancsra (prompt) nem szöveges, hanem képi válasz érkezik.
A DALL-E 2 használata során elegendő leírni akár magyarul, akár angolul, hogy milyen képet készítsen a modell, és pár másodperc feldolgozási idő alatt kész képek generálódnak a felhasználó számára. A képen szereplő elemek átrendezése mellett a modell képes azok stílusát is igény szerint megváltoztatni, sőt, ismert képzőművészek egyedi stílusában is képesek új témákat feldolgozni.
A DALL-E 2 modell használata könnyű és felhasználóbarát, azonban a komplex képek generálása időbe telik, és bizonyos felhasználói készségeket (ún. promptolási ismeretek) igényel. A program előnye, hogy „okosmegoldásokat” kínál azon felhasználók számára, akik másodpercek alatt szeretnének képeket készíteni: ebben az esetben előre megadott promptok segítségével generálhatunk képeket gyorsan.
A DALL-E 2 mindenki számára hozzáférhető, azonban ingyenes verziója már nem elérhető asztali gépen. Kizárólag az okostelefonokra készült változat ingyenes a cikk írásának időpontjában.
Végezetül néhány, a DALL-E 2 modellel készült képet mutatunk be:
|
Itt egy kártyázó krokodilt kértünk |
Természetesen vannak olyan kérések, amelyeket nem teljesíti megfelelően a modell, lásd a lenti képet "az esős Szegedről". Ez legtöbbször a nem megfelelően megfogalmazott prompt miatt fordul elő, de számos esetben a modell nem rendelkezik elegendő adattal az output elkészítéséhez.
|
Az esős Szegedet kértük a Dómmal és az egyik híddal |
Harmadszorra egy kicsit nehezebb feladatott bíztunk rá, kipróbálva, mennyire ismer kitalált, fiktív karaktereket. A Yu-Gi-Oh! GX főszereplőjét, Jaden Yukiról szerettünnk volna egy képet, amin a Fairy Tail című animesorozat egyik szereplőjével, Wendy Marvellel kártyázik. A két karakterből, valamint a kártyapartijukból végül csak egy dolgot „fogott fel” az outputban, Wendyt
|
Wendy kártyaparti közben |
A képeken természetesen utólag is lehet finomítani. Ennél a képnél két új instrukcióval (prompt) próbálkoztunk. Előszőr esős hátteret kértünk, de az újragenerálás után is szép idő volt az ablakon túl. Másodszorra viszont szerencsével jártunk, ekkor azt szerettük volna, hogy a karakter mosolyogjon.
|
Wendy mosolyog. |
Szerző: Czető Richárd Alex