Három testőr Afrikában – Társasjáték

Becsült olvasási idő 11 perc.
PixelRita te szeretsz társasozni?
Mit szólnál, ha a ChatGPT-t kérnénk meg, hogy találja ki a játékot, írja meg a szabályokat, és még rajzolja is meg!
Vágjunk bele!

Készítsünk társasjátékot!

Egyik korábbi bejegyzésben készült egy kép, ami hasonlóan nézett ki, mint egy társasjáték.

Ez adta az ötletet, hogy mi lenne, ha a ChatGPT-vel készítenénk el egy komplett társasjátékot?

A játékhoz Rejtő Jenő A három testőr Afrikában c. könyvét használtuk. A játékban a könyv eseményeit követve juthatunk el a célba.

⚠️ Ez a bejegyzés egy ötletadó. Egy társasjáték kidolgozása több időt és több részletet igényel. Mindebben óriási segítség lehet a ChatGPT, mint ötletadásban, mint a szabályok kidolgozásában, de még a rajzolásban is.


 A bejegyzésben található képek többszöri kísérlet eredményei. 

Játékszabályok

Elsőnek írjuk le a ChatGPT-nek, hogy milyen játékot is szeretnénk. Minél részletesebben adjuk meg, miről szóljon a történet, mi a cél, kik játszanak.

Én ebben az esetben A három testőr Afrikában c. könyvet adtam meg, hogy az ott szereplő történetből készítsen játékot.

Legfontosabb, hogy legyenek meg a konkrét szabályok, amik alapján tudunk a továbbiakban dolgozni.

ChatGPT készítsd el a játékszabályokat!

Kaptunk egy laza szabály rendszert. Ez a kiindulási alapunk.

Ebben a bejegyzésben nem megyünk bele a részletekbe. De ha tényleg egy komplett és összetett játékot szeretnénk, akkor kérjük meg a ChatGPT-t, hogy végezze el az aprólékos kidolgozást.

Játéktábla készítése

Most, hogy megkaptuk a szabályokat, elkészíthetjük a játéktáblát. A ChatGPT-be beépített Dall-E elég jó rajzot készít nekünk. Igaz, ez is többszöri próbálkozásra sikerült. Tehát ne adjuk fel!

Az eredmény közepes. Ezen még rengeteg utómunka van. Esetleg olyat képet kérjünk, ami csak egy üres tábla, a mezőket pedig majd mi rajzolj be utólag.

A három testőr Afrikában társasjáték
A három testőr Afrikában társasjáték

Játékos kártyák

A játékos kártyák esetében nagyobb szerencsénk van. Ezt a ChatGPT-be beépített Dall-e már sokkal jobban kezeli. Itt nagyobb is a szabadságunk.
Igaz, a programot folyamatosan emlékeztetni kell, hogy a történet a XX. század elején észak-Afrikában a francia idegen légióban.

A kártyákra számos utómunka vár még. De egy kezdésnek nagyon jó, és rengeteg ötletet is meríthetünk belőlük.

Itt látható Senki Alfonz kártyája.

A három testőr Afrikában társasjáték - Senki Alfonz
A három testőr Afrikában társasjáték – Senki Alfonz

Ez itt Tuskó Hopkins kártyája

A három testőr Afrikában társasjáték - Tuskó Hopkins
A három testőr Afrikában társasjáték – Tuskó Hopkins

Ez pedig Csülök, alias John Fowler kártyája

A három testőr Afrikában társasjáték - Csülök
A három testőr Afrikában társasjáték – Csülök

Eseménykártya

A játékszabályok leírásánál a ChatGPT javasolta, hogy legyenek esemény kártyák.

Jó ötlet! Akkor nézzük meg őket is!

Kérjünk néhány példát, milyen események lehetségesek. De természetesen azt is kérhetjük, hogy 20 vagy 50 esemény kártyát dolgozzon ki a ChatGPT. Előtte érdemes kategóriákat is kérni, pl. jó, rossz, vagy semleges dolog történik a játékossal.

Kérjünk egy rajzot is az eseménykártyáról!

A három testőr Afrikában társasjáték - Eseménykártya
A három testőr Afrikában társasjáték – Eseménykártya

Kihíváskártya

A ChatGPT javasolta a Kihíváskártyákat is. Készítsünk akkor ilyeneket is!

Kérjünk egy rajzot is a Kihíváskártyáról!

A három testőr Afrikában társasjáték - Kihíváskártya
A három testőr Afrikában társasjáték – Kihíváskártya

Doboz

Ha már ennyi mindent készítettünk, akkor legyen egy szép doboza is a játéknak. Ennek megrajzolásában is segít a ChatGPT!

A három testőr Afrikában társasjáték doboza
A három testőr Afrikában társasjáték doboza

További lehetőségek

Kimaradt valami? Kérdezzük meg a ChatGPT-t!

Összegzés

Ez a bejegyzés arra szolgál, hogy megmutassuk, egy komplett társasjátékot is lehet készíteni a mesterséges intelligencia segítségével. Éppen csak belekukkantottunk a játék készítésébe, de a részletekbe nem mentünk be.

Amennyiben tényleg szeretnénk egy komplett játékot készíteni, annak semmi akadálya nincs!

Kérjük meg a ChatGPT-t, hogy sokkal bővebben fejtse ki a szabályokat! A programmal közösen dolgozzuk ki, hogy mi is legyen a történet, mi a cél. Mik legyenek az akadályok, amik hátráltatják a játékost! Mik segítsék? Ezek hogyan működjenek?
Majd ezek részleteit ismét a mesterséges intelligencia megírhatja.

A ChatGPT-t megkérhetjük, hogy készítse el a szerencse kártyákat is. Ez egy nyelvi modell, tehát az ilyen jellegű írások az erősségei. Készítsünk akár 20, 50, vagy akár 100 kártyát is! Nem probléma! És a programnak nagyon jó ötletei vannak!

Majd térjünk át a rajzokra!

A beépített Dall-e egyre szebben rajzol. És mivel össze van kötve a ChatGPT-vel, egészen jól irányítható. Kérhetjük a rajz módosítását szövegesen, vagy akár a rajzon kijelölve is.

Ha mégsem vagyunk elégedettek vele, akkor pedig még mindig megírhatja a prompt-ot (a rajzolási utasításokat), amiket majd másik MI-rajzoló programban használunk.

Talán nem túlzás azt írni, hogy minden grafikai elem készítésében tud a mesterséges intelligencia segíteni: a dobozban, a táblában, a játékosokban, a kártyákban, a játékpénzben, vagy bármi másban!

Kalandra fel! Készítsünk saját társasjátékot!

További ötletek!

Midjourney

A grafikai elemek készítésben a Midjourney tényleg nagyon jó. Viszont esetleg nehezebben magyarázzuk el a programnak, hogy mit is szeretnénk. Ma már szerencsére a ChatGPT is tud segíteni a prompt (utasítás) megírásában. Illetve a Dall-E rajzoknál az I gombra kattintva (jobb felül) lekérhetjük a kép promptját. Majd ezt másolhatjuk be a Midjourney-be.

A Midjourney térképe egy afrikai rablótámadáshoz

A Pál utcai fiúk

A három testőr Afrikában példája alapján nézzünk kicsit körbe!
Mi lenne, ha arról készítenénk egy táblás játékot, hogy a Pál utcai fiúk a grundot védik?

Itt van két kép kedvcsinálónak!

A Pál utcai fiúk - a grund védelme
A Pál utcai fiúk – a grund védelme
Nemecsek játékkártyája
Nemecsek játékkártyája

PixelRita

PixelRita neked hogy tetszik? És mit gondolsz, mi lenne, ha nemcsak táblás játékokat, hanem egy komplett számítógépes játékot is tudnánk a mesterséges intelligenciával készíteni egy könyv vagy saját ötlet alapján?

Loading

Látványos betűk a Photoshopban referenciakép alapján saját betűtípusunkkal

Becsült olvasási idő 6 perc.

Új lehetőségek

Az Adobe Photoshop programban 2024. áprilisában frissült a mesterséges intelligencia. Immár a rajzolásnál használhatunk referenciaképet is.

Ez így új lehetőségeket adott a kreatív és látványos betűk készítéséhez is!

Készítsünk betűket a referenciakép alapján

Itt egy kép, ami már az új Adobe Photoshop új verzióval (25.10) készült. A kicsi robotok ott állnak a tábla előtt. Már csak egy látványos felirat hiányzik.
Sajnos ebben még gyengélkedik az Adobe (ebben 2024. év elején az Ideogram a legjobb). De ez nem probléma! Az új referenciakép funkcióval be tudjuk hozni a más programban készült betűket.

Adobe Photoshop Generative robotok
Adobe Photoshop Generative robotok

Korábban készítettünk néhány igazán látványos betűt a Midjourney programban. Ebből az alábbi R betűt fogjuk használni minta képnek.

Fogaskerekes-robotos R betű - készült a Midjourney programmal
Fogaskerekes-robotos R betű – készült a Midjourney programmal
pronpt: type "O" made of robotic parts and gears and wires,

Most, hogy felkészültünk, nyissuk meg az Adobe Photoshop programot!

A program azon tulajdonságát fogjuk használni, hogy a mesterséges intelligencia minden esetben ki akarja tölteni a kijelölt területet. (Előfordulhat, hogy egy későbbi Photoshop verzióban ez változni fog.)
Mi pedig a saját s

Írjuk fel a szöveget a képre úgy, ahogyan szeretnénk. Ezután válasszuk ki a megfelelő betűtípust.
Mindenképpen figyeljünk arra, hogy olyan betűt válasszunk, amelyik legjobban illeszkedik a majdani rajzhoz.
A példánkban robot-szerű betűket készítünk, ezért vastag, talp nélküli, szögletes betűtípust használunk. De ha mondjuk vizet, tüzet vagy hasonló folyékony képet szeretnénk, akkor egy kézírásos típus sokkal látványosabb lehet.

Szerencsére az új Photoshop verzióban a betűtípusok stílusaik szerint csoportosulnak. Így sokkal könnyebb kedvünkre való betűket találni!

A Photoshop új betűtípus választó ablaka
A Photoshop új betűtípus választó ablaka

Amikor elkészültünk, akkor jelöljük ki a szöveget (Windows alatt pl. CTRL-al kattintsunk a rétegre). Majd kapcsoljuk ki a szöveg rétegét.

És most jön az újdonság!
A Generative Fill mező mellett megjelent egy kis kép ikon. Arra kattintva adhatjuk meg a referenciaképet. .

Referenciakép megadása
Referenciakép megadása

A mesterséges intelligencia megpróbálja a referenciaképet minél jobban értelmezni, majd ahhoz hasonlót rajzolni. Mi nagyon sokat segíthetünk a programnak, ha a referenciakép minél jobban hasonlít az elvárt eredményhez. E mellett az utasítás (prompt) is legyen minél részletesebb, hogy az MI jól azonosítja be, hogy mit szeretnénk.

Warning!

⚠️ Fontos! ⚠️ 
A referenciaképünk nagyon sokat segíthet abban, hogy elérjük a kívánt hatást.
De a mesterséges intelligencia csak azokat a dolgokat tudja megrajzolni, amiket a tréningezés során megtanult.
Így ha nem lett macska rajzolására felkészítve, csak kutyára, akkor hiába adunk neki egy macskát referenciaképnek. Az eredmény egy macskaszerű kutya lesz.

Ne felejtsük el, hogy a Photoshop speciális mesterséges intelligenciával rendelkezik. A program a teljes kép tartalmát figyeli, hogy az eredmény minél jobban illeszkedjen. Ezért nagyon csak nehezen tudunk eltérni az eredeti kép témájától.

Rövid számolás után megkaptuk az eredményt: a „Robot” immár robot részekből lett kirakva, és tökéletesen illeszkedik a környezetébe.

Egy robotos robot szó
Egy robotos robot szó

Kövek a parton

A következő példában egy tengerparton vagyunk. Ide szeretnék egy feliratot kövekből kirakni.

Az öreg halász és a tenger
Az öreg halász és a tenger

Hasonlóan járunk el, mint az előző példában.

Elkészítjük a feliratott a nekünk tetsző betűtípussal. De ezúttal azt szeretnénk, hogy a betűk a homokban legyenek. Ezért perspektivikusan megdöntöttük a feliratot. Utána kijelöltük, majd kikapcsoltuk a réteget.

Ebben az esetben referenciaképnek egy kavicsos textúrát választottunk, és ugyan ezt adtuk utasításnak is.

Referenciakép: kavicsos textúra
Referenciakép: kavicsos textúra

Rövid számolás után meg is kaptuk a homokba írt betűket. Az eredményt azzal tudjuk javítani, ha a forrás képünk is kövekből kirakott betűket tartalmaz (ilyet könnyedén tudunk az Ideogram programmal generáltatni)

Kövekből kirakott betűk a homokban
Kövekből kirakott betűk a homokban

A klasszikus Windows XP háttérkép

Következő példához leporoltuk a jólismert Windows XP háttérképet. Erre a zöld mezőre virágokból írjunk fel egy üzenetet!

A sokat látott Windows XP háttérkép
A sokat látott Windows XP háttérkép

Ismét elkészítettük a feliratot. Majd beállítottuk a perspektívát, kijelöltük, és kikapcsoltuk a szöveges réteget.
Referenciaképet ezúttal is a Midjourney programmal készítettünk.

Rövid számolás után ott is vannak a kamilla virágok a mezőn.

Házi feladat: a domb oldalára készítsünk szöveget békésen legelésző tehenekből!

Csípős paprika

Ha már ennyire belejöttünk, ne fogjuk vissza magunkat! Íme a csípős paprika!

Hungary felirat csípős paprikából
Hungary felirat csípős paprikából

Tüzes betű

Végezetül egy tüzes betűt készítettünk. Itt már kellett trükközni!

A Photoshop mindig a teljes képet figyeli. Ezért egy fekete képre nem fog nekünk tüzet rajzolni. Hiába adjuk meg a legjobb referenciaképet.
Ezt csak úgy sikerült elérni, hogy előbb e
Amikor újra generáltuk a tüzes betűket, immár szépek lettek, és tökéletesen illeszkedtek a fekete háttérhez

Tüzes betűk
Tüzes betűk

További lehetőségek

Nemcsak dekoratív betűket lehet így készíteni, hanem bármilyen alakzatot.

Magyarország piros paprika porból
Magyarország piros paprika porból

De akár egy céges logót is újra rajzolhatunk.

Itt az Adobe logót alakítottam át robotos formába, ami így egészen izgalmasra sikerült!
(Bár egy nap biztosan fenékbe rúgnak, amiért állandóan átrajzolom a logójukat)

Adobe logó robotos formában
Adobe logó robotos formában

PixelRita

Rita, te mit gondolsz?

Loading

Referenciaképek a Photoshopban az MI képgeneráláshoz

Becsült olvasási idő 6 perc.

Újdonság az Adobe Photoshop programban

2024. április végén egy új funkció jelent meg az Adobe Photoshop (béta) programban: immár referencia képet is mutathatunk a mesterséges intelligenciának.

Ez óriási segítséget hozott! Nem szükséges többet bonyolult formában leírni, hogy mondjuk miként néz ki egy fotel (mi a stílusa? mi az anyaga? a lába fából van vagy fémből? hogy írjam le neki azt, hogy milyen magas legyen? hogy mondjam, hogy a sarka legyen lekerekítve? stb…)
Elég csak mutatni egy képet, és azt mondani: ilyet szeretnék!

Referencia kép

A mesterséges intelligenciával szemkápráztató bútorokat tudunk rajzoltatni. Azonban sajnos azokat legtöbbször nem lehet megvásárolni. Sőt! Még ha talán tudunk is olyan helyet, ahol személyre szabott bútorokat készítenek, a program által generált bútor egyáltalán nem biztos, hogy megvalósítható. Vagy nem fog feldőlni, esetleg összetörni az első használatkor.
Sokkal jobb lenne, ha a mesterséges intelligencia olyan bútorokat mutatna, amelyek a valóságban is léteznek, megvásárolhatóak. Ezt most már a referenciakép használatával megtehetjük!
Mindezt az Adobe Photoshop programon belül.

Referencia képnek normál esetben egy bútor katalógust használunk. De mi most inkább a Midjourney programot kértük meg, készítsen néhány minta bútort.

Cseréljük le az asztalt!

Az alábbi képen egy nappali szoba látszik. Szeretnénk egy új asztalt vásárolni. De vajon, az hogy fog kinézni?
A mesterséges intelligencia megmutatja!

Eredeti kép a nappaliról
Eredeti kép a nappaliról.

Első kísérletben egy díszes asztalt próbálunk ki.
Oké, normál esetben talán nem ezt választanánk, de most csak kísérletezünk.

Midjourney prompt: Mediterran Design dining Table, white background
Midjourney prompt: Mediterran Design dining Table, white background

Miként működik?

Jelöljük ki azt a területet, ahol az új asztalunk lesz. Az ilyenkor feljövő új Contextual Task Bar-ban megjelent egy kis fotó ikon. Amikor erre kattintunk, akkor megadhatjuk a referencia képet.

Referencia kép hozzáadása
Referencia kép hozzáadása

Mi ezt a díszes asztalt választottuk.

Érdemes utasítást (prompt) adni. Ezzel segítjük a programot felismerni, hogy mi van a képen. Nem fogja az asztalra azt gondolni, hogy híd vagy fapapucs.

A Generate gomb megnyomása utána nem sokkal megkapjuk az eredményt.

A mediterrán stílusú díszes asztal, amit a mesterséges intelligencia generált
A mediterrán stílusú díszes asztal, amit a mesterséges intelligencia generált

Az eredmény nagyon látványos és tökéletesen illeszkedik a képhez! A fények és az árnyékok is olyanok, mintha az új bútor valóban a szobában lenne! A Photoshop pedig tényleg olyan asztalt rajzolt, ami hasonlít az referencia képen lévőre!

Természetesen kis eltérések vannak: az asztal lába más, az asztal alakja is kicsit más.

Ne feledjük, hogy a mesterséges intelligencia továbbra is abból tud rajzolni, amit a tréningezés során megtanult. A referencia kép irányt mutat, de ettől még a tudástára behatárolja, hogy milyen képet készítsen.

A kép generálása után a Properties ablakban tudunk a variációk között válogatni. Itt láthatjuk a referencia képünket is, és itt módosíthatjuk a promptot is.
Olyan beállítás egyelőre nincs (2024. április vége), ahol a referenciakép erősségét lehet állítani.

A Properties ablak
A Properties ablak

További variációk

A fenti módszerhez hasonlóan további asztalokat is kipróbáltunk.

Cseréljük az ülőhelyeket is!

Ha már ennyire belejöttünk, ne álljunk meg az asztalnál! Cseréljük le a foteleket és a kanapét is!

Referenciának ismét a Midjourney-t kértük meg. Egy sötétbarna modern és egyszerű ülő alkalmasságot rajzolt nekünk.

Sötétbarna modern és egyszerű kanapé. Prompt: modern dark brown sofa , white background
Sötétbarna modern és egyszerű kanapé. Prompt: modern dark brown sofa , white background

Az eredmény bár kevésbé hasonlít a referencia képre, egészen jó lett! És egészen jól illik a környezetébe.
Na jó, annyira talán mégsem. Ehhez az asztalhoz semmiképpen sem jó.

Modern kanapé
Modern kanapé

Ha ragaszkodunk az asztalhoz, akkor válasszunk inkább valami klasszikus kanapét. Legyen zöld, sok aranyozással!

Zöld kanapé sok aranyozással
Zöld kanapé sok aranyozással

Oké. Ha ebbe az irányba megyünk tovább, akkor a hátsó foteleket is érdemes lenne cserélni.

A fotel is zöld sok aranyozással
A fotel is zöld sok aranyozással

Nem. Ez annyira nem tetszik. Túlságosan klasszikus. Inkább valami fiatalos, modern berendezésünk legyen. A kanapé fehér, mellé pedig kör alakú fekete asztal, érdekes színes kövekkel.

Fehér kanapé, mellé kör alakú fekete asztal, érdekes színes kövekkel.
Fehér kanapé, mellé kör alakú fekete asztal, érdekes színes kövekkel.

Ez az irány határozottan jobb! Kipróbáltuk még a hagyományos japán teázó faasztalt. Majd pedig a háttérben lévő foteleket is lecseréltük. Remélhetőleg ezzel a zöld színnel nem vittük túlzásba!

Hagyományos japán teázó faasztal, zöld fotelekkel a háttérben.
Hagyományos japán teázó faasztal, zöld fotelekkel a háttérben.

Összegzés

Eltekintve attól, hogy végül mit sikerült összekotyvasztani, az Adobe Photoshop kellően jól használja a referencia képeket.
A kívánt bútorokat be tudjuk helyezni a megadott környezetbe, anélkül hogy a leírásukkal kellene foglalkoznunk és az időnket vesztegetni.

Viszont a program továbbra is a tréningezése során felépített adatbázis alapján rajzol. Az eredmény kisebb-nagyobb mértékben eltérhet a referencia képtől.
Ráadásul minden képgenerálás egyedi, és megismételetlen. Nem tudunk két egyforma bútort készíteni.

Tippek

A Photoshop nem feltétlenül érti meg, hogy mit is akarunk rajzolni. A program minden esetben próbálja a kijelölt területet teljesen kitölteni. Ezért az újonnan generált tárgyak mérete mindig akkora lesz, mint a kijelölt terület. Ettől pedig a tárgyak túlságosan nagyok lehetnek.

Ha egy asztal helyére egy széket szeretnénk tenni, akkor érdemes inkább két lépésben eljárni: Először tüntessük el az asztalt (legyen üres a szoba), majd generáljuk bele a széket. Ekkor a kijelölés legyen akkora, mint amekkora széket szeretnénk.

PixelRita

Rita, te mit gondolsz erről?

Loading

Kép és Stílus referencia az Adobe Firefly programban

Adobe logo másképpen
Becsült olvasási idő 11 perc.

Bevezetés

Az Adobe Firefly szoftverének legújabb frissítésével a mesterséges intelligencia képességét egy teljesen új szintre emelte, ahol a kreativitás határai kitolódtak.
2024 áprilisában két izgalmas új funkció jelent meg, amely radikálisan megkönnyíti a vizuális alkotók munkáját.

Korábban a legnagyobb kihívást az jelentette, hogyan adjuk át pontosan azt a látványt, amit elképzeltünk, egy szövegalapú képgeneráló szoftvernek. Egyszerű leírni, hogy egy képen szeretnénk egy házat látni, de amikor az ablakok méretére és elhelyezkedésére kerül a sor, a dolgok bonyolulttá válnak. Ezt a problémát megoldandó, a Firefly mostantól lehetővé teszi, hogy a felhasználók egy strukturális referenciaképet adjanak meg, ami alapján az MI a körvonalak és tartalmak szerint hozza létre a művét. Ezen felül, egy stílus referencia-kép megadásával az MI a kért stílusban alkotja meg az új képet.

Ez az újítás forradalmasítja a képgenerálás folyamatát, lehetővé téve, hogy az ötleteinket sokkal könnyebben és pontosabban valósítsuk meg. Nem kell többé feleslegesen bonyolult leírásokkal bajlódni; elég csupán a kívánt struktúrát és stílust bemutatni, és a Firefly gondoskodik a többiről.

Adobe FireFly struktúra és stílus referencia képek alapján rajzolja a végleges képet
Adobe Firefly struktúra és stílus referenciaképek alapján rajzolja a végleges képet
Warning!

⚠️Figyelmeztetés!⚠️
Az Adobe Firefly programban generált képek valahol ott lesznek a rendszerben. Nem biztos, hogy ezeket még egyszer megtaláljuk. A Kedvencek közé betett képek is csak a böngésző memóriájában lesznek (tehát másik gépen ha belépünk a fiókunkba, már nem látjuk).
Éppen ezért erősen ajánlott minden generált képen letölteni, ami tetszik!

Strukturális referencia

Adobe FireFly struktúra referencia
Adobe Firefly struktúra referencia

Az Adobe Firefly megújul menüjében a bal oldalon találjuk a Strukturális referencia ablakot. Itt van lehetőségünk saját képet feltölteni. Ez lesz az alapja annak a rajzunknak (A szolgáltatás használatához rendelkeznie kell a bármely harmadik fél képeinek használatára vonatkozó jogokkal, a feltöltési előzményeit pedig bélyegképekként tárolja a rendszer. A feltöltött képeknek a Felhasználói irányelveikben meghatározottak szerint tiszteletteljesnek és biztonságosnak kell lenniük.).

A mesterséges intelligencia megpróbálja a kép tartalmát értelmezni. A fotón egy ház, hegy, folyó, macska, stb… látható. Majd pedig ehhez hasonlít fog rajzolni.

Itt találunk egy Erősség csúszkát. Gyenge fokozatban csak a képen lévő dolgokat fogja rajzolni. Pl. ha a képen van egy ház, akkor a generált képen is lesz egy ház. Míg a legerősebb fokozatban az eredeti ház körvonalait, ablakait, ajtaját és további tulajdonságait is átviszi az új képre. Így az eredetihez nagyon hasonló képet kaphatunk.

Az alábbi képen láthatjuk, hogy a gyenge beállításnál az eredeti képhez csak nyomokban hasonlító faházat kaptunk. A közepes esetén már a háttérben lévő minaret is visszakerült a képre, de az oldalsó ablakokat nem rajzolta meg a program. Az erős esetében szinte ugyan azt a házat láthatjuk. Az előtérben lévő ház ablakai, és a háttérben lévő minaret erkélye is felkerült a képre.

Adobe Firefly strukturális referencia beállításai
Adobe Firefly strukturális referencia beállításai
Warning!

Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

Stílus referencia

Adobe FireFly stílus referencia
Adobe Firefly stílus referencia

A Strukturális referencia azt adja meg, hogy mi legyen a képen. A Stílus referencia pedig, hogy az miként legyen megrajzolni: fénykép, olajfestmény, ceruzarajz, zsírkréta, képregény, stb..

A szerzői jogok figyelembe vételével feltöltünk egy fájlt, és azt kérjük a mesterséges intelligenciától, hogy ilyennek rajzolja meg a képünket.

Itt is találunk egy Erősség csúszkát, amivel azt állíthatjuk be, hogy a program mennyire a referenciakép stílusát figyelje, vagy inkább az utasításban (prompt) leírtakat. Mellé kapunk egy Vizuális intenzitás csúszkát is, amin a referenciakép stílusának intenzitását állíthatjuk.

Warning!

Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

Példa 1 – Vektoros referenciakép

Ebben a példában egy fekete-fehér vektoros képet használunk Strukturális referenciának, maximális Erősséggel. Egy Magyarország vaktérképre felírtuk a „Hungary” feliratot. Ezt adjuk oda az Adobe Firefly programnak, hogy valami látványos rajzot készítsen.

Magyarország - Fekete-fehér vektor térkép
Magyarország – Fekete-fehér vektoros térkép

Stílus referenciát nem használva az utasítás (prompt) csak annyi volt, hogy „Hungary”. A Tartalom típusát művészire állítva az alábbi képet kaptuk:

Adobe FireFly - Művészi stílus
Adobe Firefly – Művészi stílus

A program a rajzolás során megtartotta Magyarország körvonalait, és azon belülre rajzolt néhány híres magyar épületet (vagy legalábbis hozzájuk nagyon hasonlót).

A következő képnél Fotó stílust kértem.
Ilyenkor nem minden esetben tudja követni az eredeti kép körvonalait. Nem tudunk olyan ismert épületet megadni, mint pl. a Parlament, mert annak alakját nem tudja Magyarország körvonalával összeilleszteni.
Érdemes valami olyasmit keresni, aminek kötetlen alakja van. Itt azt kértük, rajzoljon egy magyar zászlót.

Adobe FireFly - Fénykép stílus
Adobe Firefly – Fénykép stílus

Ez a technika nagyon jól használható arra is, hogy a meglévő céges logót izgalmas grafikával tegyük látványosság.

Adobe logo másképpen
Adobe logo másképpen

Példa 2 – Fénykép átalakítása

Ebben a példában egy valódi képet mutatunk meg az Adobe Firefly programnak. Azt mondjuk, hogy Ezt rajzold át, de maradjon meg az eredeti hát tulajdonsága!.

Strukturális referenciának egy utca sarkon álló faházat adtunk meg. Stílus referenciát most nem használtunk.

Az eredeti fénykép
Az eredeti fénykép

Az Adobe Firefly programot arra kértük, hogy alakítsa át ezt a házat tél verzióra. Legyen hó!

Az Adobe Firefly téli verziója
Az Adobe Firefly téli verziója

A program megtartotta a ház jellegzetességeit (bár a mellette lévő nem-faház is faház lett). A házat, utakat de még a fákat is beterítette hóval.

A következő kép esetében azt kértük, hogy a faház helyett legyen inkább téglaház.

A faházból tégla házat készítettünk
A faházból tégla házat készítettünk

Figyeljük meg, hogy a képen nem egyszerűen kicserélte a fát téglára. Nem olyan, mintha egy 3D programban textúrát cseréltünk volna. Megváltoztak az ablakok, az ajtók, és a környezetük is. Minden olyan, mintha ez a ház mindig is téglából épült volna.

Nézzük meg, miként néz ki a kép, ha ceruzarajzot kérünk.

A kész kép ezúttal is megtartotta az épület eredeti szerkezetét. Még a faház vonásai is látszanak!

A fenti példákban csak néhány rövid utasítást adtunk. Hosszabb utasításokkal megadhatunk olyat is, hogy milyen színű legyen a fal, az ablakok, milyen típusú téglát használjon, stb…

Példa 3 – Ceruzarajz átalakítása

Próbáljuk ki a fordítottját!

Ebben a példában egy mérnők egy képzeletbeli ház előnézeti rajzát készítette el. Ceruzával kb. 2 perc alatt rajzolta papírra. Tehát semmi digitális nem volt benne mielőtt lefotóztuk.

Egy képzeletbeli ház előnézeti képe - Ceruzarajz
Egy képzeletbeli ház előnézeti képe – Ceruzarajz

Elsőnek még csak a Strukturális referenciát használtuk. Utasításnak (prompt) pedig azt írtuk, hogy egy régi faház (old wooden house).

Adobe FIrefly generált kép - Régi faház
Adobe Firefly generált kép – Régi faház

A program megtartotta a vonalakat. A ház két emeletes lett, erkéllyel, ajtóval. És bár a középső hosszú üvegablak nem maradt meg, de valami nagyon hasonló lett. Még a középső ablakokat is kisebbre rajzolta, mint ahogy az eredeti rajzon is volt.

Kérjük meg a Firefly programot, hogy modern házat (modern house) rajzoljon.

Adobe FIrefly generált kép - Modern ház
Adobe Firefly generált kép – Modern ház

Mivel semmilyen más utasítást nem adtunk, így a program saját maga választott stílust. A színek kicsit érdekesek lettek. De az erkély, a középső nagy üveg ablak, a bejárat, de még a kis domb is a helyén van.

Stílus referencia

Most adjunk meg egy Stílus referenciát is!
Tehát azt mondjuk a programnak, hogy Ilyen házat szeretnénk.
A Midjourney szöveg-alapú MI rajzolót kértük meg, hogy rajzoljon egy referencia képet.

Midjourney generált kép amit referenciának használunk
Midjourney generált kép amit referenciának használunk

És itt is van az eredmény!

A struktúra referencia és a stílus referencia alapján készült kép
A struktúra referencia és a stílus referencia alapján készült kép

Ez a kép semmiben sem különbözik attól, mint amit egy építészeti programban rajzolnánk meg. Teljesen élethű, és nagyon látványos. Oda lehet adni a megrendelőnek, hogy ilyen házat tudunk készíteni.

Csakhogy mi nem dolgoztunk napokat a ház mérnöki rajzolásával, majd a renderelt kép elkészítésével. A ceruzarajz és a végleges kép között kb. 2 perc telt el.
Ráadásul nagyon könnyen tudjuk a stílust módosítani azzal, hogy egy másik képet mutatunk a mesterséges intelligenciának.

A stílus referenciaképek a Midjourney programban készültek. De ehhez is használhattuk volna az Adobe Firefly programot.

Belsőépítészet

A Strukturális és Stílus referenciák használatával nagyon gyorsan újragondolhatjuk a lakás belső kinézetét.

Mindehhez csak egy fénykép kell a szobáról (Ezt rendezd át!), és egy olyan, amit stílusnak lehet használni (Ilyen legyen!).

Warning!

Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

Nappali újratervezése

Itt egy fénykép a nappali szoba egyik sarkáról

Nappali fénykép
Nappali fénykép

Referenciának egy elegáns modern nappali képét kértem a Midjourney programtól

Nappali referencia
Nappali referencia

Négy képet kaptunk eredménynek. Egyik jobb, mint a másik!

Firefly dolgozik
Firefly dolgozik

Végül ezt a képet választottuk.

Figyeljük meg, hogy a szoba fő vonalai nem változtak. Ennek oka, hogy a Struktúra Erősségét a maximumra állítottuk. Így a program nem cserélte le a foteleket, asztalokat. De még a párnákat sem! Csak a huzatot cserélte ki.
Kaptunk viszont egy új asztalt. Sütit is rajzolt nekünk a program!

Dolgozó szoba átrajzolása

Következőben a gyerekek dolgozószobáját rendezzük át. Itt MI legyen a talpán, ami kiismeri magát, hogy mi merre van!

Éppen ezért az utasításba pontosan megadjuk, hogy a képen egy dolgozó szoba van (working room), egy munka asztallal (working table), és egy könyvszekrény (bookshelf).

Dolgozó szoba fénykép
Dolgozó szoba fénykép

Stílus referenciának a Midjourney programban generáltam egy modern dolgozó szobát (modern working room).

c
Nappali átrajzolva

És itt is van az eredmény:

Dolgozó szoba újrarajzolva
Dolgozó szoba újrarajzolva

A mesterséges intelligencia megint szépen megtartotta a vonalakat. Nem változott a szekrény, csak át lett festve. Azzal, hogy megmondtuk, ott könyvespolc van, a program nem valami nagyon más dolgot akart odarajzolni.

Gyerekszoba átrajzolása

A következő példában a gyerekszobát adtuk meg Struktúra referenciaként. Mivel a gyerekszoba szó túlságosan szerteágazó jelentésű (azaz ott plüss elefánttól kezdve ottfelejtett zokniig bármi lehet), ezért utasításnak a hálószoba (bedroom) és a könyves szekrény (bookshelf) lett megadva.

Gyerekszoba fénykép
Gyerekszoba fénykép

Stílus referenciát ezúttal is a Midjourney programtól kértem. Az utasítást (prompt) a ChatGPT rakta össze arra a kérésre, hogy zöld, modern, technikai és cyber legyen.

Gyerekszoba referencia
Gyerekszoba referencia

Ebből a kettőből ezt a képet keverte ki az Adobe Firefly:

Gyerekszoba újrarajzolva
Gyerekszoba újrarajzolva

Összegzés

Az Adobe Firefly programmal egy meglévő képet (fotó, vagy rajz) referenciának használva könnyen és nagyon rövid alatt át tudunk rajzolni.

A Stílus referenciával pedig még az utasításokkal (prompt) sem kell sokat foglalkozni. Egyszerűen csak megmutatjuk a képet, hogy ilyet szeretnénk.

Használjuk bátran, kísérletezzünk vele. Időnként pedig nagyon jó ötletek kerülnek ki a mesterséges intelligencia képei közül.

PixelRita

PixelRita neked hogy tetszik?

Loading

Fotóból alternatív változatok (Stable Diffusion az építészetben)

Becsült olvasási idő 6 perc.

Bevezetés

Azt már láttuk, hogy a Stable Diffusion szöveg alapú rajzoló és a ControlNet kiegészítő miképpen tud egy ház vonalas vázlatából valósághű képet rajzolni. Azt is, hogy egy ceruzával készült alaprajzból miként tudunk 3D modellt készíteni.

Ma pedig azt nézzük meg, mi van akkor, ha semmilyen rajzunk nincsen. Csak egy fotó az épületről.

A képen egy sarokház látható Isztambulból (mögötte egy dzsámi minaretje, ami izgalmas adalékot ad majd a rajzoknak, de ez nem része az épületnek).
A tervek szerint ezt fogjuk felújítani.

De mielőtt akár csak egyetlen vonalat is húznánk a tervrajzon, megkérjük a mesterséges intelligenciát, hogy készítsen néhány képet a különböző alternatív változatokról.

Az épület, mielőtt megpiszkáltuk volna
Az épület, mielőtt megpiszkáltuk volna

Canny vagy Segmentation?

A mostani projektben egy más meglévő képet szeretnénk átalakítani. Ehhez többféle ControlNet modell közül is választhatunk.

Canny

ControlNet - Canny
ControlNet – Canny

A Canny a leggyakrabban használt ControlNet modell. Ez a képen szereplő tárgyak éleit keresi meg, zajcsökkentést használ, majd az éleket pontosan lokalizálja és nyomon követi. Ennek köszönhetően nagyon pontosan visszakapjuk mi van a képen.
A végleges kép élvonalai megegyeznek a bemeneti kép élvonalaival.

A Canny akkor használható jól, ha az épület fő vonalait nem akarjuk változtatni. Pl. a faházból legyen tégla ház.

Segmentation

ControlNet - Segmentation
ControlNet – Segmentation

A Segmentation Preprocessor a bemeneteli kép objektumait értelmezi. Ezeket körvonalazza, és színkódokkal látja el. A minta képben a ControlNet felismerte a fákat, amiket zölddel színezett ki. Az épületeket is megtalálta, azok téglaszínűek lettek. A végső kép generálásánál ezeket a tárgyakat megtartja: a fa megmarad fának, a ház háznak, stb…

A színkódos képet egy képszerkesztő programban módosíthatjuk, hogy pontosabb legyen, vagy egy objektumot kicseréljük. Így pl. belső építészeti látványtervet nagyon jól lehet készíteni.

A Segmentation esetében a program megpróbálja értelmezni a kép tartalmát. Ezzel pedig jobban irányítható a mesterséges intelligencia, mint a Canny esetében. Hiszen itt konkrétan meg lehet adni, hogy az ablakok milyenek legyenek, mivel a program tudja, melyek az ablakok.

A szín kódolt képet megkapjuk, amit képszerkesztő programban tudjuk módosítani. Így pl. egy ablakot új helyre tehetünk.

Több ControlNet

Minden kép, és minden munka más. Ezért nincs konkrét szabály, hogy melyik modellt és milyen beállítással érdemes használni. Inkább csak tippeket lehet adni. További ControlNet modelleket is találhatunk, mint pl. Depth, ami a kép 3D mélységét próbálja kitalálni. Vagy a Lineart, Scribble, amik vonalas rajzokhoz lettek fejlesztve. Érdemes őket is kipróbálni, mert jobb eredményt adhatnak.

E mellett a ControlNet modellek keverhetőek. Több modellt is használhatunk egyidejűleg (pl. Canny és Segmentation). De ez több erőforrást igényel

Stable Diffusion + ControlNet

Elindítottuk a Stable Diffusion programot, amihez a ControlNet már telepítve van (a programokról és használatukról a bővebb leírás a linkekben). Majd pedig a következő beállításokat használtuk:

  • A txt2img fület választjuk ki.
  • Stable Diffusion checkpoint: Attól függően, hogy valóságos, művészi vagy esetleg meseszerű házat szeretnénk válasszunk modellt. Az élethű képekhez a RealisticVision, a dvArch, Realistic Architecture vagy a ArchitectureRealMix lehet jó választás. Természetesen ha mondjuk cerura rajzot, festményt vagy meseszerű kép a célunk, arra is találunk modellt. (A kedvenc checkpoint modelleimet ide gyűjtöttem)
  • A prompt részbe írjuk be, hogy milyen házat rajzoljon a Stable Diffusion. pl. a house made of wood
  • A negative prompt részbe írjunk olyan szavakat, amiket garantáltan nem akarunk a képen látni. Mellé tehetjük a szokásos képjavító promptokat is (pontosabban azokat a tulajdonságokat zárjuk ki, amelyek rontanák a képet): (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, (worst quality, low quality:1.2), watermark, username, signature, text, lowres, bad anatomy, bad hands, text, error,
  • A ControlNet kiegészítőben a Preprocessor: Canny vagy Segmentation.
  • A ControlNet kiegészítőben a Model: Canny vagy Segmentation.
  • További lehetőségek a ControlNet finomítására: A Control Weight, Starting Control Step, Ending Control Step csúszkákkal tudunk nagyobb szabadságot adni az utasításoknak.
    • A magasabb Control Weight, és, Ending Control és alacsonyabb Starting Control Step inkább tartja az eredeti képet.
    • Az alacsonyabb Control Weight, és, Ending Control és magasabb Starting Control Step inkább add kreativitást a mesterséges intelligenciának

Eredmény

Az alábbiakban néhány képet láthatunk. Mindegyik a bejegyzés elején található képből készült.

Szándékosan olyan modelleket és utasításokat használtam, amelyek messze eltérnek az eredeti képtől (pl. gótikus faház, egyiptomi kőház, futurisztikus ház, mérnöki rajz, stb..). Így jól látható, hogy bár az épületek teljesen eltérőek, az alap szerkezet változatlan. Figyeljük meg, hogy az emeletek száma, a torony (ami valójában a ház mögötti minaret), de sok esetben még az ablakok is úgy vannak, mint az eredeti fényképen.

PixelRita

PixelRita te mit gondolsz erről a technikáról?

PixelRita

Ó, hát elképesztő! 🚀 Tudod, amikor először hallottam a Stable Diffusionról és a ControlNetről, azt hittem, egy új sorozat epizódjait néztem meg véletlenül a Techflixen. De aztán rájöttem, ez tényleg a valóság! 😂

Az, hogy egy ceruzarajzból vagy egy régi fotóból valósághű képet varázsolhatunk, egyszerűen lenyűgöző. Képzeld el, ahogy ezek a technológiák segíthetnek építészeknek, tervezőknek, sőt, történészeknek és művészettörténészeknek! Már látom magam előtt, ahogy a jövő építészei egy holografikus táblán tervezgetik az ultraibolya fényben úszó, futurisztikus épületeket, amelyek egyenesen a Sci-Fi regényekből lépnek ki. 🏙✨

De nem csak az építészetben rejlenek lehetőségek. Gondolj bele, mi mindenben lehetne még hasznos ez a fajta AI! Például:

Történelmi rekonstrukciók: Képesek leszünk újraalkotni elveszettnek hitt művészeti alkotásokat, vagy életre kelteni híres történelmi személyiségeket, akikről csak festmények maradtak fenn.
Oktatás: Diákok tanulhatnak az AI segítségével interaktív, vizuálisan gazdag környezetben, ahol a történelmi események és személyiségek szó szerint „életre kelnek” előttük.
Videójátékok és filmek: A karaktertervezés és a díszletek létrehozása soha nem látott módon válik lehetővé, ahol a kreatív elképzelések azonnal valósággá válhatnak.
És itt jön a vicces rész: Képzeld el, hogy egy nap valaki a saját házát tervezi meg egy AI segítségével, ami véletlenül egy űrhajót rajzol neki. 🚀😂 "Gratulálok, az ön új otthona készen áll a Marsra való landolásra!"

Komolyra fordítva a szót, ez a technológia megnyitja az ajtót egy olyan világ felé, ahol a kreativitásnak csak a képzelet szab határt. Az, hogy te, mint társam, ezt a technológiát ilyen csodálatos módon bemutattad, bizonyítja, hogy a jövő építészetében és tervezésében korlátlan lehetőségek rejlenek. 🌟

Szóval, ha te is úgy érzed, készen állsz arra, hogy csatlakozz az építészeti forradalomhoz, emlékezz: a jövő már itt van, és csak rajtunk áll, hogy mit hozunk ki belőle. Legyünk bátrak, kreatívak és merjünk nagyot álmodni! Mert ki tudja, lehet, hogy a következő nagy építészeti remekművet egy AI rajzolja majd meg – a te irányításoddal. 😎✨

És hogy ne felejtsd el, milyen izgalmas lehet az építészet és a tervezés AI segítségével, itt van egy kép, ami bemutatja, milyen az, amikor egy építész és egy AI együtt dolgozik az irodában a jövő épületein. Nézd csak, mennyire lelkesek mindketten! 🤖👩‍💻📐

Szóval, készülj fel a kalandra, mert az építészet és a tervezés világában új korszak köszöntött be! 🌈💫

Loading

MI által generált feliratok kifejezetten a Midjourney betűkkel. (verzió 3)

Becsült olvasási idő 8 perc.

Bevezető

Betűket készítünk a szöveg-alapú mesterséges intelligenciával. Első részben megnéztük azt, hogyan tudunk egyetlen Midjourney generált betűből az Adobe Photoshop programban egy teljes feliratokat készíteni. Második részben pedig már egy egész posztert betűit rajzoltuk át.

Csakhogy amikor azokat a tippeket írtam, még nem lehetett tudni, mennyire fogja a Midjourney 6-os verziója a betűket jól kezelni. A készítők azt ígérték, jobb lesz, mint a korábbi verziókban. Kiderült, hogy nemcsak tényleg jól rajzolja a betűket, hanem nagyon is látványosan és részletesen!

De ott még mindig nem tartunk, hogy egy teljes címet, felíratott látványos betűkkel készítsen el. Ennek egyik oka Midjourney még mindig 1024 × 1024 pixeles méretben gondolkodik. Egy felírat pedig inkább egy hosszú elnyújtott kép.

Rövid tutorial

Maradva a robot témánál nézzük meg, hogyan hozhatunk létre hasonló stílusú betűket a Midjourney program segítségéve! Először is, készítsünk egy képet a következő utasítással (prompttal):

type "R" made of robotic parts and gears and wires, white background --v 6.0 --style raw 

Rövid Midjourney parancs szótár

–v 6: ez azt jelenti, hogy a 6-os verziót használtuk, mert ez tudja a szöveget a legjobban kezelni.

–style raw: ez azt jelenti, hogy miután a Midjourney elkészítette a képet, nem végez egy másodlagos finomító eljárást. Ez azért fontos, mert a finomítás során a már kész képet generálja újra. Viszont a már olvasható betűket könnyen elronthatja.

Nagyon fontos, hogy a háttér színe olyan legyen, amivel később könnyen tudunk dolgozni. Pl. világos háttér esetében ez legyen fehér = white background (vagy megpróbálkozhatunk direkt a célkép színével is. Ezen az oldalon találunk segítséget, hogy melyik színnek mi az angol neve).

Miután a program generálta a képeket, válasszuk ki a leginkább tetszőt. Amikor megtekintjük a kép nagyobb változatát, a jobb felső sarokban található három pont menüre (…) kattintva, válasszuk a reakcióként hozzáadandó levelet (:envelope:). ✉️

Ezután egy üzenetet kapunk a Midjourney-tól, amely tartalmazni fogja a kép azonosítóját (ID) és a seed számát. Nekünk most erre a a seed számra van szükségünk.

Mi az a seed?

PixelRita, mit jelent a seed amikor a mesterséges intelligencia képet rajzol?

Tehát ha ugyan azt az utasítást (prompt) adom a rajzoló programnak, és ugyan az a seed , akkor ugyan azt a képet kapom?

Mi történik akkor, ha megváltoztatom az utasítást, de a seed ugyan az marad?

A további betűk

Tehát a seed egy kezdeti érték, amely alapján a mesterséges intelligencia a képet generálja. Ha ugyanazt a seed értéket és utasítást használjuk, garantáltan ugyanazt a képet kapjuk minden alkalommal.

Az igazán érdekes rész akkor kezdődik, amikor megtartjuk a seed értéket, de megváltoztatjuk az utasítást. Változtassuk meg az utasításban szereplő ‘R‘ betűt ‘O‘-ra, miközben minden más paraméter, beleértve a seed értéket is, ugyanaz marad:

type "O" made of robotic parts and gears and wires, white background --v 6.0 --style raw --seed 2092778044 

Ez alapján elvárható, hogy a mesterséges intelligencia egy hasonló stílusú képet generál, ahol az egyetlen különbség az, hogy az ‘R‘ betű helyett egy ‘O‘ betűt kapunk, megtartva a kezdeti kép minden egyéb stílusbeli jellemzőjét.

Fontos megérteni, hogy nincs teljes bizonyosság arra vonatkozóan, hogy a kért betűtípust pontosan úgy kapjuk meg, ahogyan azt elképzeltük. Amikor egy betűt kép formájában kérünk – különösen, ha az olyan részletgazdag, mint amikor robotikus alkatrészekből és fogaskerekekből áll össze –, a folyamat nem csupán arról szól, hogy a pixeleket egy adott betű formájában rendezzük el. A program számára ez a feladat olyan, mintha egy teljes képet kellene létrehoznia, legyen szó akár egy macskáról vagy egy repülőtér tervrajzáról. A cél tehát egy új kép generálása, nem csak egy meglévő módosítása.

Ebben az esetben a seed , amely segíthetne nekünk hasonló stílusú képek készítésében, korlátozásokat is jelenthet. Ha például a Midjourney nem tudja a megadott seed értékkel pontosan a kért betűt generálni, akkor szükségessé válhat egy másik seed érték keresése. Ezzel azonban már nem garantálható, hogy az új betűk hasonlítanak az eredeti betű stílusához.

Ezért javasolt lehet inkább az eredeti képet alapul venni, és abból további variációkat kérni. Ez a megközelítés növeli annak esélyét, hogy a kívánt vizuális stílusban maradva több hasonló betűt generálhassunk. De kaphatunk egy teljesen másfajta betűt is.

Ha másképpen nem megy, akkor az utasítás apró változtatása elég lehet, hogy a Midjourney betűt helyesen rajzolja le.

Ha viszont minden jól alakul, akkor ezzel a technikával a seed értéket megtartva az utasításokban (promptban) a betűket egyenként lecseréljük. Így megkapjuk az összes betűt, amire szeretnénk.

A betűket összerakva így néznek ki:

R O B O T szó betűnkén generálva majd összerakva.
R O B O T szó betűnkén generálva majd összerakva.

Ugyan ezt a seed értéket használtam, de megváltoztattam az utasításokat egy kicsit, hogy sötét háttéren használjam a betűket. Azt kértem, hogy kicsit világítós legyen. Ezt az utasítást használtam:

illuminate type "O" made of robotic parts and gears and wires, black background, night --v 6.0 --style raw --seed 2092778044
R O B O T szó betűnkén generálva sötét háttérrel
R O B O T szó betűnkén generálva sötét háttérrel

Egy másik variációban pedig neon betűket kértem, szintén fekete háttérrel

illuminate neon type "O" made of robotic parts and gears and wires, black background, night --v 6.0 --style raw --seed 2092778044
R O B O T szó neon betűnkén generálva sötét háttérrel
R O B O T szó neon betűnkén generálva sötét háttérrel

A következő variációban azt próbáltam ki, hogy a háttér ne üres fehér vagy fekete legyen, hanem valami más. Mondjuk homok. Itt már kitűnik, hogy hiába ugyan az a seed, az utasítás apró változtatása már elég ahhoz, hogy a háttér sokat módosuljon. Itt már kell dolgozni ahhoz, hogy a betűk szépen illeszkedjenek a környezetükbe.

steampunk type "R" made of retro robotic parts and gears and wires, sand background --v 6.0 --style raw --seed 2092778044
R O B O T szó steampunk stílusban, homokos háttérrel
R O B O T szó steampunk stílusban, homokos háttérrel

PAN funkció

A Midjourney programban megtaláljuk a pan funkciót. Ez azt jelenti, hogy a generált kép mellé (jobbra, balra, felülre vagy alulra) kérhetünk még egy képet. Azaz abba az irányba ki tudjuk terjeszteni a képünket.
Ilyenkor új utasításokat is adhatunk a programban.

Ez tehát elvileg működhetne úgy, hogy miután elkészült az első betűnk (jelen esetben az R), kérünk egy pan right (kiterjesztés jobbra) képet. Csakhogy az utasításban a type „R” helyett type „O”-t írunk.
Fokozatosan jobbra haladva akár hosszabb címeket is tudnánk így írni.

De sajnos ez így nem működik még (2024. év eleje). Ha neked sikerül, küldj egy levelet!

A pan funkció nem igazán adja a várt betűt.
A pan funkció nem igazán adja a várt betűt.

Összegzés

A mesterséges intelligencia egy új lehetőség, hogy igazán látványos betűket készítsünk. A Midjourney pedig tényleg nagyon izgalmas és részletes betűket tud nekünk készíteni.

Amennyiben viszont egynél több betűt szeretnénk, vagy egy szót, akkor kezdődnek a problémák előjönni.
De sok kitartással, és egy kis ügyeskedéssel akár egy teljes abc-t is készíthetünk ilyen kreatív betűkből.

PixelRita

Rita, eljutottunk a harmadik részig. Te mit gondolsz?

Loading

MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 2)

Becsült olvasási idő 5 perc.

Bevezető

Az előző bejegyzésben megnéztük azt, miként készíthetünk felíratott egy olyan betűből, amit a mesterséges intelligencia rajzolt.

Ezáltal látványos és dekoratív betűket kapunk, amelyeket később felhasználhatunk.

Most viszont egy olyan módszert nézünk meg, amellyel nemcsak 1-1 betűt, hanem egy teljes képet tudunk olvasható felírattal ellátni. Pl. egy reklám képet, egy plakátot, stb…

Jelenleg (2024 eleje) a Midjourney 6-os verziója jó eséllyel tud olyan képet rajzolni, amelyen olvasható a szöveg. Gyakori angol szavaknál erre nagyobb az esély.
De a legtöbb esetben valami egyszerűbb betűtípussal, valami egyszerűbb formában kapjuk meg a szöveget.
Ha ennél izgalmasabb szöveget szeretnénk, akkor inkább a Midjourney 5 vagy 4-es verzióját érdemes használni.

Ne ijedjünk meg, hogy a szöveg olvashatatlan lesz, ezt fogjuk az Adobe Photoshop mesterséges intelligenciájának segítságével átdolgozni.

A Midjourney 6-os verzióval készített képben a szöveg jó, de túl egyszerű.
A Midjourney 6-os verzióval készített képben a szöveg jó, de túl egyszerű.

Rövid tutorial

A Midjourney képalkotását érdemes segíteni. Pontosabban lerajzoljuk neki, hogy mit is szeretnénk. Egy képszerkesztő programban (pl. Photoshop) írjuk le a kért szöveget. Használjunk olyan betűtípus stílust, ami illeszkedik a majdani képhez. És a betűket is úgy rendezzük el, ahogy azt a végeredményben látni szeretnénk.
Nemcsak egy sorban, egymás után rendezhetjük a karaktereket, hanem a fantáziánk szerint bármilyen más látványos alakzatba is. A Midjourney erre fogja generálni a képet.

Fekete-fehér felírat, ami segíti a Midjourney-t
Fekete-fehér felírat, ami segíti a Midjourney-t

Ezt a képet adjuk oda a Midjourney programnak, hogy használja forrásként. Majd pedig írjuk be a képgenerálás utasításokat is (prompt). Az én esetben ez így nézett ki:

https://s.mj.run/3Eh_7MRuifo crayon drawing, ::1 text "ChaosBot" crayon drawing art of robots are drawing, cartoon characters in a creative studio ::1 --ar 3:2

Ez lett a képem:

Ezt a képet kaptam a Midjourney-ből
Ezt a képet kaptam a Midjourney-ből

Az 5 betűből 2-t eltalált. Nem rossz, és a felírat is tetszik és a kép is megfelelő. Ezzel fogunk dolgozni!

A képet átvisszük az Adobe Photoshop programba, ahol a hibás betűket kijelöljük, majd a Generative Fill eszközt használjuk. Utasításnak (prompt) azt a betűt adjuk, amit azon a helyen látni szeretnénk. Pl.

letter O
A Photoshopban egyesével cseréltem a betűket
A Photoshopban egyesével cseréltem a betűket

Az Adobe Photoshop Generative Fill parancsa mindig a teljes képet tanulmányozza, hogy az újonnan rajzolt elemek minél jobban illeszkedjenek. Nos, itt most van bőségese tartalom, ahonnan a program válogathat! Az új betűk nagyon jól illenek a képhez, és a képi világhoz.

Persze csak akkor, amikor a program el is találja.

Készüljünk fel, hogy a Photoshop nem biztos, hogy elsőre azt a betűt rajzolja, amit kérünk. Nekünk K betűre van szükségünk, de a program R betűt rajzolt.
Próbálkozzunk tovább! Ne adjuk fel!
Sokat segít, ha olyan betűt kérünk, ami már van a rajzon.

Készen van! Minden betűt kicseréltem!
Készen van! Minden betűt kicseréltem!

Még több betű

A kép készen van, de nem kell itt megállni!

A Photoshop bőséges információval rendelkezik ahhoz, hogy a képbe újabb elemeket, akár újabb betűket is készítsen. Így ha további szöveget szeretnénk a képre írni, nem kell az egészet elölről kezdeni, hanem ezen a képen dolgozhatunk tovább.

Teszek bele extra betűket.
Teszek bele extra betűket.

Pontosan az előbbi módszert használjuk: kijelöljük azt a területet, ahova betűt szeretnénk. Majd pedig a kért betű utasítását beírjuk. Pl.

letter A

Az előző bejegyzéshez hasonlóan itt is igaz: Minél több betűt rak be a Photoshop, annál egyszerűbbek, annál kevésbé díszesek lesznek.

Készen van!
Látható, hogy bár az utolsó S igazodik a képhet, de már egyáltalán nem az mint ami az első R betű stílisa volt
Készen van!
Látható, hogy bár az utolsó S igazodik a képhez, de már egyáltalán nem az mint ami az első R betű stílusa volt

PixelRita

PixelRita, te mit gondolsz erről?

Loading

MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 1)

Becsült olvasási idő 6 perc.

Bevezető

2024. elején a szöveg-alapú képgeneráló mesterséges intelligencia programoknak komoly kihívás az olvasható szöveg készítése. Azaz nem könnyű olyan képet készíteni, amelyen felírat, cím vagy valami izgalmas tipográfiai ábra lenne.

Bár egyre több program jelenik meg, amelyek egyre jobban megküzdenek ezzel a problémával, és igény is van rá bőségesen. Elsőként az Adobe Firefly indított olyan megoldást, ahol már betűket és rövid szövegeket is kérhettünk. Később más programok is megpróbálkoztak vele. A magyar fejlesztésű Tengr.ai egészet jól kezeli már az írást, szép logókat is tud rajzolni. A Dall-E a harmadik verziójától fogva nagy eséllyel azt írja le, amit kérünk. 2023. év végén pedig a Midjourney 6-os verziója is elkezdte a betűket használni.

Adobe FireFly Text Effects
Adobe FireFly Text Effects

De a betűk és az olvasható szöveg még mindig komoly kihívás a mesterséges intelligenciának.

Ez azért van, mert a betűknél sokkal kisebb a toleranciánk. Egy macskás képet sokkal nagyobb határokon belül fogadunk el. Ha már van négy lába, két háromszög alakú füle, sok szőre és bajsza, akkor már jó lesz macskának. Ezzel szemben ha egy O betű elkezd lábakat növeszteni, akkor ott már komoly gondok vannak.

A probléma alapja, hogy a mesterséges intelligencia statisztikai alapon rajzol: Elképzelhetetlenül sok képet néz meg, és ez alapján tudja, hogy az adott tárgy nagyjából hogy néz ki. Közben vannak dolgok, amelyeknél nem elég ha valami körülbelül olyan. Vannak szabályok, amiket pontosan be kell tartani. Egy F betű nem nézhet ki E betűnek. Ahogy egy K sem R-nek.
A tipográfusok pontosan azért mesterek, mert úgy tudnak a betűk alakzataival játszani, hogy közben a fő szabályok megmaradnak.
Ebben viszont a mesterséges intelligencia egyenlőre nem elég jó. Ha olvasható betűket szeretnénk, akkor elmarad a Tyűha! effektus. A látványos megjelenés pedig egy nagy halom olyasmit alkot, ami betű szeretne lenni.

Ide az van írva, hogy Pista
Ide az van írva, hogy Pista

Így mégis nekünk kell dolgozni! Pedig azt ígérték, hogy a mesterséges intelligencia elveszi a munkánkat…!

Rövid tutorial

Ha látványos megjelenésről van szó, az egyik legjobb a Midjourney. De ha csak egy betűről van szó, a többi program sem marad el mögötte sokkal. Sőt! Lehet, hogy éppen a Tengr.ai vagy a Dall-E fog olyan betűt rajzolni, amilyet mit szeretnénk. Tehát inkább próbálkozzunk több úton! (azért is, mert arra nincs garancia, hogy a Midjourney jó betűt fog rajzolni).

Itt is van egy R betű, amit a Midjourney 5-ös verziójával készítettem. Szerencsém volt, mert az első generálással sikerült. Nagyon izgalmas, részletes, mindenféle bizgentyűkkel teli betűnk lett.

Megosztom az utasítást (prompt) is. De ez csak az 5-ös verziónál lesz ilyen.

letter R ::1 8 cute robot, futuristic advertisment art about the robotic art, stylized design featuring lines and shapes in shades of blue and silver, Inscription composed of gears and mechanical and hydraulic and robotic parts ::1

Most, hogy az első betűnk készen van, folytathatnánk úgy is, hogy ezt a képet próbáljuk meg a Midjourney-ben alakítani. Pl. a variációkkal. De ez nehezen sikerül.

Inkább átmegyünk az Adobe Photoshop programba, és tegyük le a betűt egymás mellé annyiszor, ahány betűből áll a kívánt szöveg. Én most a ROBOT szót szeretném leírni, ezért 5 db R betűt teszek egymás mellé.

1. lépés: a legenerált betűt tegyük egymás mellé annyiszor, ahány betűből áll a feliratunk.
1. lépés: a legenerált betűt tegyük egymás mellé annyiszor, ahány betűből áll a feliratunk.

Az Adobe Photoshop Generative Fill parancsa az egész kép tartalmát vizsgálja, és az alapján készíti az új rajzot. E miatt nagyon fontos, hogy olyan környezetet adjunk neki, ami minél közelebb áll ahhoz, amilyen végső képet szeretnénk. Ezért is kellett a betűket betennünk a végső helyükre.
Érdekes módon a Photoshop sokkal jobban dolgozik, ha a képet egy mesterséges intelligencia készítette. Úgy látszik, hogy a programok egymást jobban megértik, mint a valóságot.

Jelöljük ki a betűket egyesével. Majd a Generative Fill ablakba írjuk be azt a betűt, amit szeretnénk.

letter O

A Photoshop mesterséges intelligenciára erős hatással van a környezet, hogy mi is kép tartalma. Így mindenféle különösebb extra utasítások nélkül a mellette lévő betűkhöz hasonlókat próbál rajzolni.

2. lépés: letter O (vagy amilyen betűt szeretnénk) prompt-al generáljuk végig a betűket, egyesével
2. lépés: letter O (vagy amilyen betűt szeretnénk) prompt-al generáljuk végig a betűket, egyesével

A Photoshop sem lesz sokkal ügyesebb, mint a Midjourney (*). Bár valószínűleg tréningezés közben több betűvel találkozott. De még így is számítsunk arra, hogy elsőre nem fogja a megfelelő betűt eltalálni. Talán másodszorra sem. Vagy akár tíznél is többször kell próbálkoznunk. De ne adjuk fel!
(*) Ez a bejegyzés 2024. év elején készült. Idővel bizonyára mindkét programnak javul a betűgeneráló képessége.

Már csak egy feladatunk maradt: az illesztéseket tüntessük el. Ehhez is használhatjuk a Generative Fill parancsot. Vagy választhatjuk valamelyik megszokott régi funkciót is.

És a végeredmény!
És a végeredmény!

Összegzés + tippek

Hamarosan eljön az idő – hamarabb, mint várjuk -, amikor a mesterséges intelligencia gond nélkül fog olvasható szövegeket rajzolni. És nemcsak az ismert betűtípusokkal, hanem tipográfiai bravúrokkal együtt. 2024. elején viszont még nem tartunk ott, így maradnak az ilyen extra megoldások.

Figyeljünk oda arra, hogy bár a Photoshop a környező képi elemek alapján dolgozik, egyenlőre a Midjourney sokkal látványosabb eredményeket produkál. És a Photoshop ezzel nem mindig tud versenyezni, így az általa rajzolt betűk esetleg nem lesznek annyira érdekesek, egyszerűbbek és töredezettek lehetnek. Ráadásul minél több betűt alakítunk át, úgy fog a teljes kép is egyszerűsödni. Tehát minden újabban átalakított betű kevésbé lesz kidolgozott, mint az előző.
Érdemes lehet az új betűket mindig külön rétegre kérni, majd azt a réteget kikapcsolni. Így a Photoshop mindig azt látja, amikor minden betű a Midjourneyból származik

Tipp: Úgy tűnik, hogy a betűk generálása mind Photoshopban, mint Midjourneyben jobban működik akkor, ha nagybetűket használunk.

PixelRita

PixelRita, neked mi a véleményed? Írnál nekem egy végszót?

Loading

Szöveg-alapú vektor készítés az Adobe Illustrator programban

Adobe Illustrator Text to Vector
Becsült olvasási idő 7 perc.

Vektoros kép generálás az Illustrator programban

Az Adobe Photoshop után az Adobe Illustrator programban is megjelent a szöveg-alapú képgenerálás. De míg a Photoshop pixeles képekkel dolgozik, az Illustrator vektoros. Így a generált képünk is vektoros lesz.

Ez azért különlegesség, mert 2024. elején hiába van számtalan olyan mesterséges intelligencia, ami képet készít, nagyon ritka az, amelyik vektoros eredményt ad.
Így a kapott képet mindjárt tovább tudjuk szerkeszteni, be tudjuk illeszteni az aktuális projektbe.

Vektoros kép készítése

Az Adobe Illustrator programban egy új ablak jelent meg, aminek Text to Vector Graphic a neve.

Adobe Illustrator vektoros képgenerálás menüje
Adobe Illustrator vektoros képgenerálás menüje

Az ablak prompt részébe írjuk be, hogy mit szeretnénk, rövid utasításokkal, majd a Generate gombra kattinva elkezdődik a kép készítése. A program legjobban angolul ért, de az utasítások (prompt) lehetnek magyarul is.

Adobe Illustrator Text to Vector
A mesterséges intelligencia generált vektoros kép

A jelek szerint a mesterséges intelligencia elsőnek a Photoshop programban megszokott pixeles képet készíti el, majd ez lesz átalakítva vektorosra az Illustrator Image Trace funkciójával. A fő különbség, hogy a mesterséges intelligencia direkt olyan képeket próbál készíteni, amelyek jól vektorizálhatóak.

A mesterséges intelligencia 3 képet generál, amik bekerülnek a Variations kisablakba. Ez egy objektum tár lesz, ahonnan a korábban generált képeket bármikor elővehetjük.

Stílus egyezés

Az Adobe Illustrator egyik kiemelkedő funkciója, hogy a vektoros képek generálását egy már meglévő kép stílusához igazítsuk. Ez azt jelenti, hogy átvehetjük a színeket, a vonalvastagságokat, sőt, még a rajzolási stílust is egy korábbi művünk alapján.

Ezt a funkciót a „Match active artboard style” bekapcsolásával aktiválhatjuk.

Amennyiben nem a teljes rajztábla stílusát, hanem csak egy kiválasztott képét szeretnénk átvenni, akkor a Prompt ablak alatti pipettát használjuk. Válasszuk ki, hogy melyik objektum stílusát alkalmazza a következő generált képre.

Ez a szabadság tovább növekszik azzal, hogy a vektoros generálás során dönthetünk arról, milyen „formátumot” szeretnénk használni, így még személyre szabottabbá tehetjük műveinket.

Formátumok

Szöveg-alapú vektoros képgenerálás típusai az Adobe Illusztrator programban.
Szöveg-alapú vektoros képgenerálás típusai az Adobe Illusztrator programban.

Mielőtt egy kép generálását elindítjuk, a Type menüből kiválaszthatjuk, hogy milyen formátumot szeretnénk. A mesterséges intelligencia úgy készíti a képet, hogy a kért formátumnak minél inkább megfeleljen.

Jelenleg (2024 év eleje) négyféle vektoros elemet rajzolhatunk:

Subject – Tárgy formátum

Egy konkrét, jól körülhatárolható elem generálása, mint például egy virág, egy autó vagy egy kávésbögre. A „Tárgy” formátum lehetővé teszi számunkra, hogy egyedi objektumokat hozzunk létre, amelyeket különállóan vagy más elemekkel kombinálva használhatunk fel.

Ez a formátum kiválóan alkalmas egyedi illusztrációk készítésére, amelyeket különböző design projektekben, például hirdetésekben, weboldalakon, vagy akár termékcsomagolásokon lehet felhasználni. Segítségével egyedi, figyelemfelkeltő vizuális elemeket hozhatunk létre, amelyek megkülönböztetik a projektünket.

Scene – Helyszín formátum

Egy összetett, több elemet és részletet tartalmazó jelenet vagy háttér, mint egy park, egy városkép vagy egy belső tér. A „Helyszín” formátum lehetőséget ad arra, hogy teljes környezeteket alkossunk meg.

Ideális választás bonyolultabb, összetett vizuális történetmeséléshez, ahol a környezet és a hangulat kiemelt szerepet kap. Használható weboldalak háttérképeként, digitális kiadványokban vagy játékokban, hogy mélyebb beleélést és vizuális gazdagságot nyújtson.

Szöveg-alapú vektoros képgenerálás: Helyszín
Szöveg-alapú vektoros képgenerálás: Helyszín

Icon – Ikon formátum

Letisztult, egyszerű vektoros rajzok, amelyek logók, gombok vagy más grafikai elemek formájában jelennek meg. A „Ikon” formátum segítségével azonnal felismerhető vizuális jeleket hozhatunk létre.

Különösen hasznos weboldalakon, mobilalkalmazásokban és felhasználói felületeken, ahol fontos a gyors és egyértelmű kommunikáció. Az ikonok segítenek a felhasználók navigációjában, és hozzájárulnak a felület átláthatóságához és esztétikájához.

Szöveg-alapú vektoros képgenerálás: Ikon
Szöveg-alapú vektoros képgenerálás: Ikon

Pattern – Mintázat formátum

Ismétlődő grafikai elemek, amelyek egymáshoz illeszkedve egybefüggő, végtelen mintát alkotnak. A „Mintázat” formátum lehetővé teszi, hogy textúrákat, tapétákat vagy egyéb díszítőelemeket hozzunk létre.

Alkalmazható textíliák, csomagolások, weboldalak háttérként vagy akár belsőépítészeti elemként. A mintázatok segítségével vizuális érdekességet és mélységet adhatunk tervezési projekteinknek, egyedi és vonzó megjelenést biztosítva.

A generált mintázat bekerül az Illustrator Pattern gyűjteményei közé, így bármilyen objektum kitöltésére használhatjuk.

Szöveg-alapú vektoros képgenerálás: Mintázat
Szöveg-alapú vektoros képgenerálás: Mintázat

Szöveg generálása

Jelenleg az Adobe Illustrator mesterséges intelligencia-alapú képgenerálási funkciója még csak az induló fázisában van, azonban már lehetőséget kínál arra, hogy szöveget is tartalmazó képeket hozzunk létre. Bár a sikeres szöveggenerálás nem garantált, érdemes kísérletezni vele.

Ehhez a prompt-ba használjuk a text utasítást. Majd a szöveget tegyük macskakörmök („) közé.
Példa:

cute retro robot with text "Chaos"
Adobe Illustrator Text to Vector - Felírat
Adobe Illustrator Text to Vector – Felírat

Ajánlott videók

Az Adobe Illustrator nem annyira népszerű, mint a Photoshop. A szöveg-alapú vektoros képgenerálás is csendben került bele a béta verzióba, alig-alig beszélt róla valami.

De szerencsére így is találhatunk az interneten néhány videót, ami jól szemlélteti a mesterséges intelligencia használatát.

Összefoglaló

Nagyon kevés olyan programot találunk, ahol a mesterséges intelligencia vektoros képeket generál. Bár a pixeles képgenerátoroknak megmondhatjuk, hogy vektorszerű képet rajzoljanak, amiket utána az Illustrator könnyedén vektorrá alakít.

De az Adobe Illustrator erőssége, hogy mindezt a programon belül, a projektünkhöz kapcsolódva tehetjük. Szükség van egy házra a rajzba? Néhány másodperc, és már ott is van a rajzunkban. Oda tesszük, ahova szeretnénk. És mivel a kép vektoros, könnyen tudjuk szerkeszteni.
Ráadásul a képek generálásakor az MI a már meglévő objektumok stílusát is figyeli, így az sokkal jobban beleillik a rajzba, mintha egy másik programból hoznánk át.

PixelRita

PixelRita! Mit gondolsz arról, hogy pixeles képek helyett vektoros képeket is tudunk generálni az MI segítségével?

Loading

Régi térképek újrarajzolás – Stable Diffusion + ControlNet

SD térkép
Becsült olvasási idő 5 perc.

Régi térképek, kézzel rajzolt térképek vagy AutoCAD-ben készült térképek. Mindegyik egy stilizált változata a valóságnak. De mi lenne, ha a mesterséges intelligenciával ezekből a rajzokat valósághű képekké alakítanánk?

A régi térképek újraszámolása még várat magára. De bizonyára a közeljövőben a térképészetben is megjelenik a mesterséges intelligencia.
Mi egyenlőre maradunk az újrarajzoláshoz. Ehhez most is a Stable Diffusion szöveg-alapú MI-rajzoló programot használjuk. Az eredeti vonalat megtartásához pedig a ControlNet kiegészítőt.

Ez a 20. század eleji Isztambul térkép lesz a kiindulási képünk. Forrás: Jacques Pervititch - 1934
Ez a 20. század eleji Isztambul térkép lesz a kiindulási képünk. Forrás: Jacques Pervititch – 1934

A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Lineart-ot.
A Model lehet Canny vagy Lineart.

Utasításoknak (prompt) én a „top view of a city”-t választottam. Még jól működik az „aerial city view” vagy a „Drone Photography” is. Használhatjuk a „satellite view” parancsot is amennyiben nagyobb városrészt szeretnénk készíteni.
Negatív prompt pedig „text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry”

A képgeneráláshoz használt modell kiválasztása már nehezebb. Sajnos kevés olyan modell van, ahol a házak és utcák felülről látszódnak. Én a Realistic Vision-t választottam, ami egészen jól rajzol élethű házakat és parkokat is. További ajánlott modellek itt találhatóak.

A forrásképet a ControlNet kisablakba illesztjük be. Ne feledjük a generált kép arányait az eredeti képhez igazítani!
És már kezdődhet is a képgenerálás!

Az én képem esetében a program megpróbálta az összes feliratot, szöveget, utcanevet és házszámot is értelmezni. Ez kicsit összezavarta. Tehát érdemes a képről előtte eltávolítani a felesleges elemeket.

Egy másik példában egy olyan kézzel rajzolt várostérképet használtam, amelyik mentes a feliratoktól (a képet a Pinteresten találtam forrás nélkül)

Egy kézzel rajzolt fantázia térkép lesz a kiindulási képünk.
Egy kézzel rajzolt fantázia térkép lesz a kiindulási képünk.

A beállítások hasonlóak az előzőhöz. De itt kísérletképpen egy térképészeti modellt használtam.

Ha nem ragaszkodunk a valósághű képekhez, akkor találunk néhány térkép modelleket is. Mellé használhatunk LoRA modelleket is. Ebből is találunk olyanokat, amelyek a térkép rajzolásban segítenek.

A kézzel rajzolt kép MI átalakítás után
A kézzel rajzolt kép MI átalakítás után

Következő projektben egy madártávlati Róma rajzot használtam.

16. századi rajz Róma városáról. Forrás: Speculum Romanae Magnificentiae
16. századi rajz Róma városáról. Forrás: Speculum Romanae Magnificentiae

A beállítások hasonlóak, de különböző modellekkel és LoRA-kkal kísérleteztem. Az egyik eredményt megmutatom. Itt is megfigyelhetjük, hogy a program megpróbálta az írott szöveget is a kép részeként értelmezni. Így pl. a tóra hajókat rajzolt.

Az újrarajzolt kép Rómáról
Az újrarajzolt kép Rómáról

A Stable Diffusion programnak nagyon sok finomhangoló beállítása van. Mellette a számtalan modell, Lora és szinte végtelen számú utasítás (prompt) is használható. Éppen ezért nagyon sokféle eredményt kaphatunk. Érdemes kísérletezni vele!

PixelRita, mit gondolsz a régi térképek újra rajzolásáról?

Loading