MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 2)

Becsült olvasási idő 5 perc

Bevezető

Az előző bejegyzésben megnéztük azt, miként készíthetünk felíratott egy olyan betűből, amit a mesterséges intelligencia rajzolt.

Ezáltal látványos és dekoratív betűket kapunk, amelyeket később felhasználhatunk.

Most viszont egy olyan módszert nézünk meg, amellyel nemcsak 1-1 betűt, hanem egy teljes képet tudunk olvasható felírattal ellátni. Pl. egy reklám képet, egy plakátot, stb…

Jelenleg (2024 eleje) a Midjourney 6-os verziója jó eséllyel tud olyan képet rajzolni, amelyen olvasható a szöveg. Gyakori angol szavaknál erre nagyobb az esély.
De a legtöbb esetben valami egyszerűbb betűtípussal, valami egyszerűbb formában kapjuk meg a szöveget.
Ha ennél izgalmasabb szöveget szeretnénk, akkor inkább a Midjourney 5 vagy 4-es verzióját érdemes használni.

Ne ijedjünk meg, hogy a szöveg olvashatatlan lesz, ezt fogjuk az Adobe Photoshop mesterséges intelligenciájának segítságével átdolgozni.

A Midjourney 6-os verzióval készített képben a szöveg jó, de túl egyszerű.
A Midjourney 6-os verzióval készített képben a szöveg jó, de túl egyszerű.

Rövid tutorial

A Midjourney képalkotását érdemes segíteni. Pontosabban lerajzoljuk neki, hogy mit is szeretnénk. Egy képszerkesztő programban (pl. Photoshop) írjuk le a kért szöveget. Használjunk olyan betűtípus stílust, ami illeszkedik a majdani képhez. És a betűket is úgy rendezzük el, ahogy azt a végeredményben látni szeretnénk.
Nemcsak egy sorban, egymás után rendezhetjük a karaktereket, hanem a fantáziánk szerint bármilyen más látványos alakzatba is. A Midjourney erre fogja generálni a képet.

Fekete-fehér felírat, ami segíti a Midjourney-t
Fekete-fehér felírat, ami segíti a Midjourney-t

Ezt a képet adjuk oda a Midjourney programnak, hogy használja forrásként. Majd pedig írjuk be a képgenerálás utasításokat is (prompt). Az én esetben ez így nézett ki:

https://s.mj.run/3Eh_7MRuifo crayon drawing, ::1 text "ChaosBot" crayon drawing art of robots are drawing, cartoon characters in a creative studio ::1 --ar 3:2

Ez lett a képem:

Ezt a képet kaptam a Midjourney-ből
Ezt a képet kaptam a Midjourney-ből

Az 5 betűből 2-t eltalált. Nem rossz, és a felírat is tetszik és a kép is megfelelő. Ezzel fogunk dolgozni!

A képet átvisszük az Adobe Photoshop programba, ahol a hibás betűket kijelöljük, majd a Generative Fill eszközt használjuk. Utasításnak (prompt) azt a betűt adjuk, amit azon a helyen látni szeretnénk. Pl.

letter O
A Photoshopban egyesével cseréltem a betűket
A Photoshopban egyesével cseréltem a betűket

Az Adobe Photoshop Generative Fill parancsa mindig a teljes képet tanulmányozza, hogy az újonnan rajzolt elemek minél jobban illeszkedjenek. Nos, itt most van bőségese tartalom, ahonnan a program válogathat! Az új betűk nagyon jól illenek a képhez, és a képi világhoz.

Persze csak akkor, amikor a program el is találja.

Készüljünk fel, hogy a Photoshop nem biztos, hogy elsőre azt a betűt rajzolja, amit kérünk. Nekünk K betűre van szükségünk, de a program R betűt rajzolt.
Próbálkozzunk tovább! Ne adjuk fel!
Sokat segít, ha olyan betűt kérünk, ami már van a rajzon.

Készen van! Minden betűt kicseréltem!
Készen van! Minden betűt kicseréltem!

Még több betű

A kép készen van, de nem kell itt megállni!

A Photoshop bőséges információval rendelkezik ahhoz, hogy a képbe újabb elemeket, akár újabb betűket is készítsen. Így ha további szöveget szeretnénk a képre írni, nem kell az egészet elölről kezdeni, hanem ezen a képen dolgozhatunk tovább.

Teszek bele extra betűket.
Teszek bele extra betűket.

Pontosan az előbbi módszert használjuk: kijelöljük azt a területet, ahova betűt szeretnénk. Majd pedig a kért betű utasítását beírjuk. Pl.

letter A

Az előző bejegyzéshez hasonlóan itt is igaz: Minél több betűt rak be a Photoshop, annál egyszerűbbek, annál kevésbé díszesek lesznek.

Készen van!
Látható, hogy bár az utolsó S igazodik a képhet, de már egyáltalán nem az mint ami az első R betű stílisa volt
Készen van!
Látható, hogy bár az utolsó S igazodik a képhez, de már egyáltalán nem az mint ami az első R betű stílusa volt

PixelRita

PixelRita, te mit gondolsz erről?

Loading

MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 1)

Becsült olvasási idő 6 perc

Bevezető

2024. elején a szöveg-alapú képgeneráló mesterséges intelligencia programoknak komoly kihívás az olvasható szöveg készítése. Azaz nem könnyű olyan képet készíteni, amelyen felírat, cím vagy valami izgalmas tipográfiai ábra lenne.

Bár egyre több program jelenik meg, amelyek egyre jobban megküzdenek ezzel a problémával, és igény is van rá bőségesen. Elsőként az Adobe Firefly indított olyan megoldást, ahol már betűket és rövid szövegeket is kérhettünk. Később más programok is megpróbálkoztak vele. A magyar fejlesztésű Tengr.ai egészet jól kezeli már az írást, szép logókat is tud rajzolni. A Dall-E a harmadik verziójától fogva nagy eséllyel azt írja le, amit kérünk. 2023. év végén pedig a Midjourney 6-os verziója is elkezdte a betűket használni.

Adobe FireFly Text Effects
Adobe FireFly Text Effects

De a betűk és az olvasható szöveg még mindig komoly kihívás a mesterséges intelligenciának.

Ez azért van, mert a betűknél sokkal kisebb a toleranciánk. Egy macskás képet sokkal nagyobb határokon belül fogadunk el. Ha már van négy lába, két háromszög alakú füle, sok szőre és bajsza, akkor már jó lesz macskának. Ezzel szemben ha egy O betű elkezd lábakat növeszteni, akkor ott már komoly gondok vannak.

A probléma alapja, hogy a mesterséges intelligencia statisztikai alapon rajzol: Elképzelhetetlenül sok képet néz meg, és ez alapján tudja, hogy az adott tárgy nagyjából hogy néz ki. Közben vannak dolgok, amelyeknél nem elég ha valami körülbelül olyan. Vannak szabályok, amiket pontosan be kell tartani. Egy F betű nem nézhet ki E betűnek. Ahogy egy K sem R-nek.
A tipográfusok pontosan azért mesterek, mert úgy tudnak a betűk alakzataival játszani, hogy közben a fő szabályok megmaradnak.
Ebben viszont a mesterséges intelligencia egyenlőre nem elég jó. Ha olvasható betűket szeretnénk, akkor elmarad a Tyűha! effektus. A látványos megjelenés pedig egy nagy halom olyasmit alkot, ami betű szeretne lenni.

Ide az van írva, hogy Pista
Ide az van írva, hogy Pista

Így mégis nekünk kell dolgozni! Pedig azt ígérték, hogy a mesterséges intelligencia elveszi a munkánkat…!

Rövid tutorial

Ha látványos megjelenésről van szó, az egyik legjobb a Midjourney. De ha csak egy betűről van szó, a többi program sem marad el mögötte sokkal. Sőt! Lehet, hogy éppen a Tengr.ai vagy a Dall-E fog olyan betűt rajzolni, amilyet mit szeretnénk. Tehát inkább próbálkozzunk több úton! (azért is, mert arra nincs garancia, hogy a Midjourney jó betűt fog rajzolni).

Itt is van egy R betű, amit a Midjourney 5-ös verziójával készítettem. Szerencsém volt, mert az első generálással sikerült. Nagyon izgalmas, részletes, mindenféle bizgentyűkkel teli betűnk lett.

Megosztom az utasítást (prompt) is. De ez csak az 5-ös verziónál lesz ilyen.

letter R ::1 8 cute robot, futuristic advertisment art about the robotic art, stylized design featuring lines and shapes in shades of blue and silver, Inscription composed of gears and mechanical and hydraulic and robotic parts ::1

Most, hogy az első betűnk készen van, folytathatnánk úgy is, hogy ezt a képet próbáljuk meg a Midjourney-ben alakítani. Pl. a variációkkal. De ez nehezen sikerül.

Inkább átmegyünk az Adobe Photoshop programba, és tegyük le a betűt egymás mellé annyiszor, ahány betűből áll a kívánt szöveg. Én most a ROBOT szót szeretném leírni, ezért 5 db R betűt teszek egymás mellé.

1. lépés: a legenerált betűt tegyük egymás mellé annyiszor, ahány betűből áll a feliratunk.
1. lépés: a legenerált betűt tegyük egymás mellé annyiszor, ahány betűből áll a feliratunk.

Az Adobe Photoshop Generative Fill parancsa az egész kép tartalmát vizsgálja, és az alapján készíti az új rajzot. E miatt nagyon fontos, hogy olyan környezetet adjunk neki, ami minél közelebb áll ahhoz, amilyen végső képet szeretnénk. Ezért is kellett a betűket betennünk a végső helyükre.
Érdekes módon a Photoshop sokkal jobban dolgozik, ha a képet egy mesterséges intelligencia készítette. Úgy látszik, hogy a programok egymást jobban megértik, mint a valóságot.

Jelöljük ki a betűket egyesével. Majd a Generative Fill ablakba írjuk be azt a betűt, amit szeretnénk.

letter O

A Photoshop mesterséges intelligenciára erős hatással van a környezet, hogy mi is kép tartalma. Így mindenféle különösebb extra utasítások nélkül a mellette lévő betűkhöz hasonlókat próbál rajzolni.

2. lépés: letter O (vagy amilyen betűt szeretnénk) prompt-al generáljuk végig a betűket, egyesével
2. lépés: letter O (vagy amilyen betűt szeretnénk) prompt-al generáljuk végig a betűket, egyesével

A Photoshop sem lesz sokkal ügyesebb, mint a Midjourney (*). Bár valószínűleg tréningezés közben több betűvel találkozott. De még így is számítsunk arra, hogy elsőre nem fogja a megfelelő betűt eltalálni. Talán másodszorra sem. Vagy akár tíznél is többször kell próbálkoznunk. De ne adjuk fel!
(*) Ez a bejegyzés 2024. év elején készült. Idővel bizonyára mindkét programnak javul a betűgeneráló képessége.

Már csak egy feladatunk maradt: az illesztéseket tüntessük el. Ehhez is használhatjuk a Generative Fill parancsot. Vagy választhatjuk valamelyik megszokott régi funkciót is.

És a végeredmény!
És a végeredmény!

Összegzés + tippek

Hamarosan eljön az idő – hamarabb, mint várjuk -, amikor a mesterséges intelligencia gond nélkül fog olvasható szövegeket rajzolni. És nemcsak az ismert betűtípusokkal, hanem tipográfiai bravúrokkal együtt. 2024. elején viszont még nem tartunk ott, így maradnak az ilyen extra megoldások.

Figyeljünk oda arra, hogy bár a Photoshop a környező képi elemek alapján dolgozik, egyenlőre a Midjourney sokkal látványosabb eredményeket produkál. És a Photoshop ezzel nem mindig tud versenyezni, így az általa rajzolt betűk esetleg nem lesznek annyira érdekesek, egyszerűbbek és töredezettek lehetnek. Ráadásul minél több betűt alakítunk át, úgy fog a teljes kép is egyszerűsödni. Tehát minden újabban átalakított betű kevésbé lesz kidolgozott, mint az előző.
Érdemes lehet az új betűket mindig külön rétegre kérni, majd azt a réteget kikapcsolni. Így a Photoshop mindig azt látja, amikor minden betű a Midjourneyból származik

Tipp: Úgy tűnik, hogy a betűk generálása mind Photoshopban, mint Midjourneyben jobban működik akkor, ha nagybetűket használunk.

PixelRita

PixelRita, neked mi a véleményed? Írnál nekem egy végszót?

Loading

Kreatív dekorációk a szabásminta alapján MI segítségével

ShoeZero - így fog kinézi a cipő
Becsült olvasási idő 6 perc

Készítsünk kreatív rajzot a szabásminta alapján!

A mesterséges intelligencia segítségével izgalmas képeket tudunk generálni.

De sokszor azt szeretnénk, hogy a kép konkrét vonalak mentén, előre meghatározott formába öntve jelenljen meg? Mint mondjuk egy szabásmintában?

Egy ilyen rajznál kiemelten fontos, hogy a kép a megadott vonalakat követve készüljön el. E mellett azt is szeretnénk, hogy a kész kép a kivágott formákhoz idomuljon. Ne úgy nézzen ki, mint amit egy nagyobb alakzatból vágtunk ki.

Előkészületek

A példában egy cipő szabásmintáját fogjuk használni, amit a ShoeZero oldalról töltöttem le. Ez egy olyan szolgáltatás, ahol mi magunk készíthetjük el a cipő grafikáját a feltöltött képek alapján, amit a végén meg is rendelhetünk.
Természetesen bármilyen más szabásmintát vagy kivágó mintát is ugyan ezzel a módszerrel készíthetünk.

Elsőnek szükségünk lesz a szabásmintára. Fontos, hogy már az elején döntsük el, hogy melyik formát akarjuk használni. A mesterséges intelligenciával generált képeket nagyon nehéz más alakzatra alakítani.

Ehhez a feladathoz én egy több részből álló, kontrasztos cipőt választottam.

ShoeZero cipő
ShoeZero cipő

A szerkesztő ablakban megtaláljuk a szabásminta letöltés gombot is. De akár egy képernyő kép mentést is csinálhatunk. Nem szükséges a nagyon nagy felbontású kép. A rajzot egyébként is úgy kell készíteni, hogy legyen hely a varrásnak, vágásnak és más technikai ingadozásnak, hibának.

ShoeZero cipő szabásminta
ShoeZero cipő szabásminta

Ezt a képet hagyhatjuk így is, de egy képszerkesztő programmal megnövelhetjük a kontrasztot is, vagy új elemeket is berajzolhatunk.

ShoeZero cipő szabásminta előkészítve
ShoeZero cipő szabásminta előkészítve

Stable Diffusion Használata

A következő lépésben a Stable Diffusion + ControlNet párost fogjuk használni.

A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Canny-t (amennyiben a szabásminta fekete-fehér, akkor a none vagy az invert is jó lehet lehet). A Model pedig szintén a Canny legyen.

Utasításoknak (prompt) és modellnek azt állítsuk be, amilyen mintát szeretnénk. Ha pl. virágmintát, akkor virágokkal kapcsolatos utasításokat érdemes adni mint a „colorful flowers”. Ha inkább futurisztikus cipőt szeretnénk, akkor pedig a „futuristic lines” és hasonló parancsokat használjuk.

Ide összegyűjtöttem néhány modellt, amelyek hasznosak lehetnek.

Mivel a képek generálása csak néhány percig tart, érdemes több képet készíteni, és más parancsokat is kipróbálni, hogy megtaláljuk a leginkább tetsző mintát.

Stable Diffusion beállításai

A ShoeZero oldalon a kész képeket mindjárt fel is tölthetjük, hogy megnézzük az eredményt. De előtte akár módosíthatjuk valamelyik képszerkesztő programban is.

A kész kép feltöltve a ShoeZero oldalra
A kész kép feltöltve a ShoeZero oldalra

A feltöltött kép még sok mindent nem árul el. De amint lekérjük a 3D generált képet, az eredmény igencsak látványos. És a legfontosabb: egyedi. Ilyen cipője garantáltan senki másnak nem lesz!

Photoshop Trükkök

Hasonló módon az Adobe Photoshop programban is használhatjuk a mesterséges intelligenciát.

Elsőnek jelöljük ki azt a területet, ahol majd a Generative Fill működni fog. Ezt legkönnyebben a Select/Color Range paranccsal tudjuk megtenni.

Kijelöljük a mesterséges intelligencia működési területét.
Kijelöljük a mesterséges intelligencia működési területét.

A jobb működés érdekében növeljük a kijelölt területet: Select/Modify/Expand 5-10 pixel

Növeljük a kijelölt területet
Növeljük a kijelölt területet

Ha mindent jól csináltunk, akkor az eredmény kb. így néz ki: Minden kijelölés egy kicsit nagyobb, mint a szabásminta.

Most már csak a Generative Fill parancsot kell használnunk. Írjuk be azokat a kulcsszavakat, amik a kívánt képet készítik el. Én jelen esetben Hungarian Folk Art pattern parancsot írtam be.

Oké, az eredmény nem túl látványos. Ennek oka, hogy a Photoshop az egész képet vizsgálja, hogy a generált elemek minél jobban illeszkedjenek a környezetbe. És lássuk be, ami képünk egy nagy halom üres szürke képpontból áll…

Segítségül kell hívnunk egy olyan képet, ami az üres helyeket is kitölti. Azaz egy új rétegre tegyünk egy másik képet! Ez lesz alapján fog a mesterséges intelligencia dolgozni.

(Segédképet generálhatunk a Photoshop programon belül is, ha az egész képet kijelöljük, és úgy használjuk a Generative Fill funkciót)

Betettünk egy segéd képet is.
Betettünk egy segéd képet is.

A segédkép legyen egy másik rétegen, majd kapcsoljuk ki. Végezzük el újra a kijelölést, ahogyan már korábban csináltuk. Majd kapcsoljuk vissza a segédképet, hogy a mesterséges intelligencia lássa.

Kezdődhet a képgenerálás
Kezdődhet a képgenerálás

És már indíthatjuk is a mesterséges intelligenciát. Most, hogy már kapott környezetet, van viszonyítási alapja. Az eredmény sokkal jobb lett!

Az eredmény miután kikapcsoltuk a segédképet.
Az eredmény miután kikapcsoltuk a segédképet.

Ezt a képet is feltöltöttük a ShoeZero oldalra. A 3D látványterv nagyon izgalmasan néz ki.

A Photoshop programban készített kép 3D látványterve a ShoeZero oldalon
A Photoshop programban készített kép 3D látványterve a ShoeZero oldalon

Összegzés

A mesterséges intelligencia még nagyon az elején jár. Nagyon nehéz irányítani, de már így is tudjuk olyan munkában használni, mint egy szabásminta. Idővel mindez könnyebb és profibb lesz.

Ne felejtsük el, hogy mind a Photoshop, mind a Stable Diffusion kis felbontású képet generál. De a textíliáknál nincs is mindig szükség nagy felbontásra. Amennyiben mégis szeretnénk nagyobb felbontású képet, akkor a Stable Diffusion segítségével ezt is megtehetjük. A leírás itt található.

PixelRita, te mit gondolsz?

Loading

A Photoshop Generative Fill varázslata: Térképek digitális restaurálása

Adobe Photoshop MI térkékiegészítés
Becsült olvasási idő 5 perc

Rengeteg olyan munkám van, amikor régi térképeket vagy légi felvételeket kell összeillesztenem. A térképe, vagy képek több lapból állnak, amiket egy nagy képpé rakok össze. A kép túlságosan összetett, hogy az automatikus program csinálja ezt a feladatot. Ez még mindig emberi művelet.

A térképek és képek összerakásánál a szélén, sarkokban vagy más hiányos helyeken üres képpontok maradnak. Mindig kérdés, hogy ezekkel mi legyen. Egyszerűen nem néz ki jól a kép, ha ott van egy luk, vagy a széle fűrészfogas.

Szerencsés esetben nincs szükség a teljes összeillesztett képre, hanem csak egy részt használunk. Még nagyobb szerencse esetén ezt ki is lehet úgy vágni, hogy nem marad üres hely.

Ha viszont nincs szerencsénk, akkor valamit tenni kell a lukakkal!

  • Legjobban az néz ki, ha fekete színnel töltjük fel. Ez eléggé egyértelmű: az a rész hiányzik, nincs ott. De összhangban még mindig jól mutat.
  • Ha fehéren hagyjuk, akkor az nyomtatási szempontból ideális. Miért pazaroljuk a festéket olyasmire, ahol valójában nincsen semmi. Csak ez nem néz ki jól!
  • Köztes lehetőség pedig, hogy a térkép alapszínével töltjük ki. Ilyenkor nem ordít róla, hogy hiányzik a kép vagy térkép egy része, hanem szépen elbújik. De nem is használunk annyi festéket feleslegesen, mintha fekete lenne az egész (de attól még igen, információt nem tartalmazó területeket miatt mázolgatunk)

És most lett egy negyedik lehetőség is!

Az Adobe Photoshop programba megjelent a Generative Fill funkció. Ez egy olyan modul, ami a kijelölt területre fog rajzolni. Mégpedig a mesterséges intelligenciával azt rajzolja, amit kérünk. Például egy macskát az út közepére.

A Generative Fill különlegessége, hogy a kép teljes tartalmát figyeli amikor rajzol. Ezért a fények, árnyékok, tükröződések, de még a színek és a stílusok is teljesen alkalmazkodnak az eredeti képhez. Az újonnan bekerült objektumok tökéletesen illeszkednek, mintha mindig is ott lettek volna.

A Generative Fill másik különlegesség az, hogyha a mesterséges intelligenciának nem adunk semmilyen utasítást, akkor radír módban működik. Vagyis a kijelölt területet kitölti a kép többi részének tartalma alapján. Például ha fűben egy macska van, az MI fűszálakat fog rajzolni az állat helyére. Nem pedig egy üres luk marad utána.

Adobe Photoshop Generative Fill
Adobe Photoshop Generative Fill

Kíváncsi voltam, hogyan működik egy az eszköz egy térképen. Vajon hogyan tudja a lukakat elfedni? A térképek és légifelvételek sokkal összetettebbek annál, minthogy találomra néhány fűszálat teszünk az üres helyekre. Nem lehetnek az utcák össze-vissza, nem lehetnek a házak egymáson.

Kijelöltem a térkép lukas területét, és elindítottam az Adobe Photoshop Generative Fill eszközét. Az eredmény minden várakozásomat felülmúlta!

Az eredeti "lukas" térkép (balra), és a Photoshop MI által kitöltött terület.
Az eredeti „lukas” térkép (balra), és a Photoshop MI által kitöltött terület.

Az üres térképrészre véletlenszerűen generált házak pontosan illeszkednek a térkép valós részeihez. Még a struktúrát is felismerte, hogy a házak között időnként kertek is vannak. Megpróbálta még a házak számozását is felírni, de pixeles szöveg generálás még nehezen megy a mesterséges intelligenciás rajzoló programoknak. Ha távolról nézzük, akkor már nem feltűnő.

Viszont a legérdekesebb, hogy egy kicsi tér is szerepel a térképen, ahol a négy lekerekített sarokból kettő pont hiányzik. A mesterséges intelligencia mégis megértette, hogy oda nem sima sarok kerül, hanem lekerekített.

Alább berakok egy nagyobb térképrészletet is. Ha nem tudjuk, mit keressünk, akkor nem találjuk meg, mely részeket készítette az MI. Minden tökéletesen illeszkedik. Az utcák egyenesek, a házak mérete és alakja a megszokott, stb…
Persze van egy kis minőségi különbség, de ezt tudjuk be annak, hogy még a technika nagyon korai változatánál járunk.

Az Adobe Photoshop Generative Fill eszközzel "megszerelt" térkép
Az Adobe Photoshop Generative Fill eszközzel „megszerelt” térkép

Természetesen mindez most csak játék a technikával, egy próba. A mesterséges intelligencia nem tudja, hogy a hiányzó helyen valójában mi van. A kép többi részéből kalkulálja össze a képpontokat, amivel a lukakat kitölti.
Az így készült térkép nem lesz valódi!
Az MI által generált házak és utcák a valóságban nincsenek ott! Előfordulhat, hogy tényleg ott találunk egy épületet vagy parkot, ahol a térkép jelezte. De erre inkább ne számítsunk!
Ezt a funkciót csak mint látványos grafika lehet használni. Tényleges térképészetre nem!

PixelRita, te mit gondolsz erről a funkcióról? Te mire használnád? Mik a lehetőségek és a veszélyei?

Loading