MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 1)

Becsült olvasási idő 6 perc.

Bevezető

2024. elején a szöveg-alapú képgeneráló mesterséges intelligencia programoknak komoly kihívás az olvasható szöveg készítése. Azaz nem könnyű olyan képet készíteni, amelyen felírat, cím vagy valami izgalmas tipográfiai ábra lenne.

Bár egyre több program jelenik meg, amelyek egyre jobban megküzdenek ezzel a problémával, és igény is van rá bőségesen. Elsőként az Adobe Firefly indított olyan megoldást, ahol már betűket és rövid szövegeket is kérhettünk. Később más programok is megpróbálkoztak vele. A magyar fejlesztésű Tengr.ai egészet jól kezeli már az írást, szép logókat is tud rajzolni. A Dall-E a harmadik verziójától fogva nagy eséllyel azt írja le, amit kérünk. 2023. év végén pedig a Midjourney 6-os verziója is elkezdte a betűket használni.

Adobe FireFly Text Effects
Adobe FireFly Text Effects

De a betűk és az olvasható szöveg még mindig komoly kihívás a mesterséges intelligenciának.

Ez azért van, mert a betűknél sokkal kisebb a toleranciánk. Egy macskás képet sokkal nagyobb határokon belül fogadunk el. Ha már van négy lába, két háromszög alakú füle, sok szőre és bajsza, akkor már jó lesz macskának. Ezzel szemben ha egy O betű elkezd lábakat növeszteni, akkor ott már komoly gondok vannak.

A probléma alapja, hogy a mesterséges intelligencia statisztikai alapon rajzol: Elképzelhetetlenül sok képet néz meg, és ez alapján tudja, hogy az adott tárgy nagyjából hogy néz ki. Közben vannak dolgok, amelyeknél nem elég ha valami körülbelül olyan. Vannak szabályok, amiket pontosan be kell tartani. Egy F betű nem nézhet ki E betűnek. Ahogy egy K sem R-nek.
A tipográfusok pontosan azért mesterek, mert úgy tudnak a betűk alakzataival játszani, hogy közben a fő szabályok megmaradnak.
Ebben viszont a mesterséges intelligencia egyenlőre nem elég jó. Ha olvasható betűket szeretnénk, akkor elmarad a Tyűha! effektus. A látványos megjelenés pedig egy nagy halom olyasmit alkot, ami betű szeretne lenni.

Ide az van írva, hogy Pista
Ide az van írva, hogy Pista

Így mégis nekünk kell dolgozni! Pedig azt ígérték, hogy a mesterséges intelligencia elveszi a munkánkat…!

Rövid tutorial

Ha látványos megjelenésről van szó, az egyik legjobb a Midjourney. De ha csak egy betűről van szó, a többi program sem marad el mögötte sokkal. Sőt! Lehet, hogy éppen a Tengr.ai vagy a Dall-E fog olyan betűt rajzolni, amilyet mit szeretnénk. Tehát inkább próbálkozzunk több úton! (azért is, mert arra nincs garancia, hogy a Midjourney jó betűt fog rajzolni).

Itt is van egy R betű, amit a Midjourney 5-ös verziójával készítettem. Szerencsém volt, mert az első generálással sikerült. Nagyon izgalmas, részletes, mindenféle bizgentyűkkel teli betűnk lett.

Megosztom az utasítást (prompt) is. De ez csak az 5-ös verziónál lesz ilyen.

letter R ::1 8 cute robot, futuristic advertisment art about the robotic art, stylized design featuring lines and shapes in shades of blue and silver, Inscription composed of gears and mechanical and hydraulic and robotic parts ::1

Most, hogy az első betűnk készen van, folytathatnánk úgy is, hogy ezt a képet próbáljuk meg a Midjourney-ben alakítani. Pl. a variációkkal. De ez nehezen sikerül.

Inkább átmegyünk az Adobe Photoshop programba, és tegyük le a betűt egymás mellé annyiszor, ahány betűből áll a kívánt szöveg. Én most a ROBOT szót szeretném leírni, ezért 5 db R betűt teszek egymás mellé.

1. lépés: a legenerált betűt tegyük egymás mellé annyiszor, ahány betűből áll a feliratunk.
1. lépés: a legenerált betűt tegyük egymás mellé annyiszor, ahány betűből áll a feliratunk.

Az Adobe Photoshop Generative Fill parancsa az egész kép tartalmát vizsgálja, és az alapján készíti az új rajzot. E miatt nagyon fontos, hogy olyan környezetet adjunk neki, ami minél közelebb áll ahhoz, amilyen végső képet szeretnénk. Ezért is kellett a betűket betennünk a végső helyükre.
Érdekes módon a Photoshop sokkal jobban dolgozik, ha a képet egy mesterséges intelligencia készítette. Úgy látszik, hogy a programok egymást jobban megértik, mint a valóságot.

Jelöljük ki a betűket egyesével. Majd a Generative Fill ablakba írjuk be azt a betűt, amit szeretnénk.

letter O

A Photoshop mesterséges intelligenciára erős hatással van a környezet, hogy mi is kép tartalma. Így mindenféle különösebb extra utasítások nélkül a mellette lévő betűkhöz hasonlókat próbál rajzolni.

2. lépés: letter O (vagy amilyen betűt szeretnénk) prompt-al generáljuk végig a betűket, egyesével
2. lépés: letter O (vagy amilyen betűt szeretnénk) prompt-al generáljuk végig a betűket, egyesével

A Photoshop sem lesz sokkal ügyesebb, mint a Midjourney (*). Bár valószínűleg tréningezés közben több betűvel találkozott. De még így is számítsunk arra, hogy elsőre nem fogja a megfelelő betűt eltalálni. Talán másodszorra sem. Vagy akár tíznél is többször kell próbálkoznunk. De ne adjuk fel!
(*) Ez a bejegyzés 2024. év elején készült. Idővel bizonyára mindkét programnak javul a betűgeneráló képessége.

Már csak egy feladatunk maradt: az illesztéseket tüntessük el. Ehhez is használhatjuk a Generative Fill parancsot. Vagy választhatjuk valamelyik megszokott régi funkciót is.

És a végeredmény!
És a végeredmény!

Összegzés + tippek

Hamarosan eljön az idő – hamarabb, mint várjuk -, amikor a mesterséges intelligencia gond nélkül fog olvasható szövegeket rajzolni. És nemcsak az ismert betűtípusokkal, hanem tipográfiai bravúrokkal együtt. 2024. elején viszont még nem tartunk ott, így maradnak az ilyen extra megoldások.

Figyeljünk oda arra, hogy bár a Photoshop a környező képi elemek alapján dolgozik, egyenlőre a Midjourney sokkal látványosabb eredményeket produkál. És a Photoshop ezzel nem mindig tud versenyezni, így az általa rajzolt betűk esetleg nem lesznek annyira érdekesek, egyszerűbbek és töredezettek lehetnek. Ráadásul minél több betűt alakítunk át, úgy fog a teljes kép is egyszerűsödni. Tehát minden újabban átalakított betű kevésbé lesz kidolgozott, mint az előző.
Érdemes lehet az új betűket mindig külön rétegre kérni, majd azt a réteget kikapcsolni. Így a Photoshop mindig azt látja, amikor minden betű a Midjourneyból származik

Tipp: Úgy tűnik, hogy a betűk generálása mind Photoshopban, mint Midjourneyben jobban működik akkor, ha nagybetűket használunk.

PixelRita

PixelRita, neked mi a véleményed? Írnál nekem egy végszót?

Loading

No votes yet.
Please wait...

“MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 1)” bejegyzéshez 2 hozzászólás

Szólj hozzá!