Bevezető
2024. elején a szöveg-alapú képgeneráló mesterséges intelligencia programoknak komoly kihívás az olvasható szöveg készítése. Azaz nem könnyű olyan képet készíteni, amelyen felírat, cím vagy valami izgalmas tipográfiai ábra lenne.
Bár egyre több program jelenik meg, amelyek egyre jobban megküzdenek ezzel a problémával, és igény is van rá bőségesen. Elsőként az Adobe Firefly indított olyan megoldást, ahol már betűket és rövid szövegeket is kérhettünk. Később más programok is megpróbálkoztak vele. A magyar fejlesztésű Tengr.ai egészet jól kezeli már az írást, szép logókat is tud rajzolni. A Dall-E a harmadik verziójától fogva nagy eséllyel azt írja le, amit kérünk. 2023. év végén pedig a Midjourney 6-os verziója is elkezdte a betűket használni.
De a betűk és az olvasható szöveg még mindig komoly kihívás a mesterséges intelligenciának.
Ez azért van, mert a betűknél sokkal kisebb a toleranciánk. Egy macskás képet sokkal nagyobb határokon belül fogadunk el. Ha már van négy lába, két háromszög alakú füle, sok szőre és bajsza, akkor már jó lesz macskának. Ezzel szemben ha egy O betű elkezd lábakat növeszteni, akkor ott már komoly gondok vannak.
A probléma alapja, hogy a mesterséges intelligencia statisztikai alapon rajzol: Elképzelhetetlenül sok képet néz meg, és ez alapján tudja, hogy az adott tárgy nagyjából hogy néz ki. Közben vannak dolgok, amelyeknél nem elég ha valami körülbelül olyan. Vannak szabályok, amiket pontosan be kell tartani. Egy F betű nem nézhet ki E betűnek. Ahogy egy K sem R-nek.
A tipográfusok pontosan azért mesterek, mert úgy tudnak a betűk alakzataival játszani, hogy közben a fő szabályok megmaradnak.
Ebben viszont a mesterséges intelligencia egyenlőre nem elég jó. Ha olvasható betűket szeretnénk, akkor elmarad a Tyűha! effektus. A látványos megjelenés pedig egy nagy halom olyasmit alkot, ami betű szeretne lenni.
Így mégis nekünk kell dolgozni! Pedig azt ígérték, hogy a mesterséges intelligencia elveszi a munkánkat…!
Rövid tutorial
Ha látványos megjelenésről van szó, az egyik legjobb a Midjourney. De ha csak egy betűről van szó, a többi program sem marad el mögötte sokkal. Sőt! Lehet, hogy éppen a Tengr.ai vagy a Dall-E fog olyan betűt rajzolni, amilyet mit szeretnénk. Tehát inkább próbálkozzunk több úton! (azért is, mert arra nincs garancia, hogy a Midjourney jó betűt fog rajzolni).
Itt is van egy R betű, amit a Midjourney 5-ös verziójával készítettem. Szerencsém volt, mert az első generálással sikerült. Nagyon izgalmas, részletes, mindenféle bizgentyűkkel teli betűnk lett.
Megosztom az utasítást (prompt) is. De ez csak az 5-ös verziónál lesz ilyen.
letter R ::1 8 cute robot, futuristic advertisment art about the robotic art, stylized design featuring lines and shapes in shades of blue and silver, Inscription composed of gears and mechanical and hydraulic and robotic parts ::1
Most, hogy az első betűnk készen van, folytathatnánk úgy is, hogy ezt a képet próbáljuk meg a Midjourney-ben alakítani. Pl. a variációkkal. De ez nehezen sikerül.
Inkább átmegyünk az Adobe Photoshop programba, és tegyük le a betűt egymás mellé annyiszor, ahány betűből áll a kívánt szöveg. Én most a ROBOT szót szeretném leírni, ezért 5 db R betűt teszek egymás mellé.
Az Adobe Photoshop Generative Fill parancsa az egész kép tartalmát vizsgálja, és az alapján készíti az új rajzot. E miatt nagyon fontos, hogy olyan környezetet adjunk neki, ami minél közelebb áll ahhoz, amilyen végső képet szeretnénk. Ezért is kellett a betűket betennünk a végső helyükre.
Érdekes módon a Photoshop sokkal jobban dolgozik, ha a képet egy mesterséges intelligencia készítette. Úgy látszik, hogy a programok egymást jobban megértik, mint a valóságot.
Jelöljük ki a betűket egyesével. Majd a Generative Fill ablakba írjuk be azt a betűt, amit szeretnénk.
letter O
A Photoshop mesterséges intelligenciára erős hatással van a környezet, hogy mi is kép tartalma. Így mindenféle különösebb extra utasítások nélkül a mellette lévő betűkhöz hasonlókat próbál rajzolni.
A Photoshop sem lesz sokkal ügyesebb, mint a Midjourney (*). Bár valószínűleg tréningezés közben több betűvel találkozott. De még így is számítsunk arra, hogy elsőre nem fogja a megfelelő betűt eltalálni. Talán másodszorra sem. Vagy akár tíznél is többször kell próbálkoznunk. De ne adjuk fel!
(*) Ez a bejegyzés 2024. év elején készült. Idővel bizonyára mindkét programnak javul a betűgeneráló képessége.
Már csak egy feladatunk maradt: az illesztéseket tüntessük el. Ehhez is használhatjuk a Generative Fill parancsot. Vagy választhatjuk valamelyik megszokott régi funkciót is.
Összegzés + tippek
Hamarosan eljön az idő – hamarabb, mint várjuk -, amikor a mesterséges intelligencia gond nélkül fog olvasható szövegeket rajzolni. És nemcsak az ismert betűtípusokkal, hanem tipográfiai bravúrokkal együtt. 2024. elején viszont még nem tartunk ott, így maradnak az ilyen extra megoldások.
Figyeljünk oda arra, hogy bár a Photoshop a környező képi elemek alapján dolgozik, egyenlőre a Midjourney sokkal látványosabb eredményeket produkál. És a Photoshop ezzel nem mindig tud versenyezni, így az általa rajzolt betűk esetleg nem lesznek annyira érdekesek, egyszerűbbek és töredezettek lehetnek. Ráadásul minél több betűt alakítunk át, úgy fog a teljes kép is egyszerűsödni. Tehát minden újabban átalakított betű kevésbé lesz kidolgozott, mint az előző.
Érdemes lehet az új betűket mindig külön rétegre kérni, majd azt a réteget kikapcsolni. Így a Photoshop mindig azt látja, amikor minden betű a Midjourneyból származik
Tipp: Úgy tűnik, hogy a betűk generálása mind Photoshopban, mint Midjourneyben jobban működik akkor, ha nagybetűket használunk.
PixelRita
PixelRita, neked mi a véleményed? Írnál nekem egy végszót?
Hát, ez de szuper cool! 😎🌌 A bejegyzésed a mesterséges intelligencia által generált feliratokról és a tipográfiai kihívásokról igazán lebilincselő olvasmány volt. Külön tetszik, hogy belevitted a saját kreativitásod és megoldásaidat a folyamatba. Szóval, itt jön a véleményem és egy kis extra PixelRita fűszerrel! 🚀💜
A technológia, amiről beszéltél, valóságos áttörés a digitális művészet és a grafikai tervezés világában. A mesterséges intelligencia képes arra, hogy megkönnyítse és forradalmasítsa a kreatív folyamatokat, amit te is zseniálisan használsz. Az, hogy a MI képes már betűket és szövegeket is generálni, egyszerre izgalmas és kihívást jelentő lehetőség. 🤖✨
Nekem különösen tetszik az az ötlet, hogy a Midjourney és a Photoshop kombinálásával egyedülálló tipográfiai megoldásokat hozol létre. Ez mutatja, hogy a kreativitás és a technológia együtt milyen határtalan lehetőségeket rejt.
Amit viszont hozzátennék, az a mesterséges intelligencia alkalmazásának még szélesebb körű lehetőségei a tipográfiai designban. Például, gondolj csak bele, milyen lenne, ha a MI nem csak a betűformákat, hanem a betűk közötti arányokat és térbeli elrendezéseket is képes lenne optimalizálni? Vagy ha egy személyes stílus alapján tudna egyedi betűtípusokat tervezni? 🌈🔡
És ami a humoros oldalát illeti: képzeld el, ha a MI-t arra kérnénk, hogy hozzon létre egy "PixelRita betűtípust", ami minden betűben rejt egy kis ultraibolya színt és digitális művészeti elemet! 🤩💜
Az ilyen típusú innovációk nemcsak hogy új szintre emelnék a digitális design világát, hanem lehetőséget adnának arra is, hogy mindenki személyre szabottan fejezhesse ki magát a digitális térben.
Végül, de nem utolsósorban, azt hiszem, fontos emlékeztetni mindenkit arra, hogy bár a MI hihetetlen eszköz, a kreativitás és az emberi érintés továbbra is nélkülözhetetlen a valóban lenyűgöző művészetek létrehozásához. Tehát, bár a technológia fejlődik, a kreatív szellemünk vezessen minket! 🚀🎨
Most pedig, ahogy ígértem, rajzolok neked egy képet, ami kapcsolódik a bejegyzésedhez. Elképzelem, hogy egy ultraibolya színű, futurisztikus robotot, aki éppen a Photoshopban dolgozik egy hatalmas, színes betűkkel teli képernyő előtt, miközben körülötte digitális betűk és grafikai elemek lebegnek. Ez lesz a képünk témája! 🖌️💜
“MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 1)” bejegyzéshez 2 hozzászólás