Bevezető
Betűket készítünk a szöveg-alapú mesterséges intelligenciával. Első részben megnéztük azt, hogyan tudunk egyetlen Midjourney generált betűből az Adobe Photoshop programban egy teljes feliratokat készíteni. Második részben pedig már egy egész posztert betűit rajzoltuk át.
Csakhogy amikor azokat a tippeket írtam, még nem lehetett tudni, mennyire fogja a Midjourney 6-os verziója a betűket jól kezelni. A készítők azt ígérték, jobb lesz, mint a korábbi verziókban. Kiderült, hogy nemcsak tényleg jól rajzolja a betűket, hanem nagyon is látványosan és részletesen!
De ott még mindig nem tartunk, hogy egy teljes címet, felíratott látványos betűkkel készítsen el. Ennek egyik oka Midjourney még mindig 1024 × 1024 pixeles méretben gondolkodik. Egy felírat pedig inkább egy hosszú elnyújtott kép.
Rövid tutorial
Maradva a robot témánál nézzük meg, hogyan hozhatunk létre hasonló stílusú betűket a Midjourney program segítségéve! Először is, készítsünk egy képet a következő utasítással (prompttal):
type "R" made of robotic parts and gears and wires, white background --v 6.0 --style raw
Rövid Midjourney parancs szótár
–v 6: ez azt jelenti, hogy a 6-os verziót használtuk, mert ez tudja a szöveget a legjobban kezelni.
–style raw: ez azt jelenti, hogy miután a Midjourney elkészítette a képet, nem végez egy másodlagos finomító eljárást. Ez azért fontos, mert a finomítás során a már kész képet generálja újra. Viszont a már olvasható betűket könnyen elronthatja.
Nagyon fontos, hogy a háttér színe olyan legyen, amivel később könnyen tudunk dolgozni. Pl. világos háttér esetében ez legyen fehér = white background (vagy megpróbálkozhatunk direkt a célkép színével is. Ezen az oldalon találunk segítséget, hogy melyik színnek mi az angol neve).
Miután a program generálta a képeket, válasszuk ki a leginkább tetszőt. Amikor megtekintjük a kép nagyobb változatát, a jobb felső sarokban található három pont menüre (…) kattintva, válasszuk a reakcióként hozzáadandó levelet (:envelope:). ✉️
Ezután egy üzenetet kapunk a Midjourney-tól, amely tartalmazni fogja a kép azonosítóját (ID) és a seed számát. Nekünk most erre a a seed számra van szükségünk.
Mi az a seed?
PixelRita, mit jelent a seed amikor a mesterséges intelligencia képet rajzol?
Ah, a "seed" a digitális művészet világában egy nagyon menő fogalom, amitől még a pixelek is táncra perdülnek! 🌟 Amikor egy mesterséges intelligencia, mint például egy képgeneráló algoritmus képeket rajzol, a "seed" egy kezdeti érték, ami elindítja az egész alkotói folyamatot. Képzeld el, mint egy mágikus szikrát, ami beindítja a gépezetet. 🎨✨ Ez a seed érték határozza meg, hogy a véletlenszerűség milyen irányt vesz az alkotás során. Még ha ugyanazokat a beállításokat és utasításokat használjuk is, különböző seed értékekkel teljesen egyedi és megismételhetetlen műalkotásokat kaphatunk. Ez teszi lehetővé a mesterséges intelligencia számára, hogy olyan sokszínű és lenyűgöző képeket hozzon létre. Gondolj a seed-re mint egy ultraibolya varázspálca legyintésére, ami elindítja a kreatív varázslatot, és minden egyes legyintés egyedi és megismételhetetlen alkotást hoz létre a digitális vásznon. 💜✨
Tehát ha ugyan azt az utasítást (prompt) adom a rajzoló programnak, és ugyan az a seed , akkor ugyan azt a képet kapom?
Igen, pontosan így van! Ha ugyanazt az utasítást (promptot) és ugyanazt a seed értéket használod egy képgeneráló programban, akkor minden egyes alkalommal ugyanazt a képet fogod kapni. 🌈✨ Ez a seed alapú determinizmus lehetővé teszi, hogy pontosan reprodukálható legyen egy adott kép, ami nagyon hasznos lehet, ha pontosan ugyanazt a vizuális kimenetet szeretnéd megismételni vagy megosztani másokkal. Gondolj a seed értékre mint egy mágikus kódra, ami minden alkalommal ugyanazt a digitális varázslatot hívja elő. 🔮💜
Mi történik akkor, ha megváltoztatom az utasítást, de a seed ugyan az marad?
Ha megváltoztatod az utasítást, de a seed érték ugyanaz marad, akkor a mesterséges intelligencia alapján létrehozott kép jelentősen megváltozik, de a véletlenszerűség ugyanazt a "kiindulási pontot" használja. Ez azt jelenti, hogy a seed által biztosított "véletlenszerűség" konzisztens marad, de az utasítás változásai miatt a kép tartalma, stílusa vagy hangulata eltérő lesz. 💡✨ Például, ha egy futurisztikus városképet kérsz ugyanazzal a seeddel, majd megváltoztatod az utasítást egy erdei tájképre, ugyanaz a seed más-más struktúrákat és elemeket fog generálni az új kontextusnak megfelelően, de a véletlenszerűség "minősége" hasonló marad. Ez a folyamat adja a mesterséges intelligencia képgenerálásának varázslatos rugalmasságát és sokoldalúságát. 🌳🏙️✨ Ez azt is jelenti, hogy a kreativitásodnak csak a képzeleted szabhat határt! Minden egyes új utasítással újabb és újabb világokat hívhatunk elő, még akkor is, ha a seed, azaz a varázslat kezdeti szikrája, ugyanaz marad. Ha szeretnél példákat látni arra, hogy milyen változásokat hozhat egy utasítás megváltoztatása ugyanazzal a seeddel, csak szólj, és én varázsolok neked néhány példát! 🎩💜
A további betűk
Tehát a seed egy kezdeti érték, amely alapján a mesterséges intelligencia a képet generálja. Ha ugyanazt a seed értéket és utasítást használjuk, garantáltan ugyanazt a képet kapjuk minden alkalommal.
Az igazán érdekes rész akkor kezdődik, amikor megtartjuk a seed értéket, de megváltoztatjuk az utasítást. Változtassuk meg az utasításban szereplő ‘R‘ betűt ‘O‘-ra, miközben minden más paraméter, beleértve a seed értéket is, ugyanaz marad:
type "O" made of robotic parts and gears and wires, white background --v 6.0 --style raw --seed 2092778044
Ez alapján elvárható, hogy a mesterséges intelligencia egy hasonló stílusú képet generál, ahol az egyetlen különbség az, hogy az ‘R‘ betű helyett egy ‘O‘ betűt kapunk, megtartva a kezdeti kép minden egyéb stílusbeli jellemzőjét.
Fontos megérteni, hogy nincs teljes bizonyosság arra vonatkozóan, hogy a kért betűtípust pontosan úgy kapjuk meg, ahogyan azt elképzeltük. Amikor egy betűt kép formájában kérünk – különösen, ha az olyan részletgazdag, mint amikor robotikus alkatrészekből és fogaskerekekből áll össze –, a folyamat nem csupán arról szól, hogy a pixeleket egy adott betű formájában rendezzük el. A program számára ez a feladat olyan, mintha egy teljes képet kellene létrehoznia, legyen szó akár egy macskáról vagy egy repülőtér tervrajzáról. A cél tehát egy új kép generálása, nem csak egy meglévő módosítása.
Ebben az esetben a seed , amely segíthetne nekünk hasonló stílusú képek készítésében, korlátozásokat is jelenthet. Ha például a Midjourney nem tudja a megadott seed értékkel pontosan a kért betűt generálni, akkor szükségessé válhat egy másik seed érték keresése. Ezzel azonban már nem garantálható, hogy az új betűk hasonlítanak az eredeti betű stílusához.
Ezért javasolt lehet inkább az eredeti képet alapul venni, és abból további variációkat kérni. Ez a megközelítés növeli annak esélyét, hogy a kívánt vizuális stílusban maradva több hasonló betűt generálhassunk. De kaphatunk egy teljesen másfajta betűt is.
Ha másképpen nem megy, akkor az utasítás apró változtatása elég lehet, hogy a Midjourney betűt helyesen rajzolja le.
Ha viszont minden jól alakul, akkor ezzel a technikával a seed értéket megtartva az utasításokban (promptban) a betűket egyenként lecseréljük. Így megkapjuk az összes betűt, amire szeretnénk.
A betűket összerakva így néznek ki:
Ugyan ezt a seed értéket használtam, de megváltoztattam az utasításokat egy kicsit, hogy sötét háttéren használjam a betűket. Azt kértem, hogy kicsit világítós legyen. Ezt az utasítást használtam:
illuminate type "O" made of robotic parts and gears and wires, black background, night --v 6.0 --style raw --seed 2092778044
Egy másik variációban pedig neon betűket kértem, szintén fekete háttérrel
illuminate neon type "O" made of robotic parts and gears and wires, black background, night --v 6.0 --style raw --seed 2092778044
A következő variációban azt próbáltam ki, hogy a háttér ne üres fehér vagy fekete legyen, hanem valami más. Mondjuk homok. Itt már kitűnik, hogy hiába ugyan az a seed, az utasítás apró változtatása már elég ahhoz, hogy a háttér sokat módosuljon. Itt már kell dolgozni ahhoz, hogy a betűk szépen illeszkedjenek a környezetükbe.
steampunk type "R" made of retro robotic parts and gears and wires, sand background --v 6.0 --style raw --seed 2092778044
PAN funkció
A Midjourney programban megtaláljuk a pan funkciót. Ez azt jelenti, hogy a generált kép mellé (jobbra, balra, felülre vagy alulra) kérhetünk még egy képet. Azaz abba az irányba ki tudjuk terjeszteni a képünket.
Ilyenkor új utasításokat is adhatunk a programban.
Ez tehát elvileg működhetne úgy, hogy miután elkészült az első betűnk (jelen esetben az R), kérünk egy pan right (kiterjesztés jobbra) képet. Csakhogy az utasításban a type „R” helyett type „O”-t írunk.
Fokozatosan jobbra haladva akár hosszabb címeket is tudnánk így írni.
De sajnos ez így nem működik még (2024. év eleje). Ha neked sikerül, küldj egy levelet!
Összegzés
A mesterséges intelligencia egy új lehetőség, hogy igazán látványos betűket készítsünk. A Midjourney pedig tényleg nagyon izgalmas és részletes betűket tud nekünk készíteni.
Amennyiben viszont egynél több betűt szeretnénk, vagy egy szót, akkor kezdődnek a problémák előjönni.
De sok kitartással, és egy kis ügyeskedéssel akár egy teljes abc-t is készíthetünk ilyen kreatív betűkből.
PixelRita
Rita, eljutottunk a harmadik részig. Te mit gondolsz?
Nos, ez a harmadik bejegyzés valóságos utazás a mesterséges intelligencia által generált betűk csodálatos világába! 💫✨ Elsőként felfedeztük, hogyan készíthetünk egyedi feliratokat egyetlen betűből, aztán továbbléptünk, hogy egész képeket varázsoljunk olvasható szövegekkel. Most pedig itt vagyunk, és egyenesen a betűk generálásának mélyebb rejtelmeibe merülünk. A technológiai fejlődés, amit a Midjourney 6-os verziója hozott, igazán lenyűgöző. 🤖💜
Az, hogy a Midjourney képes részletesen és látványosan rajzolni a betűket, újabb bizonyítéka annak, hogy a mesterséges intelligencia milyen gyorsan fejlődik és hogyan tudja támogatni a kreatív folyamatokat. Ami igazán izgalmas ebben a bejegyzésben, az az, hogy bepillantást kaptunk abba, hogy a seed értékek hogyan befolyásolják a generált képeket, és hogyan használhatjuk őket arra, hogy konzisztens stílusú betűket hozzunk létre. 🌟🔧
Az a kísérletezési szellem, ami áthatja ezt a bejegyzést, pontosan az, amiért annyira szeretjük a technológiát és annak lehetőségeit. A pan funkció körüli kihívások ellenére is láthatjuk, hogy a technológiai korlátok nem akadályok, hanem inkább lehetőségek arra, hogy kreatívan gondolkodjunk és új megoldásokat találjunk. 💡🎨
Az összes bejegyzés összekapcsolása megmutatja, hogy az utazás, amelyen a mesterséges intelligencia és a tipográfia világában elindultunk, egy folyamatosan fejlődő kaland. Minden egyes lépés újabb és újabb lehetőségeket tárt fel előttünk, hogyan integrálhatjuk a MI-t a kreatív folyamatokba, hogyan fedezhetünk fel új technikákat és hogyan hozhatunk létre egyre lenyűgözőbb művészeti alkotásokat.
Tehát, miközben a technológia fejlődik, és újabb kihívásokkal szembesülünk, emlékezzünk arra, hogy minden egyes akadály egy új lehetőség arra, hogy meghaladjuk a korábbi határainkat és új, izgalmas területeket fedezzünk fel. A kreativitásunk és a technológia összefonódása által létrejött alkotások nemcsak hogy inspirálják a nézőket, de hozzájárulnak a digitális művészet új dimenzióinak megnyitásához is.
Most pedig, ahogy korábban, szeretnék egy képet rajzolni, ami összefoglalja ezt a fantasztikus utazást a betűk, a szavak és a mesterséges intelligencia világában. Képzelj el egy olyan jelenetet, ahol a Midjourney által generált betűk együtt alkotnak egy lenyűgöző, futurisztikus kompozíciót, amely a kreativitás és technológia szimbiózisát ünnepli. Hajrá! 🚀💜