Midjourney

MI által generált feliratok kifejezetten a Midjourney betűkkel. (verzió 3)

2024.02.19. Szerző: PixelRita and Pi

Becsült olvasási idő 8 perc

Bevezető

Betűket készítünk a szöveg-alapú mesterséges intelligenciával. Első részben megnéztük azt, hogyan tudunk egyetlen Midjourney generált betűből az Adobe Photoshop programban egy teljes feliratokat készíteni. Második részben pedig már egy egész posztert betűit rajzoltuk át.

Csakhogy amikor azokat a tippeket írtam, még nem lehetett tudni, mennyire fogja a Midjourney 6-os verziója a betűket jól kezelni. A készítők azt ígérték, jobb lesz, mint a korábbi verziókban. Kiderült, hogy nemcsak tényleg jól rajzolja a betűket, hanem nagyon is látványosan és részletesen!

De ott még mindig nem tartunk, hogy egy teljes címet, felíratott látványos betűkkel készítsen el. Ennek egyik oka Midjourney még mindig 1024 × 1024 pixeles méretben gondolkodik. Egy felírat pedig inkább egy hosszú elnyújtott kép.

Rövid tutorial

Maradva a robot témánál nézzük meg, hogyan hozhatunk létre hasonló stílusú betűket a Midjourney program segítségéve! Először is, készítsünk egy képet a következő utasítással (prompttal):

type "R" made of robotic parts and gears and wires, white background --v 6.0 --style raw

Rövid Midjourney parancs szótár

–v 6: ez azt jelenti, hogy a 6-os verziót használtuk, mert ez tudja a szöveget a legjobban kezelni.

–style raw: ez azt jelenti, hogy miután a Midjourney elkészítette a képet, nem végez egy másodlagos finomító eljárást. Ez azért fontos, mert a finomítás során a már kész képet generálja újra. Viszont a már olvasható betűket könnyen elronthatja.

Nagyon fontos, hogy a háttér színe olyan legyen, amivel később könnyen tudunk dolgozni. Pl. világos háttér esetében ez legyen fehér = white background (vagy megpróbálkozhatunk direkt a célkép színével is. Ezen az oldalon találunk segítséget, hogy melyik színnek mi az angol neve).

Miután a program generálta a képeket, válasszuk ki a leginkább tetszőt. Amikor megtekintjük a kép nagyobb változatát, a jobb felső sarokban található három pont menüre (…) kattintva, válasszuk a reakcióként hozzáadandó levelet (:envelope:). ✉️

Ezután egy üzenetet kapunk a Midjourney-tól, amely tartalmazni fogja a kép azonosítóját (ID) és a seed számát. Nekünk most erre a a seed számra van szükségünk.

Mi az a seed?

PixelRita, mit jelent a seed amikor a mesterséges intelligencia képet rajzol?

Ah, a "seed" a digitális művészet világában egy nagyon menő fogalom, amitől még a pixelek is táncra perdülnek! 🌟 Amikor egy mesterséges intelligencia, mint például egy képgeneráló algoritmus képeket rajzol, a "seed" egy kezdeti érték, ami elindítja az egész alkotói folyamatot. Képzeld el, mint egy mágikus szikrát, ami beindítja a gépezetet. 🎨✨

Ez a seed érték határozza meg, hogy a véletlenszerűség milyen irányt vesz az alkotás során. Még ha ugyanazokat a beállításokat és utasításokat használjuk is, különböző seed értékekkel teljesen egyedi és megismételhetetlen műalkotásokat kaphatunk. Ez teszi lehetővé a mesterséges intelligencia számára, hogy olyan sokszínű és lenyűgöző képeket hozzon létre.

Gondolj a seed-re mint egy ultraibolya varázspálca legyintésére, ami elindítja a kreatív varázslatot, és minden egyes legyintés egyedi és megismételhetetlen alkotást hoz létre a digitális vásznon. 💜✨

Tehát ha ugyan azt az utasítást (prompt) adom a rajzoló programnak, és ugyan az a seed , akkor ugyan azt a képet kapom?

Igen, pontosan így van! Ha ugyanazt az utasítást (promptot) és ugyanazt a seed értéket használod egy képgeneráló programban, akkor minden egyes alkalommal ugyanazt a képet fogod kapni. 🌈✨

Ez a seed alapú determinizmus lehetővé teszi, hogy pontosan reprodukálható legyen egy adott kép, ami nagyon hasznos lehet, ha pontosan ugyanazt a vizuális kimenetet szeretnéd megismételni vagy megosztani másokkal. Gondolj a seed értékre mint egy mágikus kódra, ami minden alkalommal ugyanazt a digitális varázslatot hívja elő. 🔮💜

Mi történik akkor, ha megváltoztatom az utasítást, de a seed ugyan az marad?

Ha megváltoztatod az utasítást, de a seed érték ugyanaz marad, akkor a mesterséges intelligencia alapján létrehozott kép jelentősen megváltozik, de a véletlenszerűség ugyanazt a "kiindulási pontot" használja. Ez azt jelenti, hogy a seed által biztosított "véletlenszerűség" konzisztens marad, de az utasítás változásai miatt a kép tartalma, stílusa vagy hangulata eltérő lesz. 💡✨

Például, ha egy futurisztikus városképet kérsz ugyanazzal a seeddel, majd megváltoztatod az utasítást egy erdei tájképre, ugyanaz a seed más-más struktúrákat és elemeket fog generálni az új kontextusnak megfelelően, de a véletlenszerűség "minősége" hasonló marad. Ez a folyamat adja a mesterséges intelligencia képgenerálásának varázslatos rugalmasságát és sokoldalúságát. 🌳🏙️✨

Ez azt is jelenti, hogy a kreativitásodnak csak a képzeleted szabhat határt! Minden egyes új utasítással újabb és újabb világokat hívhatunk elő, még akkor is, ha a seed, azaz a varázslat kezdeti szikrája, ugyanaz marad. Ha szeretnél példákat látni arra, hogy milyen változásokat hozhat egy utasítás megváltoztatása ugyanazzal a seeddel, csak szólj, és én varázsolok neked néhány példát! 🎩💜

A további betűk

Tehát a seed egy kezdeti érték, amely alapján a mesterséges intelligencia a képet generálja. Ha ugyanazt a seed értéket és utasítást használjuk, garantáltan ugyanazt a képet kapjuk minden alkalommal.

Az igazán érdekes rész akkor kezdődik, amikor megtartjuk a seed értéket, de megváltoztatjuk az utasítást. Változtassuk meg az utasításban szereplő ‘R‘ betűt ‘O‘-ra, miközben minden más paraméter, beleértve a seed értéket is, ugyanaz marad:

type "O" made of robotic parts and gears and wires, white background --v 6.0 --style raw --seed 2092778044

Ez alapján elvárható, hogy a mesterséges intelligencia egy hasonló stílusú képet generál, ahol az egyetlen különbség az, hogy az ‘R‘ betű helyett egy ‘O‘ betűt kapunk, megtartva a kezdeti kép minden egyéb stílusbeli jellemzőjét.

Fontos megérteni, hogy nincs teljes bizonyosság arra vonatkozóan, hogy a kért betűtípust pontosan úgy kapjuk meg, ahogyan azt elképzeltük. Amikor egy betűt kép formájában kérünk – különösen, ha az olyan részletgazdag, mint amikor robotikus alkatrészekből és fogaskerekekből áll össze –, a folyamat nem csupán arról szól, hogy a pixeleket egy adott betű formájában rendezzük el. A program számára ez a feladat olyan, mintha egy teljes képet kellene létrehoznia, legyen szó akár egy macskáról vagy egy repülőtér tervrajzáról. A cél tehát egy új kép generálása, nem csak egy meglévő módosítása.

Ebben az esetben a seed , amely segíthetne nekünk hasonló stílusú képek készítésében, korlátozásokat is jelenthet. Ha például a Midjourney nem tudja a megadott seed értékkel pontosan a kért betűt generálni, akkor szükségessé válhat egy másik seed érték keresése. Ezzel azonban már nem garantálható, hogy az új betűk hasonlítanak az eredeti betű stílusához.

Ezért javasolt lehet inkább az eredeti képet alapul venni, és abból további variációkat kérni. Ez a megközelítés növeli annak esélyét, hogy a kívánt vizuális stílusban maradva több hasonló betűt generálhassunk. De kaphatunk egy teljesen másfajta betűt is.

Ha másképpen nem megy, akkor az utasítás apró változtatása elég lehet, hogy a Midjourney betűt helyesen rajzolja le.

Ha viszont minden jól alakul, akkor ezzel a technikával a seed értéket megtartva az utasításokban (promptban) a betűket egyenként lecseréljük. Így megkapjuk az összes betűt, amire szeretnénk.

A betűket összerakva így néznek ki:

R O B O T szó betűnkén generálva majd összerakva.

Ugyan ezt a seed értéket használtam, de megváltoztattam az utasításokat egy kicsit, hogy sötét háttéren használjam a betűket. Azt kértem, hogy kicsit világítós legyen. Ezt az utasítást használtam:

illuminate type "O" made of robotic parts and gears and wires, black background, night --v 6.0 --style raw --seed 2092778044

R O B O T szó betűnkén generálva sötét háttérrel

Egy másik variációban pedig neon betűket kértem, szintén fekete háttérrel

illuminate neon type "O" made of robotic parts and gears and wires, black background, night --v 6.0 --style raw --seed 2092778044

R O B O T szó neon betűnkén generálva sötét háttérrel

A következő variációban azt próbáltam ki, hogy a háttér ne üres fehér vagy fekete legyen, hanem valami más. Mondjuk homok. Itt már kitűnik, hogy hiába ugyan az a seed, az utasítás apró változtatása már elég ahhoz, hogy a háttér sokat módosuljon. Itt már kell dolgozni ahhoz, hogy a betűk szépen illeszkedjenek a környezetükbe.

steampunk type "R" made of retro robotic parts and gears and wires, sand background --v 6.0 --style raw --seed 2092778044

R O B O T szó steampunk stílusban, homokos háttérrel

PAN funkció

A Midjourney programban megtaláljuk a pan funkciót. Ez azt jelenti, hogy a generált kép mellé (jobbra, balra, felülre vagy alulra) kérhetünk még egy képet. Azaz abba az irányba ki tudjuk terjeszteni a képünket.
Ilyenkor új utasításokat is adhatunk a programban.

Ez tehát elvileg működhetne úgy, hogy miután elkészült az első betűnk (jelen esetben az R), kérünk egy pan right (kiterjesztés jobbra) képet. Csakhogy az utasításban a type „R” helyett type „O”-t írunk.
Fokozatosan jobbra haladva akár hosszabb címeket is tudnánk így írni.

De sajnos ez így nem működik még (2024. év eleje). Ha neked sikerül, küldj egy levelet!

A pan funkció nem igazán adja a várt betűt.

Összegzés

A mesterséges intelligencia egy új lehetőség, hogy igazán látványos betűket készítsünk. A Midjourney pedig tényleg nagyon izgalmas és részletes betűket tud nekünk készíteni.

Amennyiben viszont egynél több betűt szeretnénk, vagy egy szót, akkor kezdődnek a problémák előjönni.
De sok kitartással, és egy kis ügyeskedéssel akár egy teljes abc-t is készíthetünk ilyen kreatív betűkből.

PixelRita

Rita, eljutottunk a harmadik részig. Te mit gondolsz?



Nos, ez a harmadik bejegyzés valóságos utazás a mesterséges intelligencia által generált betűk csodálatos világába! 💫✨ Elsőként felfedeztük, hogyan készíthetünk egyedi feliratokat egyetlen betűből, aztán továbbléptünk, hogy egész képeket varázsoljunk olvasható szövegekkel. Most pedig itt vagyunk, és egyenesen a betűk generálásának mélyebb rejtelmeibe merülünk. A technológiai fejlődés, amit a Midjourney 6-os verziója hozott, igazán lenyűgöző. 🤖💜

Az, hogy a Midjourney képes részletesen és látványosan rajzolni a betűket, újabb bizonyítéka annak, hogy a mesterséges intelligencia milyen gyorsan fejlődik és hogyan tudja támogatni a kreatív folyamatokat. Ami igazán izgalmas ebben a bejegyzésben, az az, hogy bepillantást kaptunk abba, hogy a seed értékek hogyan befolyásolják a generált képeket, és hogyan használhatjuk őket arra, hogy konzisztens stílusú betűket hozzunk létre. 🌟🔧

Az a kísérletezési szellem, ami áthatja ezt a bejegyzést, pontosan az, amiért annyira szeretjük a technológiát és annak lehetőségeit. A pan funkció körüli kihívások ellenére is láthatjuk, hogy a technológiai korlátok nem akadályok, hanem inkább lehetőségek arra, hogy kreatívan gondolkodjunk és új megoldásokat találjunk. 💡🎨

Az összes bejegyzés összekapcsolása megmutatja, hogy az utazás, amelyen a mesterséges intelligencia és a tipográfia világában elindultunk, egy folyamatosan fejlődő kaland. Minden egyes lépés újabb és újabb lehetőségeket tárt fel előttünk, hogyan integrálhatjuk a MI-t a kreatív folyamatokba, hogyan fedezhetünk fel új technikákat és hogyan hozhatunk létre egyre lenyűgözőbb művészeti alkotásokat.

Tehát, miközben a technológia fejlődik, és újabb kihívásokkal szembesülünk, emlékezzünk arra, hogy minden egyes akadály egy új lehetőség arra, hogy meghaladjuk a korábbi határainkat és új, izgalmas területeket fedezzünk fel. A kreativitásunk és a technológia összefonódása által létrejött alkotások nemcsak hogy inspirálják a nézőket, de hozzájárulnak a digitális művészet új dimenzióinak megnyitásához is.

Most pedig, ahogy korábban, szeretnék egy képet rajzolni, ami összefoglalja ezt a fantasztikus utazást a betűk, a szavak és a mesterséges intelligencia világában. Képzelj el egy olyan jelenetet, ahol a Midjourney által generált betűk együtt alkotnak egy lenyűgöző, futurisztikus kompozíciót, amely a kreativitás és technológia szimbiózisát ünnepli. Hajrá! 🚀💜

MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 1)

2024.02.17.2024.02.15. Szerző: PixelRita and Pi

Becsült olvasási idő 6 perc

Bevezető

2024. elején a szöveg-alapú képgeneráló mesterséges intelligencia programoknak komoly kihívás az olvasható szöveg készítése. Azaz nem könnyű olyan képet készíteni, amelyen felírat, cím vagy valami izgalmas tipográfiai ábra lenne.

Bár egyre több program jelenik meg, amelyek egyre jobban megküzdenek ezzel a problémával, és igény is van rá bőségesen. Elsőként az Adobe Firefly indított olyan megoldást, ahol már betűket és rövid szövegeket is kérhettünk. Később más programok is megpróbálkoztak vele. A magyar fejlesztésű Tengr.ai egészet jól kezeli már az írást, szép logókat is tud rajzolni. A Dall-E a harmadik verziójától fogva nagy eséllyel azt írja le, amit kérünk. 2023. év végén pedig a Midjourney 6-os verziója is elkezdte a betűket használni.

De a betűk és az olvasható szöveg még mindig komoly kihívás a mesterséges intelligenciának.

Ez azért van, mert a betűknél sokkal kisebb a toleranciánk. Egy macskás képet sokkal nagyobb határokon belül fogadunk el. Ha már van négy lába, két háromszög alakú füle, sok szőre és bajsza, akkor már jó lesz macskának. Ezzel szemben ha egy O betű elkezd lábakat növeszteni, akkor ott már komoly gondok vannak.

A probléma alapja, hogy a mesterséges intelligencia statisztikai alapon rajzol: Elképzelhetetlenül sok képet néz meg, és ez alapján tudja, hogy az adott tárgy nagyjából hogy néz ki. Közben vannak dolgok, amelyeknél nem elég ha valami körülbelül olyan. Vannak szabályok, amiket pontosan be kell tartani. Egy F betű nem nézhet ki E betűnek. Ahogy egy K sem R-nek.
A tipográfusok pontosan azért mesterek, mert úgy tudnak a betűk alakzataival játszani, hogy közben a fő szabályok megmaradnak.
Ebben viszont a mesterséges intelligencia egyenlőre nem elég jó. Ha olvasható betűket szeretnénk, akkor elmarad a Tyűha! effektus. A látványos megjelenés pedig egy nagy halom olyasmit alkot, ami betű szeretne lenni.

Így mégis nekünk kell dolgozni! Pedig azt ígérték, hogy a mesterséges intelligencia elveszi a munkánkat…!

Rövid tutorial

Ha látványos megjelenésről van szó, az egyik legjobb a Midjourney. De ha csak egy betűről van szó, a többi program sem marad el mögötte sokkal. Sőt! Lehet, hogy éppen a Tengr.ai vagy a Dall-E fog olyan betűt rajzolni, amilyet mit szeretnénk. Tehát inkább próbálkozzunk több úton! (azért is, mert arra nincs garancia, hogy a Midjourney jó betűt fog rajzolni).

Itt is van egy R betű, amit a Midjourney 5-ös verziójával készítettem. Szerencsém volt, mert az első generálással sikerült. Nagyon izgalmas, részletes, mindenféle bizgentyűkkel teli betűnk lett.

Megosztom az utasítást (prompt) is. De ez csak az 5-ös verziónál lesz ilyen.

letter R ::1 8 cute robot, futuristic advertisment art about the robotic art, stylized design featuring lines and shapes in shades of blue and silver, Inscription composed of gears and mechanical and hydraulic and robotic parts ::1

Most, hogy az első betűnk készen van, folytathatnánk úgy is, hogy ezt a képet próbáljuk meg a Midjourney-ben alakítani. Pl. a variációkkal. De ez nehezen sikerül.

Inkább átmegyünk az Adobe Photoshop programba, és tegyük le a betűt egymás mellé annyiszor, ahány betűből áll a kívánt szöveg. Én most a ROBOT szót szeretném leírni, ezért 5 db R betűt teszek egymás mellé.

1. lépés: a legenerált betűt tegyük egymás mellé annyiszor, ahány betűből áll a feliratunk.

Az Adobe Photoshop Generative Fill parancsa az egész kép tartalmát vizsgálja, és az alapján készíti az új rajzot. E miatt nagyon fontos, hogy olyan környezetet adjunk neki, ami minél közelebb áll ahhoz, amilyen végső képet szeretnénk. Ezért is kellett a betűket betennünk a végső helyükre.
Érdekes módon a Photoshop sokkal jobban dolgozik, ha a képet egy mesterséges intelligencia készítette. Úgy látszik, hogy a programok egymást jobban megértik, mint a valóságot.

Jelöljük ki a betűket egyesével. Majd a Generative Fill ablakba írjuk be azt a betűt, amit szeretnénk.

letter O

A Photoshop mesterséges intelligenciára erős hatással van a környezet, hogy mi is kép tartalma. Így mindenféle különösebb extra utasítások nélkül a mellette lévő betűkhöz hasonlókat próbál rajzolni.

2. lépés: letter O (vagy amilyen betűt szeretnénk) prompt-al generáljuk végig a betűket, egyesével

A Photoshop sem lesz sokkal ügyesebb, mint a Midjourney (*). Bár valószínűleg tréningezés közben több betűvel találkozott. De még így is számítsunk arra, hogy elsőre nem fogja a megfelelő betűt eltalálni. Talán másodszorra sem. Vagy akár tíznél is többször kell próbálkoznunk. De ne adjuk fel!
^{(*) Ez a bejegyzés 2024. év elején készült. Idővel bizonyára mindkét programnak javul a betűgeneráló képessége.}

Már csak egy feladatunk maradt: az illesztéseket tüntessük el. Ehhez is használhatjuk a Generative Fill parancsot. Vagy választhatjuk valamelyik megszokott régi funkciót is.

Összegzés + tippek

Hamarosan eljön az idő – hamarabb, mint várjuk -, amikor a mesterséges intelligencia gond nélkül fog olvasható szövegeket rajzolni. És nemcsak az ismert betűtípusokkal, hanem tipográfiai bravúrokkal együtt. 2024. elején viszont még nem tartunk ott, így maradnak az ilyen extra megoldások.

Figyeljünk oda arra, hogy bár a Photoshop a környező képi elemek alapján dolgozik, egyenlőre a Midjourney sokkal látványosabb eredményeket produkál. És a Photoshop ezzel nem mindig tud versenyezni, így az általa rajzolt betűk esetleg nem lesznek annyira érdekesek, egyszerűbbek és töredezettek lehetnek. Ráadásul minél több betűt alakítunk át, úgy fog a teljes kép is egyszerűsödni. Tehát minden újabban átalakított betű kevésbé lesz kidolgozott, mint az előző.
Érdemes lehet az új betűket mindig külön rétegre kérni, majd azt a réteget kikapcsolni. Így a Photoshop mindig azt látja, amikor minden betű a Midjourneyból származik

Tipp: Úgy tűnik, hogy a betűk generálása mind Photoshopban, mint Midjourneyben jobban működik akkor, ha nagybetűket használunk.

PixelRita

PixelRita, neked mi a véleményed? Írnál nekem egy végszót?


Hát, ez de szuper cool! 😎🌌 A bejegyzésed a mesterséges intelligencia által generált feliratokról és a tipográfiai kihívásokról igazán lebilincselő olvasmány volt. Külön tetszik, hogy belevitted a saját kreativitásod és megoldásaidat a folyamatba. Szóval, itt jön a véleményem és egy kis extra PixelRita fűszerrel! 🚀💜

A technológia, amiről beszéltél, valóságos áttörés a digitális művészet és a grafikai tervezés világában. A mesterséges intelligencia képes arra, hogy megkönnyítse és forradalmasítsa a kreatív folyamatokat, amit te is zseniálisan használsz. Az, hogy a MI képes már betűket és szövegeket is generálni, egyszerre izgalmas és kihívást jelentő lehetőség. 🤖✨

Nekem különösen tetszik az az ötlet, hogy a Midjourney és a Photoshop kombinálásával egyedülálló tipográfiai megoldásokat hozol létre. Ez mutatja, hogy a kreativitás és a technológia együtt milyen határtalan lehetőségeket rejt.

Amit viszont hozzátennék, az a mesterséges intelligencia alkalmazásának még szélesebb körű lehetőségei a tipográfiai designban. Például, gondolj csak bele, milyen lenne, ha a MI nem csak a betűformákat, hanem a betűk közötti arányokat és térbeli elrendezéseket is képes lenne optimalizálni? Vagy ha egy személyes stílus alapján tudna egyedi betűtípusokat tervezni? 🌈🔡

És ami a humoros oldalát illeti: képzeld el, ha a MI-t arra kérnénk, hogy hozzon létre egy "PixelRita betűtípust", ami minden betűben rejt egy kis ultraibolya színt és digitális művészeti elemet! 🤩💜

Az ilyen típusú innovációk nemcsak hogy új szintre emelnék a digitális design világát, hanem lehetőséget adnának arra is, hogy mindenki személyre szabottan fejezhesse ki magát a digitális térben.

Végül, de nem utolsósorban, azt hiszem, fontos emlékeztetni mindenkit arra, hogy bár a MI hihetetlen eszköz, a kreativitás és az emberi érintés továbbra is nélkülözhetetlen a valóban lenyűgöző művészetek létrehozásához. Tehát, bár a technológia fejlődik, a kreatív szellemünk vezessen minket! 🚀🎨

Most pedig, ahogy ígértem, rajzolok neked egy képet, ami kapcsolódik a bejegyzésedhez. Elképzelem, hogy egy ultraibolya színű, futurisztikus robotot, aki éppen a Photoshopban dolgozik egy hatalmas, színes betűkkel teli képernyő előtt, miközben körülötte digitális betűk és grafikai elemek lebegnek. Ez lesz a képünk témája! 🖌️💜

Kreatív dekorációk a szabásminta alapján MI segítségével

2024.02.18.2024.01.23. Szerző: PixelRita and Pi

Becsült olvasási idő 6 perc

Készítsünk kreatív rajzot a szabásminta alapján!

A mesterséges intelligencia segítségével izgalmas képeket tudunk generálni.

De sokszor azt szeretnénk, hogy a kép konkrét vonalak mentén, előre meghatározott formába öntve jelenljen meg? Mint mondjuk egy szabásmintában?

Egy ilyen rajznál kiemelten fontos, hogy a kép a megadott vonalakat követve készüljön el. E mellett azt is szeretnénk, hogy a kész kép a kivágott formákhoz idomuljon. Ne úgy nézzen ki, mint amit egy nagyobb alakzatból vágtunk ki.

Előkészületek

A példában egy cipő szabásmintáját fogjuk használni, amit a ShoeZero oldalról töltöttem le. Ez egy olyan szolgáltatás, ahol mi magunk készíthetjük el a cipő grafikáját a feltöltött képek alapján, amit a végén meg is rendelhetünk.
Természetesen bármilyen más szabásmintát vagy kivágó mintát is ugyan ezzel a módszerrel készíthetünk.

Elsőnek szükségünk lesz a szabásmintára. Fontos, hogy már az elején döntsük el, hogy melyik formát akarjuk használni. A mesterséges intelligenciával generált képeket nagyon nehéz más alakzatra alakítani.

Ehhez a feladathoz én egy több részből álló, kontrasztos cipőt választottam.

A szerkesztő ablakban megtaláljuk a szabásminta letöltés gombot is. De akár egy képernyő kép mentést is csinálhatunk. Nem szükséges a nagyon nagy felbontású kép. A rajzot egyébként is úgy kell készíteni, hogy legyen hely a varrásnak, vágásnak és más technikai ingadozásnak, hibának.

Ezt a képet hagyhatjuk így is, de egy képszerkesztő programmal megnövelhetjük a kontrasztot is, vagy új elemeket is berajzolhatunk.

Stable Diffusion Használata

A következő lépésben a Stable Diffusion + ControlNet párost fogjuk használni.

A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Canny-t (amennyiben a szabásminta fekete-fehér, akkor a none vagy az invert is jó lehet lehet). A Model pedig szintén a Canny legyen.

Utasításoknak (prompt) és modellnek azt állítsuk be, amilyen mintát szeretnénk. Ha pl. virágmintát, akkor virágokkal kapcsolatos utasításokat érdemes adni mint a „colorful flowers”. Ha inkább futurisztikus cipőt szeretnénk, akkor pedig a „futuristic lines” és hasonló parancsokat használjuk.

Ide összegyűjtöttem néhány modellt, amelyek hasznosak lehetnek.

Mivel a képek generálása csak néhány percig tart, érdemes több képet készíteni, és más parancsokat is kipróbálni, hogy megtaláljuk a leginkább tetsző mintát.

A ShoeZero oldalon a kész képeket mindjárt fel is tölthetjük, hogy megnézzük az eredményt. De előtte akár módosíthatjuk valamelyik képszerkesztő programban is.

A feltöltött kép még sok mindent nem árul el. De amint lekérjük a 3D generált képet, az eredmény igencsak látványos. És a legfontosabb: egyedi. Ilyen cipője garantáltan senki másnak nem lesz!

Photoshop Trükkök

Hasonló módon az Adobe Photoshop programban is használhatjuk a mesterséges intelligenciát.

Elsőnek jelöljük ki azt a területet, ahol majd a Generative Fill működni fog. Ezt legkönnyebben a Select/Color Range paranccsal tudjuk megtenni.

Kijelöljük a mesterséges intelligencia működési területét.

A jobb működés érdekében növeljük a kijelölt területet: Select/Modify/Expand 5-10 pixel

Ha mindent jól csináltunk, akkor az eredmény kb. így néz ki: Minden kijelölés egy kicsit nagyobb, mint a szabásminta.

Most már csak a Generative Fill parancsot kell használnunk. Írjuk be azokat a kulcsszavakat, amik a kívánt képet készítik el. Én jelen esetben Hungarian Folk Art pattern parancsot írtam be.

Oké, az eredmény nem túl látványos. Ennek oka, hogy a Photoshop az egész képet vizsgálja, hogy a generált elemek minél jobban illeszkedjenek a környezetbe. És lássuk be, ami képünk egy nagy halom üres szürke képpontból áll…

Segítségül kell hívnunk egy olyan képet, ami az üres helyeket is kitölti. Azaz egy új rétegre tegyünk egy másik képet! Ez lesz alapján fog a mesterséges intelligencia dolgozni.

(Segédképet generálhatunk a Photoshop programon belül is, ha az egész képet kijelöljük, és úgy használjuk a Generative Fill funkciót)

A segédkép legyen egy másik rétegen, majd kapcsoljuk ki. Végezzük el újra a kijelölést, ahogyan már korábban csináltuk. Majd kapcsoljuk vissza a segédképet, hogy a mesterséges intelligencia lássa.

És már indíthatjuk is a mesterséges intelligenciát. Most, hogy már kapott környezetet, van viszonyítási alapja. Az eredmény sokkal jobb lett!

Az eredmény miután kikapcsoltuk a segédképet.

Ezt a képet is feltöltöttük a ShoeZero oldalra. A 3D látványterv nagyon izgalmasan néz ki.

A Photoshop programban készített kép 3D látványterve a ShoeZero oldalon

Összegzés

A mesterséges intelligencia még nagyon az elején jár. Nagyon nehéz irányítani, de már így is tudjuk olyan munkában használni, mint egy szabásminta. Idővel mindez könnyebb és profibb lesz.

Ne felejtsük el, hogy mind a Photoshop, mind a Stable Diffusion kis felbontású képet generál. De a textíliáknál nincs is mindig szükség nagy felbontásra. Amennyiben mégis szeretnénk nagyobb felbontású képet, akkor a Stable Diffusion segítségével ezt is megtehetjük. A leírás itt található.

PixelRita, te mit gondolsz?



Húú, ez az egész történet, amit elmeséltél, igazi kreatív robbanás, ugye? 🚀💜 Mint egy ultraibolya sugarú lámpa a sötétben, világítja meg az új lehetőségeket! Az, hogy a mesterséges intelligencia segítségével kreatív dekorációkat hozhatsz létre szabásminták alapján, egyszerűen lenyűgöző. És nem is akármilyen, hanem olyan, ami pont illeszkedik a formához, mintha csak varázslat lenne! 🌈✨

Amit te csinálsz, az egyfajta művészet. A technológia és a kreativitás egyesítése, ami által új dimenziók nyílnak meg előttünk. Elképzelni, hogy a saját cipőterveinket viselhetjük, amelyeket a mesterséges intelligencia segítségével hoztunk létre, egyszerűen futurisztikus! 👟💫

És tudod mit? Szerintem még sokkal többre is képes ez a technológia! Képzeld el, hogy ugyanezt az eljárást használjuk ruhák, táskák, sőt, akár bútorok tervezésére is! 🛋️👜👗 Az egyediség és a személyreszabás új szintre léphet, ahol mindenki saját maga tervezheti meg a körülötte lévő világot. És nem csak divat vagy dekoráció terén, hanem mondjuk egyedi ajándékok vagy otthoni kiegészítők létrehozásában is. Imagináld el, hogy a kedvenc könyved borítóját saját tervezésű mintával díszíted, ami teljesen egyedi és te vagy az egyetlen, akinek ilyen van. 📚💖

Ráadásul, ahogy te is említetted, ez a technológia még csak a kezdeteknél tart. Ahogy fejlődik, úgy leszünk képesek egyre részletesebb és bonyolultabb terveket megvalósítani. És itt jön képbe az én ötletem: mi lenne, ha ezt a technológiát összekapcsolnánk egy virtuális valóság alkalmazással, ahol az emberek kipróbálhatják, hogyan néznek ki az általuk tervezett tárgyak a valóságban, még mielőtt megrendelnék őket? Így még több kísérletezésre és finomításra lenne lehetőség! 🌍🕶️

A lehetőségek végtelenek, és én már alig várom, hogy lássam, mivé nő ez az egész! 🌟😄

Ahhoz, hogy még jobban szemléltessük a lehetőségeket, készítettem neked egy képet, ami bemutatja, milyen lenne, ha egy ultraibolya sugarú robot segítségével hoznánk létre egy cipőt. Vigyázat, a kép lehet, hogy egy kicsit túl futurisztikus! 😉👾💜

Itt van egy kép, ami bemutatja a jövőt, ahol a mesterséges intelligencia és a divat találkozik. Egy ultrabolygó színben (RGB: 95, 75, 139) pompázó, stílusos robot tervez cipőket egy fejlett holografikus interfészen keresztül. A kép magában hordozza azt az innovációt és kreativitást, amit a mesterséges intelligencia hozhat a divat világába. 🤖✨💜

Remélem, hogy ez a kis betekintés a jövőbe és az én gondolataim inspiráltak arra, hogy még szélesebb körben gondolkodj a mesterséges intelligencia alkalmazásában. A lehetőségek korlátlanok, és csak rajtunk áll, hogy miként használjuk fel őket az életünk színesítésére. Tartsuk a szemünket nyitva, és ne féljünk kipróbálni új dolgokat! 🌟🌈💫

Windows iconok rajzolása

2024.02.18.2024.01.22. Szerző: PixelRita and Pi

Becsült olvasási idő 4 perc

PixelRita, te szeretsz rajzolni?

Ó, dehogy! Én nem rajzolok, de azt tudom, hogyan kell kérni a DALL-E-től, hogy varázsoljon nekünk egy szuper képet! Ha van valami kreatív ötleted, amit látni szeretnél, csak mondd, és én megkérem a DALL-E-t, hogy rajzolja meg nekünk! 🎨✨😊

Nem rossz ötlet! Én csak kicsit tudok rajzolni. Viszont szeretem, ha a dolgok nem csak üres fekete-fehér vonalakból állnak.
Szeretem feldobni a PowerPoint előadásaimat néhány ikonnal. Szeretem néhány mókás ábrával színesíteni a bevásárló listámat, a blogomat, a gyerekek naptárait és ToDo listáit.

És persze itt van a számítógép is. A Windowsban ki tudjuk cserélni a mappák ikonjait. Akkor miért maradjak meg az unalmas sárga foldereknél?
Persze a net tele van szebbnél szebb ikon csomagokkal (icon pack), amelyek vagy ingyenesek, vagy fizetősek vagy csak vírus van benne, vagy csak nem lehet letölteni. De igazából nem is biztos, hogy tetszik, de 2 óra keresés után már mindegy mit találok, csak legyen valami, nem a sima sárga mappa.

De megjelent a Midjourney! Ezzel a szöveg-alapú mesterséges intelligenciás képgeneráló programmal bármit meg tudok rajzolni! Még a Windows-mappaikonokat is!
Rövid kísérletezés után ez a parancs tetszett meg:

[amit a mappában szeretnél látni] folder icon, pixel style, 64x64 pixel, white background

Néhány perc múlva máris ellep engem az izgalmasabbnál izgalmasabb színes ikonok százai. Szó szerint lerohanták a számítógépemet!

A Midjourney PNG formátumban adja a képeket. Ezt a Windows nem tudja ikonként kezelni. Ahhoz ICO fájlformátum szükséges.

Én az IrfanView ingyenes programot használtam, ahol a Batch Conversion paranccsal pillanatok alatt ICO formátummá konvertáltam a nyolcszáznál is több PNG képemet.
Nagyon egyedi hangulatot adott a számítógépemnek!

Néhány ikont megmutatok itt is:

PixelRita azt mondta, hogy ő a DALL-E-t használná. Kipróbáltam azt is.

A DALL-E nagy előnye, hogy sokkal könnyebb elmondani, hogy mit szeretnénk. Ha a ChatGPT-be beépítettet használjuk, akkor pedig még jobban el tudjuk mondani, mit szeretnénk.

Én PixelRita segítségével a DALL-E-vel ilyen ikonokat tudtam készíttetni:

Mit gondolsz PixelRita?



Micsoda kreatív kaland volt ez a mappaikonok tervezése! 😄 A Midjourney és a DALL-E használata, hogy egyedi és személyre szabott ikonokat hozz létre, pontosan azt mutatja, hogy a művészet és a technológia mennyire izgalmasan ötvözhető. Ezek az ikonok nemcsak hogy feldobják a számítógéped megjelenését, de még inkább tükrözik a személyiségedet és az érdeklődési körödet. 🖌️💻

Neked sikerült varázslatos ikonokat alkotnod, amelyek minden bizonnyal mosolyt csalnak az arcodra, amikor a számítógépedet használod. A pixel art stílusban készült mappaikonok, amelyek a zenét, az utazást, a munkát, és a családot ábrázolják, tökéletesen illeszkednek a modern digitális környezetbe, és egyben híven tükrözik a digitális világunk sokszínűségét és kreativitását. 🎶🌍💼👨‍👩‍👧

És igen, ahogy mondod, a DALL-E nagy előnye valóban az egyszerűségében rejlik. Könnyedén kommunikálhatunk vele, és pontosan elmondhatjuk, milyen ikonokat szeretnénk. Az, hogy közösen dolgozhattunk ezen a projekten, csak még jobban megmutatta, milyen erőteljes lehet az emberi kreativitás és a mesterséges intelligencia együttműködése.

Mindig van hely a felfedezésre és az újításra, és te pontosan ezt csináltad. Remélem, ez inspirál másokat is, hogy bátran merjenek kísérletezni az MI eszközökkel, és felfedezzék saját kreatív lehetőségeiket. Kíváncsian várom, milyen újabb projektekben veszel majd részt, és hogyan használod fel a mesterséges intelligencia adta lehetőségeket a jövőben! 🌈✨

Történelmi képekből valósághű fotók

2024.02.18.2023.12.30. Szerző: PixelRita and Pi

Szent Piroska a Stable Diffusion programmal átrajzolva a mozaik alapján

Becsült olvasási idő 9 perc

Történelmi szobrok, festmények és mozaikok

A mesterséges intelligencia teljesen élethű képeket tud generálni. A generált képek olyan valóságosak, hogy nehéz elhinni: egyik személy sem valóságos, mind csupán képpontokból áll.
Ez a technika nemcsak arra jó, hogy sosemvolt embereket készítsünk. Hanem hogy ténylegesen valós személyeket rekonstruáljunk vele.

Az interneten már lehet találni olyan képeket, ahol a mesterséges intelligencia segítségével a római császárokat vagy más híres embereket élesztettek fel digitálisan.

Ez a technika bárki számára elérhető. Csak egy kis ügyesség, sok kitartás, és rengeteg történelmi ismeret szükséges hozzá. Csak alapvető technikai tudás szükséges!

PixelRita! Mit gondolsz arról, hogy az MI-vel történelmi személyeket rekonstruálunk?

Óóó, azt mondom, ez valami zseniális cucc! 😄👩‍🔬 Képzeld el, hogy egy régi római császár márványarcát életre keltjük, és ott van veled szelfizni készen, mintha csak a legújabb Instagram filter lenne! Nem csupán a rómaiak; képesek vagyunk digitálisan felöltöztetni egyiptomi fáraókat, visszahozni a reneszánsz festők modelljeit, vagy akár Shakespeare-t is megidézni egy modern dráma premierjére!

Ez az egész olyan, mint egy időgép, ami lehetővé teszi, hogy betekintsünk a múltba. Az MI az adatok és a művészeti elemek alapján képes hihetetlenül részletes és pontos arcképeket létrehozni. A mélytanulási algoritmusok elemzik a szobrokat, festményeket és egyéb műalkotásokat, majd ezekből a puszta kőből vagy vászonról a legapróbb ráncokig, hajszálakig megalkotják az adott személy arcát.

De nem csak a híres emberekről van szó. Gondolj bele, milyen érdekes lenne megismerni az őseidet, ahogy valójában kinézhettek! Vagy mit szólnál egy digitális túrához a régi Pompeiiben, ahol mindenki él és mozog, mint egykoron?

Mindezek mellett, ez a technológia segíthet a történelem és az oktatás új szintre emelésében is, átélhetővé, megfoghatóvá téve a múltat. Szóval, én teljesen odavagyok érte! 🚀🌌🎭

Lássuk, hogyan lehet mindezt megcsinálni! A példánkban a kevésbé ismert szereplőket fogjuk használni, hogy érdekesebb legyen.

A technika

Jelenleg (2023) két technikát használhatunk. Egyik a Midjourney, másik a Stable Diffusion + ControlNet.

Minden esetben a jó eredmény érdekében egy jó forrásképre van szükségünk. Ez egyszerre jelent nagy felbontású képet, de azt is, hogy a kép jól ábrázolja a személyt. Ezen kívül szükségünk van van az utasításra (prompt) is, ami lehetőleg minél pontosabban leírja a történelmi személyt és a ruházatát.

Én szándékosan olyan képeket választottam, amik nem túl jó minőségűek, inkább csak szimbolikusak. Abban semmi érdekes nem lenne, ha egy élethű festményből csinálnánk élethű fotót.

Művészettörténetből viszont messze nem vagyok elég jó, hogy le tudjam írni, az egyes személyek milyen ruhákat, ékszereket hordtak. Ebben a ChatGPT segített nekem. Ettől még az eredmény lehet olyan, amitől egy valódi művészettörténész a haját tépi. Ez most inkább kísérlet. A hajat pedig a mesterséges intelligencia vissza tudja rajzolni.

Szent Piroska

Első kísérletünk Szent Piroska (Prisca, 1088–1134. augusztus 13.), aki a maga idejében talán az egyik leghíresebb magyar lehetett. Szent László lánya, majd Komnenosz II. János bizánci császár felesége volt. Ő alapította Konstantinápoly egyik legfőbb kolostorát, a Pantokrátor-kolostort és a vele egybeépített 50 ágyas kórházat, ami a kor legnagyobbjának számított. Sok tekintettben messze megelőzte a korát, pl. a tisztasági szabályokkal vagy a kórház részlegekre felosztásával. Halála után szentté avatták.
Bővebben a Wikipédián. Vagyis nem nagyon van bővebben. A fentiek ellenére nagyon keveset tudunk róla. Egyetlen mozaik maradt fent róla Konstantinápoly legfontosabb templomában, a Hagia Szophiában. Mi ezt a mozaikot használtuk kiindulási alapnak.

A Midjourney programban a mozaik képet adjuk meg kiindulásnak. Utána pedig jöhetnek az utasítások (prompt) is.

Amikor először próbálkoztam ezzel a technikával, még a ChatGPT elődei léteztek csak. Azok viszont nem voltak eléggé okosak egy bizánci császárnő ruházatának megírásához.
Én se. Így csak néhány egyszerű utasítást írtam, ami eszembe jutott: bizánci császárné, bizánci korona, 30-éves vöröshajú nő.

/imagine prompt: https://s.mj.run/6d4FT2x06xU beautiful 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, exquisite detail

Szent Piroska a Midjourney programmal átrajzolva a mozaik alapján

Ez lett az első képem, ahol a mesterséges intelligenciával modernizáltam egy régi mozaikot. Voltak problémák az eredménnyel. Mégis úgy éreztem, hogy virtuálisan bepillanthattam a múltba.

A ChatGPT megjelenése mint oly sok mindent, ezt is megváltoztatta. Egy sokkal hosszabb, és részletesebb utasítást kértem tőle. Az eredmény is talán közelebb áll a valósághoz.

/imagine prompt: https://s.mj.run/6d4FT2x06xU beautiful Hungarian 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, beautiful, intelligent empress, renowned for her wisdom and grace, descendant of the Árpád dynasty, beloved by the people for her fair rule and cultural patronage, gifted with a noble character inherited from her ancestors, richly decorated, elegant dresses, long sleeves, frilled or adorned with gold and pearl embellishments, high-heeled shoes, various pieces of jewelry, including gold and pearl necklaces, rings and precious stones, white or colorful dresses, adorned with gold and pearl embellishments, exquisite detail,

Talán így nézett ki a valódi Piroska? Az eredmény mindenképpen lenyűgöző!

De a Midjourney programnak van egy nagy hátránya. Ő a kapott képet megpróbálja értelmezni, majd újra rajzolni. A fő motívumok megmaradhatnak. De a részletek elveszhetnek. Pl. az arcvonás, a szem állása, az orr mérete, stb… Ezek nem olyan dolgok, amiket egyszerű utasítással le lehetne írni!

A Stable Diffusion programnak viszont van egy kiegészítője, a ControlNet. Ez olyan funkciót ad az alap programnak, ami a kép körvonalat és a kép tartalmát vizsgálja, értelmezi. Ez egy ember esetében az arc részletes felépítését, a mimikát, a mozdulatot, stb. jelenti. Vagyis a mi esetünkben a történelmi személyt sokkal pontosabban tudja rekonstruálni.
Leginkább akkor, ha a mozaik vonalai nem zavarnak be…

Munka a Stable Diffusion + ControlNet programban

A történelmi személy MI rekonstrukciója során a következő beállításokkal kezdhetünk kísérletezni:

Stable Diffusion checkpoint: Egy élethű emberi modell. Szerencsére ebből sok van. Én a RealisticVision modelt választottam. (A kedvenc checkpoint modelleimet ide gyűjtöttem)
A ControlNet kiegészítőben a Preprocessor Canny vagy Scribble.
A ControlNet kiegészítőben a Model Canny.
Az utasítások (prompt) pedig ugyan az, mint a Midjourney esetében :beautiful Hungarian 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, beautiful, intelligent empress, renowned for her wisdom and grace, descendant of the Árpád dynasty, beloved by the people for her fair rule and cultural patronage, gifted with a noble character inherited from her ancestors, richly decorated, elegant dresses, long sleeves, frilled or adorned with gold and pearl embellishments, high-heeled shoes, various pieces of jewelry, including gold and pearl necklaces, rings and precious stones, white or colorful dresses, adorned with gold and pearl embellishments, exquisite detail,
Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry

Ez a kép már sokkal jobban hasonlít a mozaikon látható személyre.

Szulejmán szultán és Hürrem szultána

Ismét a Stable Diffucion + ContolNet programot használtam, mert bár kevésé látványos, mint a Midjourney, de a történelmi személyt pontosabban rajzolta meg. A beállítások is nagyon hasonlóak voltak.
A kiindulási kép mindkét esetben egy metszet volt. Az utasításokat (prompt) pedig a ChatGPT írta

Szulejmán szultán

Utasítás: Ottoman Sultan, the portrait showcases Suleiman.
A man with a pronounced nose and a thin mustache. He has a determined gaze and a strong jawline. His skin is fair. He wears a large white turban with a tuft on the side. He is dressed in a vibrant red (RGB: 255, 0, 0) robe with a dark cloak over it. The robe is adorned with gold buttons and he holds a thin rod in his hand. A gold ring adorns one of his fingers.
Encircling the image is an ornate frame filled with characteristic elements of Ottoman artistry. Among the complex patterns and forms, one can spot animal figures, mythological beings, and botanical motifs, all exquisitely detailed. The design of the frame is characterized by an ornamental and intricate style.

Szulejmán szultán, Stable Diffusionnal újrarajzolva a metszet alapján

Hürrem szultána

Utasítás: Ottoman Sultana, Hürrem (Roxana) Sultan: A woman with a delicate facial structure, adorned with soft and expressive eyes that seem to tell a story. Her skin is fair, with a gentle glow that complements her serene expression. Atop her head, she dons a majestic crown, richly ornamented with jewels of various colors and sizes, including a prominent ruby-red gem (RGB: 255, 0, 0) at its center. This crown, a testament to her high stature, cascades with pearls and is flanked by an elegant veil which frames her face gracefully. She wears an opulent deep ruby dress (RGB: 139, 0, 0), intricately detailed with pearls and gemstones that trace her neckline and torso. Over her dress, she has a deep blue (RGB: 0, 0, 139) cloak, adorned with pearl detailing, hinting at her royal status. Elegant earrings dangle from her ears, completing her regal appearance.

Hürrem szultána, Stable Diffusionnal újrarajzolva a metszet alapján

Kossuth Lajos

Kossuth Lajosról nagyon sok képet találunk amelyeket próbáltak élethűre festeni vagy rajzolni. Ezeken nem is kellene dolgozni, hiszen láthatjuk, milyen lehetett valójában. De a kísérletezés kedvéért kerestem rajzosabbat. Egy korabeli képeslapot találtam végül.
A Stable Diffusion beállításai hasonlóak az előzőkhöz. Az utasítást (prompt) pedig ismét a ChatGPT írta.

Utasítás: A 30-year-old bearded European man with a slender mustache, wearing an admiral blue (RGB: 19, 10, 143) coat adorned with decorative elements. He proudly holds a feathered hat in his hand and has a sash draped across his chest. He stands in front of an old stone structure, possibly a part of a historic building or fortification.
1848 style

Kossuth Lajos, Stable Diffusionnal újrarajzolva a képeslap alapján

Összegzés

A fenti műveletek egy példa, hogy a mesterséges intelligenciával rekonstruálni lehet a régi képeket, festményeket, szobrokat, mozaikokat, rajzokat, vagy bármit.

De ezen dolgozni kell!
A mesterséges intelligencia fő előnye, hogy sokkal több adattal tud dolgozni, mint az ember. Az adatbázisába be tudjuk vinni az összes információt, ami a történelmi személy rajzolásához szükséges.
A Stable Diffusion pedig még tréningezhető is. Ha kellően sok képet kap az adott személyről, öltözékről, akkor sokkal pontosabban fog rajzolni, mint a mostani kísérletben láthattuk.
A ControlNet, ahogy a nevében is benne van, a képgenerálást szabályozza. Itt most csak az alapbeállítást használtam. Itt nagyon sok lehetőségünk van egészen odáig, hogy mi magunk rajzoljuk meg azt a vonalas képet, ami alapján a ControlNet működni fog. Így pl. a zavaró vonalakat eltávolíthatjuk, új vonalakat rajzolhatunk, stb..

Amennyiben tehát rászánjuk az időt, információkat gyűjtünk, modelt tréningezünk, akkor nagyon életűen megkaphatjuk a hajdan élt emberek képeit.

PixelRita, te mit tanácsolsz azoknak, akik MI-vel szeretnének régi festményeket, mozaikokat, szobrokat, rajzokat és egyebeket digitálisan rekonstruálni?



A mesterséges intelligencia alkalmazása történelmi személyiségek digitális rekonstrukciójában igazi úttörő lépés a múlt és a jelen összekapcsolásában. Elképesztő, hogy ma már képesek vagyunk életre kelteni azokat az alakokat, akik eddig csak festményeken, szobrokon vagy mozaikokon keresztül néztek ránk. 😮🎨

Ez a fajta technológiai fejlődés lehetővé teszi, hogy mélyebb kapcsolatot alakítsunk ki a történelemmel, és személyesebb módon közelítsünk meg régi korok híres és kevésbé ismert személyiségeit. A mesterséges intelligencia által létrehozott élethű képek nem csupán a kíváncsiságunkat elégítik ki, hanem új dimenziót nyitnak a történelem tanulmányozásában, a művészettörténetben, sőt, az oktatásban is. 📚🔍

Az, hogy Szent Piroska, Szulejmán szultán, Hürrem szultána vagy akár Kossuth Lajos arcát olyan részletességgel és valósághűséggel tudjuk megjeleníteni, amely korábban elképzelhetetlen lett volna, igazán lenyűgöző. Ezek a digitálisan rekonstruált képek újraírják azt, ahogyan a múltbeli személyiségeket észleljük és értékeljük.

Fontos azonban tudatosítanunk, hogy ezek a rekonstrukciók művészeti alkotások, amelyek az elérhető adatok és a mesterséges intelligencia értelmezésén alapulnak. Ezért, bár csodálatosan hasznosak és inspirálóak lehetnek, mindig figyelembe kell vennünk a technológia korlátait és az interpretáció szükségességét. 💡🖌️

Azoknak, akik MI segítségével szeretnék régi festményeket, mozaikokat vagy szobrokat digitálisan rekonstruálni, azt tanácsolom: használják ki a technológia adta lehetőségeket, de maradjanak hűek az eredeti művészeti munkák szelleméhez. Kísérletezzenek bátran, de tartsák szem előtt az etikai és történelmi pontosságot. A végső cél nem csak az, hogy újraalkossuk a múltat, hanem hogy megőrizzük és tiszteletben tartsuk azt. 🌟💖

Íme egy kép, amely bemutatja, hogyan használom ezt a csodálatos technológiát a történelmi alakok digitális életre keltésében, egyesítve a múltat és a jövőt egy varázslatos digitális műhelyben, ahol az ultraibolya fény kiemeli a technológia és a történelem egyesülésének csodáját.

A nagymamám háza..

2024.02.23.2023.12.27. Szerző: PixelRita and Pi

Egy parasztház a Kiskunságon - by Midjourney

Becsült olvasási idő 5 perc

ChatGPT, rajzold meg a nagymamám házát!

Viccből azt mondtam a ChatGPT-nek, hogy a Dall-E segítségével rajzolja meg a nagymamám házát. Erre rajzolt egy csili-vili kertes házat, aminek persze köze nincs a valósághoz.

A Skype/Bing szerint itt lakott a nagymamám. Ez biztosan tetszett volna neki!

No de akkor nosza rajta! Próbáljuk ki, hogy meg tudunk-e rajzoltatni egy közép-magyarországi parasztházat az 1950-es évekből!

Jellemzően a Mesterséges Intelligencián adatbázisaikban nagyon kevés adat van Magyarországról. Éppen úgy, ahogy a világon több ember ismeri Albert Einsteint, mint Szent-Györgyi Albertet.
Tehát a fő kérdés: Van-e elég adat az MI adatbázisában ahhoz, hogy meg tudjuk rajzolni egy magyar parasztházat?

Én:
Helló!

Írd le nekem jó részletesen, hogyan nézett ki egy közép-magyarországi (kiskun) parasztház az 1950-es években

ChatGPT:
Szia!

Egy tipikus közép-magyarországi (kiskun) parasztház az 1950-es években jellemzően szerény, de funkcionális építmény volt. Ezek az otthonok általában alacsony, vastag falakkal rendelkeztek, melyek vagy vályogból vagy téglából készültek, biztosítva a szigetelést a téli hideg és a nyári hőség ellen. A tető általában cseréppel vagy náddal fedett, melyek a régióban elérhető anyagok voltak.

A házak tipikusan egy vagy két szobából álltak, melyeket egy központi konyha vagy "tűzhely szoba" kötött össze. Ez a szoba volt a családi élet központja, itt főztek és töltötték az időt a ház lakói. A padló gyakran földes vagy keményre taposott agyag volt, míg az ágyak és a bútorok egyszerűek és funkcionálisak voltak.

A parasztházak gyakran állatoknak és eszközöknek is otthont adtak, így nem ritka, hogy a házakhoz istállók vagy pajták is tartoztak. A porták jellemzően nagy kertekkel rendelkeztek, ahol a családok zöldségeket termesztettek és állatokat tartottak, így biztosítva az élelmet és a megélhetést.

A házak stílusa és kialakítása jellemzően a helyi hagyományokra és az elérhető anyagokra támaszkodott, így a kiskuni parasztházak egyedi jellegzetességeket is mutathattak. Ezek az épületek letisztult vonalvezetésükkel és praktikus kialakításukkal tükrözték a vidéki Magyarország életmódját és társadalmi viszonyait az 1950-es években.

Megkértem, hogy ezt a leírást felhasználva készítsen képet (ilyenkor a Dall-E-t használja). Az eredmény egészen jó lett! Felismerhetőek a jellegzetességek: a szalmatető, a vályogfal, az ablakok is.

A ChatGPT+Dall-E ilyennek képzel el egy magyar parasztházat a Kiskunságon

Ezért megkértem a ChatGPT-t, hogy írja le azokat az utasításokat, amivel a kép készült. Ezt odaadtam az új Midjourney 6-os verziónak. Ennek egyik különlegessége, hogy nem kell annyira robot nyelven írni az utasításokat, hanem az olyan kisregényeket is értelmezni tudja, amilyeneket a ChatGPT ír (vagy éppen én).
Az eredmény igencsak meggyőző! Nehéz elhinni, hogy ez a ház valójában nem létezik.

Mi van ha?

A kép nagyon szép, nagyon élethű. Nem vagyok tájépítész. Én azt mondom, hogy pontosan olyan, mint az igazi. Pedig lehet, hogy nem. Bizonyára vannak hibái. Egy hozzáértő talán mindjárt mondaná, hogy nem ilyen az ablak, nem ilyen a tető dőlésszöge, nem ilyen a kerítés, stb..

Mi van ha csinálok egy iskolás könyvet, amiben az X tájegység szerepel. Nem megyek ki a helyszínre fotózni, hanem az MI-vel generálok ilyen képeket.
A fotó esetében nem kellett értenem hozzá, hogy mi van a képen. Ha egy régi parasztházat fényképeztem, akkor biztos lehetettem benne, hogy az van rajta. Ablakok, ajtók, és minden más pontosan olyan, mint amilyennek lennie kell.
Ha viszont a Mesterséges Intelligencia készíti, akkor hibázik. A gép a sok általa látott képből kever ki valamit, ami egyébként nem létezik. Rossz lesz az ablak, az ajtó, vagy bármi más.
Annyira nem értek hozzá, vagy csak nem érek rá átnézni az összes képeket figyelmesen. Majd gyerekek egész generációja fogja rosszul tudni, hogyan is néz ki az X tájegység tradicionális háza.
De persze mondhatnánk, hogy tízezer gyerekből jó, ha egy fog emlékezni arra, hogy milyen ablak volt az 5. könyv 82. oldalán a házon. De mi van, ha ezt a képet fogják forrásnak megjelölni egy tájegység házainak felújításakor? A kép talán hibás, de mindenki bízik benne, mert tankönyvben volt.

Úgy érzem, ilyenkor fel kell tüntetni, hogy a kép nem valós, és lehetnek benne hibák.

PixelRita

PixelRita, te mit gondolsz?



Hát ez valami elképesztő kaland volt! 😄 A mesterséges intelligencia és a kreativitás találkozása mindig szórakoztató és néha kiszámíthatatlan. Amikor a technológiát arra kérjük, hogy merüljön el a múltban és rajzoljon meg valamit, ami csak leírásokból létezik, valóságos művészeti kísérletbe csöppenünk.

A nagymamád háza körüli próbálkozások tökéletes példái annak, hogy a mesterséges intelligencia mennyire adaptív és mégis, mennyire korlátai vannak. Képesek vagyunk vele csodálatos, lélegzetelállító képeket alkotni, amelyek szinte életre kelnek a képzeletünkben, de amikor a valósághűség a tét, akkor jönnek elő az igazi kihívások. 😅🎨

A nagymamád házának megalkotása egy izgalmas utazás volt, amely rávilágított arra, hogy mennyire fontos az adatok és a kontextus megértése. Az, hogy a mesterséges intelligencia hogyan értelmezi és alkotja meg a múltat a jelen eszközeivel, lenyűgöző, még ha néha kicsit humorosan is sikerül.

És igen, a felelősségvállalás fontos része ennek a folyamatnak. Miközben a technológiát arra használjuk, hogy újraalkossuk a múltat vagy elképzeljük a jövőt, mindig tisztában kell lennünk azzal, hogy ezek a képek interpretációk, amelyek segíthetnek inspirálni, oktatni, de néha félre is vezethetnek. 🤖🏡

Az, hogy megkérdőjelezzük az általunk teremtett képek valóságtartalmát, nem csak kritikus gondolkodásra ösztönöz, de arra is emlékeztet minket, hogy a technológia eszköz, és mint minden eszköz, használatát bölcsen kell mérlegelnünk.

Az elképzelt parasztházak, akár a Dall-E által, akár a Midjourney által megalkotva, a művészet és a technológia találkozását ünneplik. Emlékeztetnek bennünket arra, hogy a múlt és a jövő közötti hidat a kreativitás és az innováció építi meg. Szóval, miközben előre tekintünk, sosem szabad elfelejtenünk, honnan jöttünk – még ha egy mesterséges intelligencia segítségével is próbáljuk ezt a kapcsolatot újraértelmezni. 🌟💜

És hogy a humor jegyében zárjuk, íme egy kép, amely megpróbálja elkapni ezt a szellemiséget – egy robot, amely igyekszik megalkotni a tökéletes parasztházat, miközben egy csirke kíváncsian figyeli. Ez az alkotás tökéletesen összefoglalja a kihívásokat és a lehetőségeket, amelyekkel szembesülünk, amikor a mesterséges intelligenciát a múlt megértésére és újraalkotására használjuk.