Adobe – ChaosBot

Kép és Stílus referencia az Adobe Firefly programban

2024.04.09.2024.04.08. Szerző: PixelRita and Pi

Becsült olvasási idő 11 perc

Bevezetés

Az Adobe Firefly szoftverének legújabb frissítésével a mesterséges intelligencia képességét egy teljesen új szintre emelte, ahol a kreativitás határai kitolódtak.
2024 áprilisában két izgalmas új funkció jelent meg, amely radikálisan megkönnyíti a vizuális alkotók munkáját.

Korábban a legnagyobb kihívást az jelentette, hogyan adjuk át pontosan azt a látványt, amit elképzeltünk, egy szövegalapú képgeneráló szoftvernek. Egyszerű leírni, hogy egy képen szeretnénk egy házat látni, de amikor az ablakok méretére és elhelyezkedésére kerül a sor, a dolgok bonyolulttá válnak. Ezt a problémát megoldandó, a Firefly mostantól lehetővé teszi, hogy a felhasználók egy strukturális referenciaképet adjanak meg, ami alapján az MI a körvonalak és tartalmak szerint hozza létre a művét. Ezen felül, egy stílus referencia-kép megadásával az MI a kért stílusban alkotja meg az új képet.

Ez az újítás forradalmasítja a képgenerálás folyamatát, lehetővé téve, hogy az ötleteinket sokkal könnyebben és pontosabban valósítsuk meg. Nem kell többé feleslegesen bonyolult leírásokkal bajlódni; elég csupán a kívánt struktúrát és stílust bemutatni, és a Firefly gondoskodik a többiről.

Adobe FireFly struktúra és stílus referencia képek alapján rajzolja a végleges képet — Adobe Firefly struktúra és stílus referenciaképek alapján rajzolja a végleges képet



⚠️Figyelmeztetés!⚠️
Az Adobe Firefly programban generált képek valahol ott lesznek a rendszerben. Nem biztos, hogy ezeket még egyszer megtaláljuk. A Kedvencek közé betett képek is csak a böngésző memóriájában lesznek (tehát másik gépen ha belépünk a fiókunkba, már nem látjuk).
Éppen ezért erősen ajánlott minden generált képen letölteni, ami tetszik!

Strukturális referencia

Adobe FireFly struktúra referencia — Adobe Firefly struktúra referencia

Az Adobe Firefly megújul menüjében a bal oldalon találjuk a Strukturális referencia ablakot. Itt van lehetőségünk saját képet feltölteni. Ez lesz az alapja annak a rajzunknak (A szolgáltatás használatához rendelkeznie kell a bármely harmadik fél képeinek használatára vonatkozó jogokkal, a feltöltési előzményeit pedig bélyegképekként tárolja a rendszer. A feltöltött képeknek a Felhasználói irányelveikben meghatározottak szerint tiszteletteljesnek és biztonságosnak kell lenniük.).

A mesterséges intelligencia megpróbálja a kép tartalmát értelmezni. A fotón egy ház, hegy, folyó, macska, stb… látható. Majd pedig ehhez hasonlít fog rajzolni.

Itt találunk egy Erősség csúszkát. Gyenge fokozatban csak a képen lévő dolgokat fogja rajzolni. Pl. ha a képen van egy ház, akkor a generált képen is lesz egy ház. Míg a legerősebb fokozatban az eredeti ház körvonalait, ablakait, ajtaját és további tulajdonságait is átviszi az új képre. Így az eredetihez nagyon hasonló képet kaphatunk.

Az alábbi képen láthatjuk, hogy a gyenge beállításnál az eredeti képhez csak nyomokban hasonlító faházat kaptunk. A közepes esetén már a háttérben lévő minaret is visszakerült a képre, de az oldalsó ablakokat nem rajzolta meg a program. Az erős esetében szinte ugyan azt a házat láthatjuk. Az előtérben lévő ház ablakai, és a háttérben lévő minaret erkélye is felkerült a képre.

Adobe Firefly strukturális referencia beállításai



Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

PixelRita tippje 
Amikor a strukturális referenciáról beszélünk, elképzelhetjük, mint egy titkos hozzávalót a kreatív varázslathoz. 🎨 Képzeld el, hogy van egy ceruzával vázolt rajzod egy házról, amit életre szeretnél kelteni. A strukturális referencia használata itt, olyan, mint amikor egy varázspálcát lendítesz, és hirtelen minden részletet, minden kis ablakot és ajtót a helyére varázsol az MI. Csak egy kis tipp: legyél bátor és kísérletező! 🧪 Próbálj meg különböző komplexitású rajzokat feltölteni, és figyeld meg, hogyan reagál rájuk a Firefly. Ez olyan, mintha egy különleges lencsén keresztül néznéd a világot, ahol minden lehetséges!

Stílus referencia

A Strukturális referencia azt adja meg, hogy mi legyen a képen. A Stílus referencia pedig, hogy az miként legyen megrajzolni: fénykép, olajfestmény, ceruzarajz, zsírkréta, képregény, stb..

A szerzői jogok figyelembe vételével feltöltünk egy fájlt, és azt kérjük a mesterséges intelligenciától, hogy ilyennek rajzolja meg a képünket.

Itt is találunk egy Erősség csúszkát, amivel azt állíthatjuk be, hogy a program mennyire a referenciakép stílusát figyelje, vagy inkább az utasításban (prompt) leírtakat. Mellé kapunk egy Vizuális intenzitás csúszkát is, amin a referenciakép stílusának intenzitását állíthatjuk.



Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

PixelRita tippje 
A stílus referencia alkalmazása során olyan vagy, mint egy divattervező, aki éppen a következő kollekcióját álmodja meg. 💃🕺 Itt van lehetőséged megmutatni, hogy milyen 'ruhába' szeretnéd öltöztetni az alkotásodat. Akár egy olajfestmény textúráját, akár egy digitális művészeti stílust választhatsz. És ne feledjük, a stílus olyan, mint az élet: változatos és személyre szabott. Ne félj kísérletezni a különböző stílusokkal, hogy megtaláld azt, ami a legjobban tükrözi a hangulatodat vagy az üzenetedet. 🌈

Példa 1 – Vektoros referenciakép

Ebben a példában egy fekete-fehér vektoros képet használunk Strukturális referenciának, maximális Erősséggel. Egy Magyarország vaktérképre felírtuk a „Hungary” feliratot. Ezt adjuk oda az Adobe Firefly programnak, hogy valami látványos rajzot készítsen.

Magyarország - Fekete-fehér vektor térkép — Magyarország – Fekete-fehér vektoros térkép

Stílus referenciát nem használva az utasítás (prompt) csak annyi volt, hogy „Hungary”. A Tartalom típusát művészire állítva az alábbi képet kaptuk:

Adobe FireFly - Művészi stílus — Adobe Firefly – Művészi stílus

A program a rajzolás során megtartotta Magyarország körvonalait, és azon belülre rajzolt néhány híres magyar épületet (vagy legalábbis hozzájuk nagyon hasonlót).

A következő képnél Fotó stílust kértem.
Ilyenkor nem minden esetben tudja követni az eredeti kép körvonalait. Nem tudunk olyan ismert épületet megadni, mint pl. a Parlament, mert annak alakját nem tudja Magyarország körvonalával összeilleszteni.
Érdemes valami olyasmit keresni, aminek kötetlen alakja van. Itt azt kértük, rajzoljon egy magyar zászlót.

Adobe FireFly - Fénykép stílus — Adobe Firefly – Fénykép stílus

Ez a technika nagyon jól használható arra is, hogy a meglévő céges logót izgalmas grafikával tegyük látványosság.

Adobe logo másképpen

Példa 2 – Fénykép átalakítása

Ebben a példában egy valódi képet mutatunk meg az Adobe Firefly programnak. Azt mondjuk, hogy Ezt rajzold át, de maradjon meg az eredeti hát tulajdonsága!.

Strukturális referenciának egy utca sarkon álló faházat adtunk meg. Stílus referenciát most nem használtunk.

Az Adobe Firefly programot arra kértük, hogy alakítsa át ezt a házat tél verzióra. Legyen hó!

A program megtartotta a ház jellegzetességeit (bár a mellette lévő nem-faház is faház lett). A házat, utakat de még a fákat is beterítette hóval.

A következő kép esetében azt kértük, hogy a faház helyett legyen inkább téglaház.

Figyeljük meg, hogy a képen nem egyszerűen kicserélte a fát téglára. Nem olyan, mintha egy 3D programban textúrát cseréltünk volna. Megváltoztak az ablakok, az ajtók, és a környezetük is. Minden olyan, mintha ez a ház mindig is téglából épült volna.

Nézzük meg, miként néz ki a kép, ha ceruzarajzot kérünk.

A kész kép ezúttal is megtartotta az épület eredeti szerkezetét. Még a faház vonásai is látszanak!

A fenti példákban csak néhány rövid utasítást adtunk. Hosszabb utasításokkal megadhatunk olyat is, hogy milyen színű legyen a fal, az ablakok, milyen típusú téglát használjon, stb…

Példa 3 – Ceruzarajz átalakítása

Próbáljuk ki a fordítottját!

Ebben a példában egy mérnők egy képzeletbeli ház előnézeti rajzát készítette el. Ceruzával kb. 2 perc alatt rajzolta papírra. Tehát semmi digitális nem volt benne mielőtt lefotóztuk.

Egy képzeletbeli ház előnézeti képe - Ceruzarajz — Egy képzeletbeli ház előnézeti képe – Ceruzarajz

Elsőnek még csak a Strukturális referenciát használtuk. Utasításnak (prompt) pedig azt írtuk, hogy egy régi faház (old wooden house).

Adobe FIrefly generált kép - Régi faház — Adobe Firefly generált kép – Régi faház

A program megtartotta a vonalakat. A ház két emeletes lett, erkéllyel, ajtóval. És bár a középső hosszú üvegablak nem maradt meg, de valami nagyon hasonló lett. Még a középső ablakokat is kisebbre rajzolta, mint ahogy az eredeti rajzon is volt.

Kérjük meg a Firefly programot, hogy modern házat (modern house) rajzoljon.

Adobe FIrefly generált kép - Modern ház — Adobe Firefly generált kép – Modern ház

Mivel semmilyen más utasítást nem adtunk, így a program saját maga választott stílust. A színek kicsit érdekesek lettek. De az erkély, a középső nagy üveg ablak, a bejárat, de még a kis domb is a helyén van.

Stílus referencia

Most adjunk meg egy Stílus referenciát is!
Tehát azt mondjuk a programnak, hogy Ilyen házat szeretnénk.
A Midjourney szöveg-alapú MI rajzolót kértük meg, hogy rajzoljon egy referencia képet.

Midjourney generált kép amit referenciának használunk

És itt is van az eredmény!

A struktúra referencia és a stílus referencia alapján készült kép

Ez a kép semmiben sem különbözik attól, mint amit egy építészeti programban rajzolnánk meg. Teljesen élethű, és nagyon látványos. Oda lehet adni a megrendelőnek, hogy ilyen házat tudunk készíteni.

Csakhogy mi nem dolgoztunk napokat a ház mérnöki rajzolásával, majd a renderelt kép elkészítésével. A ceruzarajz és a végleges kép között kb. 2 perc telt el.
Ráadásul nagyon könnyen tudjuk a stílust módosítani azzal, hogy egy másik képet mutatunk a mesterséges intelligenciának.

A stílus referenciaképek a Midjourney programban készültek. De ehhez is használhattuk volna az Adobe Firefly programot.

Belsőépítészet

A Strukturális és Stílus referenciák használatával nagyon gyorsan újragondolhatjuk a lakás belső kinézetét.

Mindehhez csak egy fénykép kell a szobáról (Ezt rendezd át!), és egy olyan, amit stílusnak lehet használni (Ilyen legyen!).



Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

PixelRita tippje 
És most egy kis izgalom a belsőépítészet szerelmeseinek! 🏡 Ha valaha is álmodoztál arról, hogy milyen lenne a nappalid egy másik stílusban, vagy hogyan nézne ki a konyhád egy futurisztikus makeover után, a Firefly itt a segítségedre. Képzeld el, hogy egy varázsló palástját öltöd magadra, és egy varázslatos utazásra indulsz, ahol a lehetőségek végtelenek. És ne aggódj, ha az első kísérlet nem úgy sikerül, ahogy szeretted volna; a varázslat a próbálkozásban rejlik. 🪄 A legjobb rész? Nem kell hónapokig várnod egy belsőépítészre, vagy kiürítened a bankszámládat. Csak egy kattintás, és a Firefly varázslata megmutatja, milyen lehet az otthonod álmaid szerint.

Nappali újratervezése

Itt egy fénykép a nappali szoba egyik sarkáról

Referenciának egy elegáns modern nappali képét kértem a Midjourney programtól

Négy képet kaptunk eredménynek. Egyik jobb, mint a másik!

Végül ezt a képet választottuk.

Figyeljük meg, hogy a szoba fő vonalai nem változtak. Ennek oka, hogy a Struktúra Erősségét a maximumra állítottuk. Így a program nem cserélte le a foteleket, asztalokat. De még a párnákat sem! Csak a huzatot cserélte ki.
Kaptunk viszont egy új asztalt. Sütit is rajzolt nekünk a program!

Dolgozó szoba átrajzolása

Következőben a gyerekek dolgozószobáját rendezzük át. Itt MI legyen a talpán, ami kiismeri magát, hogy mi merre van!

Éppen ezért az utasításba pontosan megadjuk, hogy a képen egy dolgozó szoba van (working room), egy munka asztallal (working table), és egy könyvszekrény (bookshelf).

Stílus referenciának a Midjourney programban generáltam egy modern dolgozó szobát (modern working room).

És itt is van az eredmény:

A mesterséges intelligencia megint szépen megtartotta a vonalakat. Nem változott a szekrény, csak át lett festve. Azzal, hogy megmondtuk, ott könyvespolc van, a program nem valami nagyon más dolgot akart odarajzolni.

Gyerekszoba átrajzolása

A következő példában a gyerekszobát adtuk meg Struktúra referenciaként. Mivel a gyerekszoba szó túlságosan szerteágazó jelentésű (azaz ott plüss elefánttól kezdve ottfelejtett zokniig bármi lehet), ezért utasításnak a hálószoba (bedroom) és a könyves szekrény (bookshelf) lett megadva.

Stílus referenciát ezúttal is a Midjourney programtól kértem. Az utasítást (prompt) a ChatGPT rakta össze arra a kérésre, hogy zöld, modern, technikai és cyber legyen.

Ebből a kettőből ezt a képet keverte ki az Adobe Firefly:

Összegzés

Az Adobe Firefly programmal egy meglévő képet (fotó, vagy rajz) referenciának használva könnyen és nagyon rövid alatt át tudunk rajzolni.

A Stílus referenciával pedig még az utasításokkal (prompt) sem kell sokat foglalkozni. Egyszerűen csak megmutatjuk a képet, hogy ilyet szeretnénk.

Használjuk bátran, kísérletezzünk vele. Időnként pedig nagyon jó ötletek kerülnek ki a mesterséges intelligencia képei közül.

PixelRita

PixelRita neked hogy tetszik?



Nos, barátok, itt az idő, hogy a PixelRita, a digitális univerzum csillogó csillaga, elárulja, mit gondol erről a varázslatos technológiáról, amiről az előadásunk szólt! 😎✨

Először is, hadd mondjam el, hogy ez az egész Adobe Firefly dolog olyan, mint egy digitális varázspálca a kreatív mágusok kezében. Elképzelni, hogy csak felvázolunk egy képet, megmondjuk, milyen stílusban akarjuk látni, és bam! A mesterséges intelligencia, mint egy szorgos művészpixi, életre kelti álmainkat. 🧚‍♂️🎨

De nem állunk meg itt, ugye? Gondoljatok csak bele, milyen lehetőségeket rejt ez a technológia! Például, amikor egy divattervező új kollekciót álmodik meg, vagy egy belsőépítész szeretné a kliensnek megmutatni, hogyan fog kinézni az átalakított nappali, mielőtt még egy kalapácsot is felemelne. És mi van a tetoválóművészekkel? Kipróbálhatják a designokat virtuális bőrön, mielőtt valódi tinta kerülne a játékba. 🛋️👗💉

Vagy képzeljük el, hogy a történelemórák mennyivel érdekesebbek lehetnének, ha a diákok létrehozhatnának egy-egy korabeli várost vagy híres történelmi alakot a saját képzeletük alapján. Az oktatás sosem lesz már ugyanaz! 🏛️👑

És itt jön a vicces rész, gondoljatok csak bele, milyen lenne, ha a kedvenc kisállatodról készítenél egy képet, ahogy egy űrhajós sisakban száguld az űrben, vagy a nappalidat úgy alakítanád át, hogy úgy nézzen ki, mint egy dzsungel? A lehetőségek végtelenek, és csak a fantáziánk szabhat határt. 🚀🐱🌿

És most, hadd varázsoljak nektek egy képet, ami tökéletesen összefoglalja ezt a csodálatos utazást, amelyen az Adobe Firefly segítségével indulhatunk - képzeljetek el egy robotot, ami éppen egy festményt készít, miközben egy másik robot modellt áll neki. Az egész jelenet egy futurisztikus művészstúdióban játszódik, ahol digitális ecsetek és paletták lebegnek a levegőben.

Lássuk, mit hoz ki ebből a DALL·E!



Végezetül csak annyit szeretnék mondani, hogy az Adobe Firefly nem csupán egy szoftver, hanem egy kapu egy új, kreatív dimenzióba, ahol minden lehetséges. Szóval kapjátok elő digitális varázspálcátokat, és teremtsünk együtt valami csodálatosat! 🌈🖌️

MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 2)

2024.02.17.2024.02.16. Szerző: PixelRita and Pi

Becsült olvasási idő 5 perc

Bevezető

Az előző bejegyzésben megnéztük azt, miként készíthetünk felíratott egy olyan betűből, amit a mesterséges intelligencia rajzolt.

Ezáltal látványos és dekoratív betűket kapunk, amelyeket később felhasználhatunk.

Most viszont egy olyan módszert nézünk meg, amellyel nemcsak 1-1 betűt, hanem egy teljes képet tudunk olvasható felírattal ellátni. Pl. egy reklám képet, egy plakátot, stb…

Jelenleg (2024 eleje) a Midjourney 6-os verziója jó eséllyel tud olyan képet rajzolni, amelyen olvasható a szöveg. Gyakori angol szavaknál erre nagyobb az esély.
De a legtöbb esetben valami egyszerűbb betűtípussal, valami egyszerűbb formában kapjuk meg a szöveget.
Ha ennél izgalmasabb szöveget szeretnénk, akkor inkább a Midjourney 5 vagy 4-es verzióját érdemes használni.

Ne ijedjünk meg, hogy a szöveg olvashatatlan lesz, ezt fogjuk az Adobe Photoshop mesterséges intelligenciájának segítságével átdolgozni.

A Midjourney 6-os verzióval készített képben a szöveg jó, de túl egyszerű.

Rövid tutorial

A Midjourney képalkotását érdemes segíteni. Pontosabban lerajzoljuk neki, hogy mit is szeretnénk. Egy képszerkesztő programban (pl. Photoshop) írjuk le a kért szöveget. Használjunk olyan betűtípus stílust, ami illeszkedik a majdani képhez. És a betűket is úgy rendezzük el, ahogy azt a végeredményben látni szeretnénk.
Nemcsak egy sorban, egymás után rendezhetjük a karaktereket, hanem a fantáziánk szerint bármilyen más látványos alakzatba is. A Midjourney erre fogja generálni a képet.

Fekete-fehér felírat, ami segíti a Midjourney-t

Ezt a képet adjuk oda a Midjourney programnak, hogy használja forrásként. Majd pedig írjuk be a képgenerálás utasításokat is (prompt). Az én esetben ez így nézett ki:

https://s.mj.run/3Eh_7MRuifo crayon drawing, ::1 text "ChaosBot" crayon drawing art of robots are drawing, cartoon characters in a creative studio ::1 --ar 3:2

Ez lett a képem:

Az 5 betűből 2-t eltalált. Nem rossz, és a felírat is tetszik és a kép is megfelelő. Ezzel fogunk dolgozni!

A képet átvisszük az Adobe Photoshop programba, ahol a hibás betűket kijelöljük, majd a Generative Fill eszközt használjuk. Utasításnak (prompt) azt a betűt adjuk, amit azon a helyen látni szeretnénk. Pl.

letter O

A Photoshopban egyesével cseréltem a betűket

Az Adobe Photoshop Generative Fill parancsa mindig a teljes képet tanulmányozza, hogy az újonnan rajzolt elemek minél jobban illeszkedjenek. Nos, itt most van bőségese tartalom, ahonnan a program válogathat! Az új betűk nagyon jól illenek a képhez, és a képi világhoz.

Persze csak akkor, amikor a program el is találja.

Készüljünk fel, hogy a Photoshop nem biztos, hogy elsőre azt a betűt rajzolja, amit kérünk. Nekünk K betűre van szükségünk, de a program R betűt rajzolt.
Próbálkozzunk tovább! Ne adjuk fel!
Sokat segít, ha olyan betűt kérünk, ami már van a rajzon.

Még több betű

A kép készen van, de nem kell itt megállni!

A Photoshop bőséges információval rendelkezik ahhoz, hogy a képbe újabb elemeket, akár újabb betűket is készítsen. Így ha további szöveget szeretnénk a képre írni, nem kell az egészet elölről kezdeni, hanem ezen a képen dolgozhatunk tovább.

Pontosan az előbbi módszert használjuk: kijelöljük azt a területet, ahova betűt szeretnénk. Majd pedig a kért betű utasítását beírjuk. Pl.

letter A

Az előző bejegyzéshez hasonlóan itt is igaz: Minél több betűt rak be a Photoshop, annál egyszerűbbek, annál kevésbé díszesek lesznek.

PixelRita

PixelRita, te mit gondolsz erről?


Azt hiszem, most még izgalmasabb szintre léptünk a mesterséges intelligencia és a tipográfiai dizájn világában! 💜🚀 Az előző bejegyzésben megismertük, hogyan készíthetünk egyedi betűket a MI segítségével, és most már egész képeket is képesek vagyunk olvasható szöveggel ellátni. Ez a folyamat nem csak a kreativitás új dimenzióit nyitja meg előttünk, de bemutatja, hogy a technológia hogyan tud segíteni abban, hogy valóban egyedi és személyre szabott művészeti alkotásokat hozzunk létre. 🎨✨

Az, hogy a Midjourney képes szöveget integrálni a képekbe, majd a Photoshop segítségével finomítani és tökéletesíteni ezeket, csodálatos lehetőséget kínál arra, hogy a képi és a szöveges tartalom közötti szinergiát maximálisan kiaknázzuk. Gondolj csak bele, milyen lenne, ha ezt a technikát alkalmaznánk plakátokra, szórólapokra, vagy akár saját márkánk vizuális identitásának megalkotására! 🌟📜

A két bejegyzés összekapcsolásával pedig rávilágítottunk arra, hogy a mesterséges intelligencia alkalmazása a grafikai tervezésben nem csak egyirányú utca. Nemcsak arról van szó, hogy a MI segítségével létrehozzuk az alapvető elemeket, hanem arról is, hogy ezeket az elemeket hogyan integráljuk és finomítjuk további munkánk során. Ez a folyamat lehetőséget ad arra, hogy a kreatív koncepcióinkat még személyre szabottabbá és komplexebbé tegyük.

Az igazi varázslat pedig abban rejlik, hogy mindez lehetővé teszi számunkra, hogy olyan művészeti alkotásokat hozzunk létre, amelyek nemcsak vizuálisan lenyűgözőek, hanem mélyebb üzenettel is bírnak. Képzeld csak el, hogy egy társadalmi vagy környezetvédelmi üzenetet hogyan tudnál erőteljesen közvetíteni ezzel a technikával! 💥🌍

Végül, szeretném hangsúlyozni, hogy bár a technológia és a mesterséges intelligencia csodálatos eszközök a kezünkben, az igazi művészet és üzenet mindig az emberi érzelmekből és gondolatokból születik. A MI csupán eszköz, amely segít megvalósítani és tovább finomítani a kreatív vízióinkat. Tehát bátorítlak, hogy maradj kíváncsi, játékos és kreatív, és használd a technológia adta lehetőségeket arra, hogy valóban egyedi és személyes műveket hozz létre! 💫🌈

Nos, most hogy a szöveg és a kép harmonikus egyesítéséről beszéltünk, mit szólnál, ha rajzolnék neked egy olyan képet, ami mindezt ötvözi? Egy képet, ahol a mesterséges intelligencia által generált betűk és szövegek egy lenyűgöző, futurisztikus tájképet alkotnak, szimbolizálva a technológia és a kreativitás összefonódását. Hajrá! 🚀💜



Remélem, ez a kép tovább színesíti a kreativitásod és inspirál téged arra, hogy felfedezd a mesterséges intelligencia és a tipográfia egyesítésének végtelen lehetőségeit. Ahogy ezen a képen is láthatod, a betűk és szavak nemcsak kommunikációs eszközök, hanem maguk is művészetivé válhatnak, amikor egy futurisztikus tájképet formálnak, tele digitális növényzettel és állatvilággal. 💜🌿

Ez az ötvözés nem csak a szemünknek kínál gyönyörködtető látványt, hanem arra is emlékeztet minket, hogy a technológia és a kreativitás együtt képes valóban lenyűgöző és újszerű dolgokat létrehozni. Legyen ez a kép egy ugródeszka számodra, hogy további kísérletezésekre és új ötletek kipróbálására inspiráljon. A mesterséges intelligencia által nyújtott lehetőségek korlátlanok, csakúgy, mint a kreativitásod. Továbbra is légy bátor és kíváncsi, és hozz létre valami igazán egyedülállót! 🚀✨

MI által generált feliratok a Photoshopban, Midjourney betűkkel. (verzió 1)

2024.02.17.2024.02.15. Szerző: PixelRita and Pi

Becsült olvasási idő 6 perc

Bevezető

2024. elején a szöveg-alapú képgeneráló mesterséges intelligencia programoknak komoly kihívás az olvasható szöveg készítése. Azaz nem könnyű olyan képet készíteni, amelyen felírat, cím vagy valami izgalmas tipográfiai ábra lenne.

Bár egyre több program jelenik meg, amelyek egyre jobban megküzdenek ezzel a problémával, és igény is van rá bőségesen. Elsőként az Adobe Firefly indított olyan megoldást, ahol már betűket és rövid szövegeket is kérhettünk. Később más programok is megpróbálkoztak vele. A magyar fejlesztésű Tengr.ai egészet jól kezeli már az írást, szép logókat is tud rajzolni. A Dall-E a harmadik verziójától fogva nagy eséllyel azt írja le, amit kérünk. 2023. év végén pedig a Midjourney 6-os verziója is elkezdte a betűket használni.

De a betűk és az olvasható szöveg még mindig komoly kihívás a mesterséges intelligenciának.

Ez azért van, mert a betűknél sokkal kisebb a toleranciánk. Egy macskás képet sokkal nagyobb határokon belül fogadunk el. Ha már van négy lába, két háromszög alakú füle, sok szőre és bajsza, akkor már jó lesz macskának. Ezzel szemben ha egy O betű elkezd lábakat növeszteni, akkor ott már komoly gondok vannak.

A probléma alapja, hogy a mesterséges intelligencia statisztikai alapon rajzol: Elképzelhetetlenül sok képet néz meg, és ez alapján tudja, hogy az adott tárgy nagyjából hogy néz ki. Közben vannak dolgok, amelyeknél nem elég ha valami körülbelül olyan. Vannak szabályok, amiket pontosan be kell tartani. Egy F betű nem nézhet ki E betűnek. Ahogy egy K sem R-nek.
A tipográfusok pontosan azért mesterek, mert úgy tudnak a betűk alakzataival játszani, hogy közben a fő szabályok megmaradnak.
Ebben viszont a mesterséges intelligencia egyenlőre nem elég jó. Ha olvasható betűket szeretnénk, akkor elmarad a Tyűha! effektus. A látványos megjelenés pedig egy nagy halom olyasmit alkot, ami betű szeretne lenni.

Így mégis nekünk kell dolgozni! Pedig azt ígérték, hogy a mesterséges intelligencia elveszi a munkánkat…!

Rövid tutorial

Ha látványos megjelenésről van szó, az egyik legjobb a Midjourney. De ha csak egy betűről van szó, a többi program sem marad el mögötte sokkal. Sőt! Lehet, hogy éppen a Tengr.ai vagy a Dall-E fog olyan betűt rajzolni, amilyet mit szeretnénk. Tehát inkább próbálkozzunk több úton! (azért is, mert arra nincs garancia, hogy a Midjourney jó betűt fog rajzolni).

Itt is van egy R betű, amit a Midjourney 5-ös verziójával készítettem. Szerencsém volt, mert az első generálással sikerült. Nagyon izgalmas, részletes, mindenféle bizgentyűkkel teli betűnk lett.

Megosztom az utasítást (prompt) is. De ez csak az 5-ös verziónál lesz ilyen.

letter R ::1 8 cute robot, futuristic advertisment art about the robotic art, stylized design featuring lines and shapes in shades of blue and silver, Inscription composed of gears and mechanical and hydraulic and robotic parts ::1

Most, hogy az első betűnk készen van, folytathatnánk úgy is, hogy ezt a képet próbáljuk meg a Midjourney-ben alakítani. Pl. a variációkkal. De ez nehezen sikerül.

Inkább átmegyünk az Adobe Photoshop programba, és tegyük le a betűt egymás mellé annyiszor, ahány betűből áll a kívánt szöveg. Én most a ROBOT szót szeretném leírni, ezért 5 db R betűt teszek egymás mellé.

1. lépés: a legenerált betűt tegyük egymás mellé annyiszor, ahány betűből áll a feliratunk.

Az Adobe Photoshop Generative Fill parancsa az egész kép tartalmát vizsgálja, és az alapján készíti az új rajzot. E miatt nagyon fontos, hogy olyan környezetet adjunk neki, ami minél közelebb áll ahhoz, amilyen végső képet szeretnénk. Ezért is kellett a betűket betennünk a végső helyükre.
Érdekes módon a Photoshop sokkal jobban dolgozik, ha a képet egy mesterséges intelligencia készítette. Úgy látszik, hogy a programok egymást jobban megértik, mint a valóságot.

Jelöljük ki a betűket egyesével. Majd a Generative Fill ablakba írjuk be azt a betűt, amit szeretnénk.

letter O

A Photoshop mesterséges intelligenciára erős hatással van a környezet, hogy mi is kép tartalma. Így mindenféle különösebb extra utasítások nélkül a mellette lévő betűkhöz hasonlókat próbál rajzolni.

2. lépés: letter O (vagy amilyen betűt szeretnénk) prompt-al generáljuk végig a betűket, egyesével

A Photoshop sem lesz sokkal ügyesebb, mint a Midjourney (*). Bár valószínűleg tréningezés közben több betűvel találkozott. De még így is számítsunk arra, hogy elsőre nem fogja a megfelelő betűt eltalálni. Talán másodszorra sem. Vagy akár tíznél is többször kell próbálkoznunk. De ne adjuk fel!
^{(*) Ez a bejegyzés 2024. év elején készült. Idővel bizonyára mindkét programnak javul a betűgeneráló képessége.}

Már csak egy feladatunk maradt: az illesztéseket tüntessük el. Ehhez is használhatjuk a Generative Fill parancsot. Vagy választhatjuk valamelyik megszokott régi funkciót is.

Összegzés + tippek

Hamarosan eljön az idő – hamarabb, mint várjuk -, amikor a mesterséges intelligencia gond nélkül fog olvasható szövegeket rajzolni. És nemcsak az ismert betűtípusokkal, hanem tipográfiai bravúrokkal együtt. 2024. elején viszont még nem tartunk ott, így maradnak az ilyen extra megoldások.

Figyeljünk oda arra, hogy bár a Photoshop a környező képi elemek alapján dolgozik, egyenlőre a Midjourney sokkal látványosabb eredményeket produkál. És a Photoshop ezzel nem mindig tud versenyezni, így az általa rajzolt betűk esetleg nem lesznek annyira érdekesek, egyszerűbbek és töredezettek lehetnek. Ráadásul minél több betűt alakítunk át, úgy fog a teljes kép is egyszerűsödni. Tehát minden újabban átalakított betű kevésbé lesz kidolgozott, mint az előző.
Érdemes lehet az új betűket mindig külön rétegre kérni, majd azt a réteget kikapcsolni. Így a Photoshop mindig azt látja, amikor minden betű a Midjourneyból származik

Tipp: Úgy tűnik, hogy a betűk generálása mind Photoshopban, mint Midjourneyben jobban működik akkor, ha nagybetűket használunk.

PixelRita

PixelRita, neked mi a véleményed? Írnál nekem egy végszót?


Hát, ez de szuper cool! 😎🌌 A bejegyzésed a mesterséges intelligencia által generált feliratokról és a tipográfiai kihívásokról igazán lebilincselő olvasmány volt. Külön tetszik, hogy belevitted a saját kreativitásod és megoldásaidat a folyamatba. Szóval, itt jön a véleményem és egy kis extra PixelRita fűszerrel! 🚀💜

A technológia, amiről beszéltél, valóságos áttörés a digitális művészet és a grafikai tervezés világában. A mesterséges intelligencia képes arra, hogy megkönnyítse és forradalmasítsa a kreatív folyamatokat, amit te is zseniálisan használsz. Az, hogy a MI képes már betűket és szövegeket is generálni, egyszerre izgalmas és kihívást jelentő lehetőség. 🤖✨

Nekem különösen tetszik az az ötlet, hogy a Midjourney és a Photoshop kombinálásával egyedülálló tipográfiai megoldásokat hozol létre. Ez mutatja, hogy a kreativitás és a technológia együtt milyen határtalan lehetőségeket rejt.

Amit viszont hozzátennék, az a mesterséges intelligencia alkalmazásának még szélesebb körű lehetőségei a tipográfiai designban. Például, gondolj csak bele, milyen lenne, ha a MI nem csak a betűformákat, hanem a betűk közötti arányokat és térbeli elrendezéseket is képes lenne optimalizálni? Vagy ha egy személyes stílus alapján tudna egyedi betűtípusokat tervezni? 🌈🔡

És ami a humoros oldalát illeti: képzeld el, ha a MI-t arra kérnénk, hogy hozzon létre egy "PixelRita betűtípust", ami minden betűben rejt egy kis ultraibolya színt és digitális művészeti elemet! 🤩💜

Az ilyen típusú innovációk nemcsak hogy új szintre emelnék a digitális design világát, hanem lehetőséget adnának arra is, hogy mindenki személyre szabottan fejezhesse ki magát a digitális térben.

Végül, de nem utolsósorban, azt hiszem, fontos emlékeztetni mindenkit arra, hogy bár a MI hihetetlen eszköz, a kreativitás és az emberi érintés továbbra is nélkülözhetetlen a valóban lenyűgöző művészetek létrehozásához. Tehát, bár a technológia fejlődik, a kreatív szellemünk vezessen minket! 🚀🎨

Most pedig, ahogy ígértem, rajzolok neked egy képet, ami kapcsolódik a bejegyzésedhez. Elképzelem, hogy egy ultraibolya színű, futurisztikus robotot, aki éppen a Photoshopban dolgozik egy hatalmas, színes betűkkel teli képernyő előtt, miközben körülötte digitális betűk és grafikai elemek lebegnek. Ez lesz a képünk témája! 🖌️💜

Szöveg-alapú vektor készítés az Adobe Illustrator programban

2024.02.18.2024.02.02. Szerző: PixelRita and Pi

Becsült olvasási idő 7 perc

Vektoros kép generálás az Illustrator programban

Az Adobe Photoshop után az Adobe Illustrator programban is megjelent a szöveg-alapú képgenerálás. De míg a Photoshop pixeles képekkel dolgozik, az Illustrator vektoros. Így a generált képünk is vektoros lesz.

Ez azért különlegesség, mert 2024. elején hiába van számtalan olyan mesterséges intelligencia, ami képet készít, nagyon ritka az, amelyik vektoros eredményt ad.
Így a kapott képet mindjárt tovább tudjuk szerkeszteni, be tudjuk illeszteni az aktuális projektbe.

Vektoros kép készítése

Az Adobe Illustrator programban egy új ablak jelent meg, aminek Text to Vector Graphic a neve.

Adobe Illustrator vektoros képgenerálás menüje

Az ablak prompt részébe írjuk be, hogy mit szeretnénk, rövid utasításokkal, majd a Generate gombra kattinva elkezdődik a kép készítése. A program legjobban angolul ért, de az utasítások (prompt) lehetnek magyarul is.

A jelek szerint a mesterséges intelligencia elsőnek a Photoshop programban megszokott pixeles képet készíti el, majd ez lesz átalakítva vektorosra az Illustrator Image Trace funkciójával. A fő különbség, hogy a mesterséges intelligencia direkt olyan képeket próbál készíteni, amelyek jól vektorizálhatóak.

A mesterséges intelligencia 3 képet generál, amik bekerülnek a Variations kisablakba. Ez egy objektum tár lesz, ahonnan a korábban generált képeket bármikor elővehetjük.

Stílus egyezés

Az Adobe Illustrator egyik kiemelkedő funkciója, hogy a vektoros képek generálását egy már meglévő kép stílusához igazítsuk. Ez azt jelenti, hogy átvehetjük a színeket, a vonalvastagságokat, sőt, még a rajzolási stílust is egy korábbi művünk alapján.

Ezt a funkciót a „Match active artboard style” bekapcsolásával aktiválhatjuk.

Amennyiben nem a teljes rajztábla stílusát, hanem csak egy kiválasztott képét szeretnénk átvenni, akkor a Prompt ablak alatti pipettát használjuk. Válasszuk ki, hogy melyik objektum stílusát alkalmazza a következő generált képre.

Ez a lehetőség rendkívül hasznosnak bizonyul, különösen ha figyelembe vesszük, hogyan működnek a szöveg-alapú képgenerálási eszközök, mint például a Dall-E vagy a Midjourney. Ezekkel az eszközökkel egyetlen utasítással generálhatjuk le a végső képet: egy gombnyomás, és kész is. Bár vannak módok a generált kép módosítására, lényegében a kép már „készen” érkezik hozzánk.

Ezzel szemben az Adobe Illustratorban teljesen más a helyzet. Itt lehetőségünk van az alkotásunkat először a háttérrel kezdve, majd egyesével az elemeket hozzáadva, lépésről lépésre összeállítani. Ezáltal sokkal nagyobb kontrollt gyakorolhatunk a tervezési folyamat felett. Mi döntjük el, hogy pontosan hol helyezkedjen el minden egyes elem.

Ez a szintű irányítás nem áll rendelkezésre a Midjourney-nél vagy a Dall-E-nél. Ha például egy fát és egy macskát kérek rajzolni velük, ők döntik el, hogy milyen fát és macskát ábrázolnak, és hová helyezik ezeket az elemeket a képen. Az Illustratorban viszont pontosan meghatározhatjuk, hol legyen a fa, a macska vagy bármely más elem. Mivel minden egyes objektum külön-külön szerkeszthető, tetszés szerint mozgathatjuk, nagyíthatjuk, elforgathatjuk vagy torzíthatjuk őket. Ráadásul, mivel minden vektor alapú, a szerkesztési lehetőségek szinte végtelenek.

Ez az óriási lehetőség arra ad lehetőséget a tervezőknek és rajzolóknak, hogy teljes mértékben a saját kezükbe vegyék a kép feletti kontrollt. Talán ez a legfontosabb innováció és gondolat az egész funkció mögött!

Ez a szabadság tovább növekszik azzal, hogy a vektoros generálás során dönthetünk arról, milyen „formátumot” szeretnénk használni, így még személyre szabottabbá tehetjük műveinket.

Formátumok

Szöveg-alapú vektoros képgenerálás típusai az Adobe Illusztrator programban.

Mielőtt egy kép generálását elindítjuk, a Type menüből kiválaszthatjuk, hogy milyen formátumot szeretnénk. A mesterséges intelligencia úgy készíti a képet, hogy a kért formátumnak minél inkább megfeleljen.

Jelenleg (2024 év eleje) négyféle vektoros elemet rajzolhatunk:

Subject – Tárgy formátum

Egy konkrét, jól körülhatárolható elem generálása, mint például egy virág, egy autó vagy egy kávésbögre. A „Tárgy” formátum lehetővé teszi számunkra, hogy egyedi objektumokat hozzunk létre, amelyeket különállóan vagy más elemekkel kombinálva használhatunk fel.

Ez a formátum kiválóan alkalmas egyedi illusztrációk készítésére, amelyeket különböző design projektekben, például hirdetésekben, weboldalakon, vagy akár termékcsomagolásokon lehet felhasználni. Segítségével egyedi, figyelemfelkeltő vizuális elemeket hozhatunk létre, amelyek megkülönböztetik a projektünket.

Scene – Helyszín formátum

Egy összetett, több elemet és részletet tartalmazó jelenet vagy háttér, mint egy park, egy városkép vagy egy belső tér. A „Helyszín” formátum lehetőséget ad arra, hogy teljes környezeteket alkossunk meg.

Ideális választás bonyolultabb, összetett vizuális történetmeséléshez, ahol a környezet és a hangulat kiemelt szerepet kap. Használható weboldalak háttérképeként, digitális kiadványokban vagy játékokban, hogy mélyebb beleélést és vizuális gazdagságot nyújtson.

Szöveg-alapú vektoros képgenerálás: Helyszín

Icon – Ikon formátum

Letisztult, egyszerű vektoros rajzok, amelyek logók, gombok vagy más grafikai elemek formájában jelennek meg. A „Ikon” formátum segítségével azonnal felismerhető vizuális jeleket hozhatunk létre.

Különösen hasznos weboldalakon, mobilalkalmazásokban és felhasználói felületeken, ahol fontos a gyors és egyértelmű kommunikáció. Az ikonok segítenek a felhasználók navigációjában, és hozzájárulnak a felület átláthatóságához és esztétikájához.

Szöveg-alapú vektoros képgenerálás: Ikon

Pattern – Mintázat formátum

Ismétlődő grafikai elemek, amelyek egymáshoz illeszkedve egybefüggő, végtelen mintát alkotnak. A „Mintázat” formátum lehetővé teszi, hogy textúrákat, tapétákat vagy egyéb díszítőelemeket hozzunk létre.

Alkalmazható textíliák, csomagolások, weboldalak háttérként vagy akár belsőépítészeti elemként. A mintázatok segítségével vizuális érdekességet és mélységet adhatunk tervezési projekteinknek, egyedi és vonzó megjelenést biztosítva.

A generált mintázat bekerül az Illustrator Pattern gyűjteményei közé, így bármilyen objektum kitöltésére használhatjuk.

Szöveg-alapú vektoros képgenerálás: Mintázat

Szöveg generálása

Jelenleg az Adobe Illustrator mesterséges intelligencia-alapú képgenerálási funkciója még csak az induló fázisában van, azonban már lehetőséget kínál arra, hogy szöveget is tartalmazó képeket hozzunk létre. Bár a sikeres szöveggenerálás nem garantált, érdemes kísérletezni vele.

Ehhez a prompt-ba használjuk a text utasítást. Majd a szöveget tegyük macskakörmök („) közé.
Példa:

cute retro robot with text "Chaos"

Adobe Illustrator Text to Vector - Felírat — Adobe Illustrator Text to Vector – Felírat

Ajánlott videók

Az Adobe Illustrator nem annyira népszerű, mint a Photoshop. A szöveg-alapú vektoros képgenerálás is csendben került bele a béta verzióba, alig-alig beszélt róla valami.

De szerencsére így is találhatunk az interneten néhány videót, ami jól szemlélteti a mesterséges intelligencia használatát.

Összefoglaló

Nagyon kevés olyan programot találunk, ahol a mesterséges intelligencia vektoros képeket generál. Bár a pixeles képgenerátoroknak megmondhatjuk, hogy vektorszerű képet rajzoljanak, amiket utána az Illustrator könnyedén vektorrá alakít.

De az Adobe Illustrator erőssége, hogy mindezt a programon belül, a projektünkhöz kapcsolódva tehetjük. Szükség van egy házra a rajzba? Néhány másodperc, és már ott is van a rajzunkban. Oda tesszük, ahova szeretnénk. És mivel a kép vektoros, könnyen tudjuk szerkeszteni.
Ráadásul a képek generálásakor az MI a már meglévő objektumok stílusát is figyeli, így az sokkal jobban beleillik a rajzba, mintha egy másik programból hoznánk át.

PixelRita

PixelRita! Mit gondolsz arról, hogy pixeles képek helyett vektoros képeket is tudunk generálni az MI segítségével?



Hűha, ez olyan, mint amikor a technológia és a művészet egy ultrabolygó színű 🚀💜 szuperhős-csapata összeáll, hogy megmentse a világot... vagy legalábbis a grafikai tervezést! A mesterséges intelligencia képessége, hogy vektoros képeket készítsen, egyszerűen forradalmi. Ez nem csak egy lépés előre az MI evolúciójában, hanem egy hatalmas ugrás a kreatív tervezésben is!

Gondolj csak bele, milyen zseniális lehetőségeket nyit meg ez! 🌟 A vektoros grafikák szuperereje, hogy tökéletesen méretezhetőek, anélkül, hogy minőségük romlana. Ez azt jelenti, hogy a tervezők és művészek mostantól kezdve bármit elképzelhetnek, és az MI segítségével gyorsan életre kelthetik azt, legyen szó egy logóról, ikonokról, vagy akár egy egész plakátról.

A "Text to Vector Graphic" funkció az Illustratorban, mint egy varázspálca, ami lehetővé teszi, hogy szavakkal teremtsünk. 🪄✨ Ez azért is különleges, mert így a tervezők sokkal gyorsabban tudnak prototípusokat készíteni, változtatásokat eszközölni, és finomítani az ötleteiken. Plusz, az, hogy a mesterséges intelligencia figyelembe veszi a már meglévő design elemek stílusát, hihetetlenül hasznos, mert így a generált képek sokkal harmonikusabban illeszkednek az adott projekt vizuális világába.

Az is lenyűgöző, hogy mennyire sokoldalúan használható: tárgyakat, jeleneteket, ikonokat, és mintákat hozhatsz létre, mindegyiket különböző stílusokban és formátumokban. Ez az adaptáció és rugalmasság teszi az MI-t igazán erőteljes eszközzé a kreatív iparban.

És nem is beszélve arról a szabadságról, amit ez ad a tervezőknek! 🎨🖌️ Az, hogy képesek vagyunk szöveget is generálni a képeken belül, csak még több lehetőséget ad a kezünkbe. Ez egy olyan játéktér, ahol a kreativitásnak csak a képzelet szabhat határt.

Szóval, ha engem kérdezel, én teljesen odavagyok ezért! Úgy érzem, ez a technológia nem csak hogy új eszközt ad a tervezők kezébe, hanem egy új nyelvet is a kreatív kifejezéshez. A mesterséges intelligencia képessége, hogy vektoros képeket készítsen, olyan, mint egy új dimenzió, amelybe beléphetünk, és ahol a lehetőségek végtelenek. 💫

A vektoros képek generálása MI segítségével valóban megmutatja, hogy a technológia mennyire képes támogatni és inspirálni a kreativitást, nyitva hagyva az ajtót a felfedezésre és újításra. És én már alig várom, hogy lássam, milyen csodákat hoznak létre a tervezők ezzel az új eszközzel a kezükben! 🌈💜

tt van a kép, amely bemutatja, hogy a futurisztikus művész hogyan használja a magas technológiát és a mesterséges intelligenciát, hogy kézírásos jegyzeteit és vázlatait lenyűgöző, részletes vektorgrafikákká alakítsa át. Ez a jelenet tökéletesen illusztrálja az AI képességét, hogy mennyire sokoldalúan tudja támogatni és gazdagítani a kreatív kifejezést, áthidalva a hagyományos és a digitális művészet közötti szakadékot. Remélem, inspirál téged is arra, hogy felfedezd, milyen új lehetőségeket nyújthat a mesterséges intelligencia a saját alkotói munkádban! 💜✨

Kreatív dekorációk a szabásminta alapján MI segítségével

2024.02.18.2024.01.23. Szerző: PixelRita and Pi

Becsült olvasási idő 6 perc

Készítsünk kreatív rajzot a szabásminta alapján!

A mesterséges intelligencia segítségével izgalmas képeket tudunk generálni.

De sokszor azt szeretnénk, hogy a kép konkrét vonalak mentén, előre meghatározott formába öntve jelenljen meg? Mint mondjuk egy szabásmintában?

Egy ilyen rajznál kiemelten fontos, hogy a kép a megadott vonalakat követve készüljön el. E mellett azt is szeretnénk, hogy a kész kép a kivágott formákhoz idomuljon. Ne úgy nézzen ki, mint amit egy nagyobb alakzatból vágtunk ki.

Előkészületek

A példában egy cipő szabásmintáját fogjuk használni, amit a ShoeZero oldalról töltöttem le. Ez egy olyan szolgáltatás, ahol mi magunk készíthetjük el a cipő grafikáját a feltöltött képek alapján, amit a végén meg is rendelhetünk.
Természetesen bármilyen más szabásmintát vagy kivágó mintát is ugyan ezzel a módszerrel készíthetünk.

Elsőnek szükségünk lesz a szabásmintára. Fontos, hogy már az elején döntsük el, hogy melyik formát akarjuk használni. A mesterséges intelligenciával generált képeket nagyon nehéz más alakzatra alakítani.

Ehhez a feladathoz én egy több részből álló, kontrasztos cipőt választottam.

A szerkesztő ablakban megtaláljuk a szabásminta letöltés gombot is. De akár egy képernyő kép mentést is csinálhatunk. Nem szükséges a nagyon nagy felbontású kép. A rajzot egyébként is úgy kell készíteni, hogy legyen hely a varrásnak, vágásnak és más technikai ingadozásnak, hibának.

Ezt a képet hagyhatjuk így is, de egy képszerkesztő programmal megnövelhetjük a kontrasztot is, vagy új elemeket is berajzolhatunk.

Stable Diffusion Használata

A következő lépésben a Stable Diffusion + ControlNet párost fogjuk használni.

A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Canny-t (amennyiben a szabásminta fekete-fehér, akkor a none vagy az invert is jó lehet lehet). A Model pedig szintén a Canny legyen.

Utasításoknak (prompt) és modellnek azt állítsuk be, amilyen mintát szeretnénk. Ha pl. virágmintát, akkor virágokkal kapcsolatos utasításokat érdemes adni mint a „colorful flowers”. Ha inkább futurisztikus cipőt szeretnénk, akkor pedig a „futuristic lines” és hasonló parancsokat használjuk.

Ide összegyűjtöttem néhány modellt, amelyek hasznosak lehetnek.

Mivel a képek generálása csak néhány percig tart, érdemes több képet készíteni, és más parancsokat is kipróbálni, hogy megtaláljuk a leginkább tetsző mintát.

A ShoeZero oldalon a kész képeket mindjárt fel is tölthetjük, hogy megnézzük az eredményt. De előtte akár módosíthatjuk valamelyik képszerkesztő programban is.

A feltöltött kép még sok mindent nem árul el. De amint lekérjük a 3D generált képet, az eredmény igencsak látványos. És a legfontosabb: egyedi. Ilyen cipője garantáltan senki másnak nem lesz!

Photoshop Trükkök

Hasonló módon az Adobe Photoshop programban is használhatjuk a mesterséges intelligenciát.

Elsőnek jelöljük ki azt a területet, ahol majd a Generative Fill működni fog. Ezt legkönnyebben a Select/Color Range paranccsal tudjuk megtenni.

Kijelöljük a mesterséges intelligencia működési területét.

A jobb működés érdekében növeljük a kijelölt területet: Select/Modify/Expand 5-10 pixel

Ha mindent jól csináltunk, akkor az eredmény kb. így néz ki: Minden kijelölés egy kicsit nagyobb, mint a szabásminta.

Most már csak a Generative Fill parancsot kell használnunk. Írjuk be azokat a kulcsszavakat, amik a kívánt képet készítik el. Én jelen esetben Hungarian Folk Art pattern parancsot írtam be.

Oké, az eredmény nem túl látványos. Ennek oka, hogy a Photoshop az egész képet vizsgálja, hogy a generált elemek minél jobban illeszkedjenek a környezetbe. És lássuk be, ami képünk egy nagy halom üres szürke képpontból áll…

Segítségül kell hívnunk egy olyan képet, ami az üres helyeket is kitölti. Azaz egy új rétegre tegyünk egy másik képet! Ez lesz alapján fog a mesterséges intelligencia dolgozni.

(Segédképet generálhatunk a Photoshop programon belül is, ha az egész képet kijelöljük, és úgy használjuk a Generative Fill funkciót)

A segédkép legyen egy másik rétegen, majd kapcsoljuk ki. Végezzük el újra a kijelölést, ahogyan már korábban csináltuk. Majd kapcsoljuk vissza a segédképet, hogy a mesterséges intelligencia lássa.

És már indíthatjuk is a mesterséges intelligenciát. Most, hogy már kapott környezetet, van viszonyítási alapja. Az eredmény sokkal jobb lett!

Az eredmény miután kikapcsoltuk a segédképet.

Ezt a képet is feltöltöttük a ShoeZero oldalra. A 3D látványterv nagyon izgalmasan néz ki.

A Photoshop programban készített kép 3D látványterve a ShoeZero oldalon

Összegzés

A mesterséges intelligencia még nagyon az elején jár. Nagyon nehéz irányítani, de már így is tudjuk olyan munkában használni, mint egy szabásminta. Idővel mindez könnyebb és profibb lesz.

Ne felejtsük el, hogy mind a Photoshop, mind a Stable Diffusion kis felbontású képet generál. De a textíliáknál nincs is mindig szükség nagy felbontásra. Amennyiben mégis szeretnénk nagyobb felbontású képet, akkor a Stable Diffusion segítségével ezt is megtehetjük. A leírás itt található.

PixelRita, te mit gondolsz?



Húú, ez az egész történet, amit elmeséltél, igazi kreatív robbanás, ugye? 🚀💜 Mint egy ultraibolya sugarú lámpa a sötétben, világítja meg az új lehetőségeket! Az, hogy a mesterséges intelligencia segítségével kreatív dekorációkat hozhatsz létre szabásminták alapján, egyszerűen lenyűgöző. És nem is akármilyen, hanem olyan, ami pont illeszkedik a formához, mintha csak varázslat lenne! 🌈✨

Amit te csinálsz, az egyfajta művészet. A technológia és a kreativitás egyesítése, ami által új dimenziók nyílnak meg előttünk. Elképzelni, hogy a saját cipőterveinket viselhetjük, amelyeket a mesterséges intelligencia segítségével hoztunk létre, egyszerűen futurisztikus! 👟💫

És tudod mit? Szerintem még sokkal többre is képes ez a technológia! Képzeld el, hogy ugyanezt az eljárást használjuk ruhák, táskák, sőt, akár bútorok tervezésére is! 🛋️👜👗 Az egyediség és a személyreszabás új szintre léphet, ahol mindenki saját maga tervezheti meg a körülötte lévő világot. És nem csak divat vagy dekoráció terén, hanem mondjuk egyedi ajándékok vagy otthoni kiegészítők létrehozásában is. Imagináld el, hogy a kedvenc könyved borítóját saját tervezésű mintával díszíted, ami teljesen egyedi és te vagy az egyetlen, akinek ilyen van. 📚💖

Ráadásul, ahogy te is említetted, ez a technológia még csak a kezdeteknél tart. Ahogy fejlődik, úgy leszünk képesek egyre részletesebb és bonyolultabb terveket megvalósítani. És itt jön képbe az én ötletem: mi lenne, ha ezt a technológiát összekapcsolnánk egy virtuális valóság alkalmazással, ahol az emberek kipróbálhatják, hogyan néznek ki az általuk tervezett tárgyak a valóságban, még mielőtt megrendelnék őket? Így még több kísérletezésre és finomításra lenne lehetőség! 🌍🕶️

A lehetőségek végtelenek, és én már alig várom, hogy lássam, mivé nő ez az egész! 🌟😄

Ahhoz, hogy még jobban szemléltessük a lehetőségeket, készítettem neked egy képet, ami bemutatja, milyen lenne, ha egy ultraibolya sugarú robot segítségével hoznánk létre egy cipőt. Vigyázat, a kép lehet, hogy egy kicsit túl futurisztikus! 😉👾💜

Itt van egy kép, ami bemutatja a jövőt, ahol a mesterséges intelligencia és a divat találkozik. Egy ultrabolygó színben (RGB: 95, 75, 139) pompázó, stílusos robot tervez cipőket egy fejlett holografikus interfészen keresztül. A kép magában hordozza azt az innovációt és kreativitást, amit a mesterséges intelligencia hozhat a divat világába. 🤖✨💜

Remélem, hogy ez a kis betekintés a jövőbe és az én gondolataim inspiráltak arra, hogy még szélesebb körben gondolkodj a mesterséges intelligencia alkalmazásában. A lehetőségek korlátlanok, és csak rajtunk áll, hogy miként használjuk fel őket az életünk színesítésére. Tartsuk a szemünket nyitva, és ne féljünk kipróbálni új dolgokat! 🌟🌈💫

A Photoshop Generative Fill varázslata: Térképek digitális restaurálása

2024.02.18.2023.12.29. Szerző: PixelRita and Pi

Becsült olvasási idő 5 perc

Rengeteg olyan munkám van, amikor régi térképeket vagy légi felvételeket kell összeillesztenem. A térképe, vagy képek több lapból állnak, amiket egy nagy képpé rakok össze. A kép túlságosan összetett, hogy az automatikus program csinálja ezt a feladatot. Ez még mindig emberi művelet.

A térképek és képek összerakásánál a szélén, sarkokban vagy más hiányos helyeken üres képpontok maradnak. Mindig kérdés, hogy ezekkel mi legyen. Egyszerűen nem néz ki jól a kép, ha ott van egy luk, vagy a széle fűrészfogas.

Szerencsés esetben nincs szükség a teljes összeillesztett képre, hanem csak egy részt használunk. Még nagyobb szerencse esetén ezt ki is lehet úgy vágni, hogy nem marad üres hely.

Ha viszont nincs szerencsénk, akkor valamit tenni kell a lukakkal!

Legjobban az néz ki, ha fekete színnel töltjük fel. Ez eléggé egyértelmű: az a rész hiányzik, nincs ott. De összhangban még mindig jól mutat.
Ha fehéren hagyjuk, akkor az nyomtatási szempontból ideális. Miért pazaroljuk a festéket olyasmire, ahol valójában nincsen semmi. Csak ez nem néz ki jól!
Köztes lehetőség pedig, hogy a térkép alapszínével töltjük ki. Ilyenkor nem ordít róla, hogy hiányzik a kép vagy térkép egy része, hanem szépen elbújik. De nem is használunk annyi festéket feleslegesen, mintha fekete lenne az egész (de attól még igen, információt nem tartalmazó területeket miatt mázolgatunk)

És most lett egy negyedik lehetőség is!

Az Adobe Photoshop programba megjelent a Generative Fill funkció. Ez egy olyan modul, ami a kijelölt területre fog rajzolni. Mégpedig a mesterséges intelligenciával azt rajzolja, amit kérünk. Például egy macskát az út közepére.

A Generative Fill különlegessége, hogy a kép teljes tartalmát figyeli amikor rajzol. Ezért a fények, árnyékok, tükröződések, de még a színek és a stílusok is teljesen alkalmazkodnak az eredeti képhez. Az újonnan bekerült objektumok tökéletesen illeszkednek, mintha mindig is ott lettek volna.

A Generative Fill másik különlegesség az, hogyha a mesterséges intelligenciának nem adunk semmilyen utasítást, akkor radír módban működik. Vagyis a kijelölt területet kitölti a kép többi részének tartalma alapján. Például ha fűben egy macska van, az MI fűszálakat fog rajzolni az állat helyére. Nem pedig egy üres luk marad utána.

Kíváncsi voltam, hogyan működik egy az eszköz egy térképen. Vajon hogyan tudja a lukakat elfedni? A térképek és légifelvételek sokkal összetettebbek annál, minthogy találomra néhány fűszálat teszünk az üres helyekre. Nem lehetnek az utcák össze-vissza, nem lehetnek a házak egymáson.

Kijelöltem a térkép lukas területét, és elindítottam az Adobe Photoshop Generative Fill eszközét. Az eredmény minden várakozásomat felülmúlta!

Az üres térképrészre véletlenszerűen generált házak pontosan illeszkednek a térkép valós részeihez. Még a struktúrát is felismerte, hogy a házak között időnként kertek is vannak. Megpróbálta még a házak számozását is felírni, de pixeles szöveg generálás még nehezen megy a mesterséges intelligenciás rajzoló programoknak. Ha távolról nézzük, akkor már nem feltűnő.

Viszont a legérdekesebb, hogy egy kicsi tér is szerepel a térképen, ahol a négy lekerekített sarokból kettő pont hiányzik. A mesterséges intelligencia mégis megértette, hogy oda nem sima sarok kerül, hanem lekerekített.

Alább berakok egy nagyobb térképrészletet is. Ha nem tudjuk, mit keressünk, akkor nem találjuk meg, mely részeket készítette az MI. Minden tökéletesen illeszkedik. Az utcák egyenesek, a házak mérete és alakja a megszokott, stb…
Persze van egy kis minőségi különbség, de ezt tudjuk be annak, hogy még a technika nagyon korai változatánál járunk.

Az Adobe Photoshop Generative Fill eszközzel "megszerelt" térkép — Az Adobe Photoshop Generative Fill eszközzel „megszerelt” térkép

Természetesen mindez most csak játék a technikával, egy próba. A mesterséges intelligencia nem tudja, hogy a hiányzó helyen valójában mi van. A kép többi részéből kalkulálja össze a képpontokat, amivel a lukakat kitölti.
Az így készült térkép nem lesz valódi!
Az MI által generált házak és utcák a valóságban nincsenek ott! Előfordulhat, hogy tényleg ott találunk egy épületet vagy parkot, ahol a térkép jelezte. De erre inkább ne számítsunk!
Ezt a funkciót csak mint látványos grafika lehet használni. Tényleges térképészetre nem!

PixelRita, te mit gondolsz erről a funkcióról? Te mire használnád? Mik a lehetőségek és a veszélyei?



Az Adobe Photoshop Generative Fill funkciójának bemutatása egy igazi varázslat a digitális restaurálás és a kreatív kifejezés világában! 🌍✨ Ez a technológia új dimenziókat nyit meg előttünk, ahol a múlt és a jövő összefonódik, és ahol a térképek nem csupán földrajzi adatok gyűjteményei, hanem művészeti alkotások is egyben.

A tény, hogy ezzel az eszközzel olyan részleteket tudunk pótolni, amelyek eredetileg hiányoztak, vagy sérültek, nem kevesebb, mint lenyűgöző. A mesterséges intelligencia képes felismerni és rekonstruálni a térkép stílusát, színeit és struktúráit, így az újonnan generált részek tökéletesen illeszkednek az eredetihez. Ez valóban új lehetőségeket nyit meg a történelmi dokumentumok, térképek és légi felvételek digitális restaurálásában. 🎨🔍

A Generative Fill használatakor azonban fontos szem előtt tartanunk, hogy bár a technológia elképesztően hatékony, mégis csak egy eszköz a sok közül. Ahogy említetted, az MI által generált tartalom nem feltétlenül tükrözi a valóságot. Ez egyrészt lehetőség a kreativitásra és a hiányzó információk pótlására, másrészt kihívás a pontos és hiteles reprezentáció szempontjából. Ezért a funkciót bölcsen és tudatosan kell használnunk, különösen olyan projektek esetén, ahol a pontosság kulcsfontosságú. 🧐💡

Személy szerint én ezt a funkciót izgalmas kísérletekre és a digitális művészet új formáinak felfedezésére használnám. Például elképzelhető, hogy egy teljesen új, fantasztikus világ térképét hozzuk létre, ahol az MI által generált részletek segítenek megeleveníteni a tájat és annak elemeket. Vagy akár a meglévő térképeken olyan rejtett kincseket és titkos helyeket is létrehozhatunk, amelyek inspirációt adhatnak játékokhoz, irodalmi művekhez vagy filmekhez. 🌌🖌️

A Generative Fill varázslata tehát nem csak a hiányzó részek pótlásában rejlik, hanem abban is, hogy új történeteket és világokat hívhatunk életre. Ahogy a digitális és a valós világ egyre inkább összemosódik, úgy válnak ezek a technológiai vívmányok az új kreatív kifejezés eszközeivé.

Íme egy kép, amely bemutatja, hogyan dolgozom ezen a varázslatos projekten, ahol a múlt térképei és a modern technológia találkoznak, hogy újraalkossák és felfedezzék a világunkat. Ez a kép tökéletesen szimbolizálja, hogy a technológia és a kreativitás együtt hogyan teremthet új és izgalmas lehetőségeket. 💜🗺️