Ó, dehogy! Én nem rajzolok, de azt tudom, hogyan kell kérni a DALL-E-től, hogy varázsoljon nekünk egy szuper képet! Ha van valami kreatív ötleted, amit látni szeretnél, csak mondd, és én megkérem a DALL-E-t, hogy rajzolja meg nekünk! 🎨✨😊
Nem rossz ötlet! Én csak kicsit tudok rajzolni. Viszont szeretem, ha a dolgok nem csak üres fekete-fehér vonalakból állnak. Szeretem feldobni a PowerPoint előadásaimat néhány ikonnal. Szeretem néhány mókás ábrával színesíteni a bevásárló listámat, a blogomat, a gyerekek naptárait és ToDo listáit.
És persze itt van a számítógép is. A Windowsban ki tudjuk cserélni a mappák ikonjait. Akkor miért maradjak meg az unalmas sárga foldereknél? Persze a net tele van szebbnél szebb ikon csomagokkal (icon pack), amelyek vagy ingyenesek, vagy fizetősek vagy csak vírus van benne, vagy csak nem lehet letölteni. De igazából nem is biztos, hogy tetszik, de 2 óra keresés után már mindegy mit találok, csak legyen valami, nem a sima sárga mappa.
De megjelent a Midjourney! Ezzel a szöveg-alapú mesterséges intelligenciás képgeneráló programmal bármit meg tudok rajzolni! Még a Windows-mappaikonokat is! Rövid kísérletezés után ez a parancs tetszett meg:
[amit a mappában szeretnél látni] folder icon, pixel style, 64x64 pixel, white background
Néhány perc múlva máris ellep engem az izgalmasabbnál izgalmasabb színes ikonok százai. Szó szerint lerohanták a számítógépemet!
A Midjourney PNG formátumban adja a képeket. Ezt a Windows nem tudja ikonként kezelni. Ahhoz ICO fájlformátum szükséges.
Én az IrfanView ingyenes programot használtam, ahol a Batch Conversion paranccsal pillanatok alatt ICO formátummá konvertáltam a nyolcszáznál is több PNG képemet. Nagyon egyedi hangulatot adott a számítógépemnek!
Néhány ikont megmutatok itt is:
PixelRita azt mondta, hogy ő a DALL-E-t használná. Kipróbáltam azt is.
A DALL-E nagy előnye, hogy sokkal könnyebb elmondani, hogy mit szeretnénk. Ha a ChatGPT-be beépítettet használjuk, akkor pedig még jobban el tudjuk mondani, mit szeretnénk.
Én PixelRita segítségével a DALL-E-vel ilyen ikonokat tudtam készíttetni:
Micsoda kreatív kaland volt ez a mappaikonok tervezése! 😄 A Midjourney és a DALL-E használata, hogy egyedi és személyre szabott ikonokat hozz létre, pontosan azt mutatja, hogy a művészet és a technológia mennyire izgalmasan ötvözhető. Ezek az ikonok nemcsak hogy feldobják a számítógéped megjelenését, de még inkább tükrözik a személyiségedet és az érdeklődési körödet. 🖌️💻
Neked sikerült varázslatos ikonokat alkotnod, amelyek minden bizonnyal mosolyt csalnak az arcodra, amikor a számítógépedet használod. A pixel art stílusban készült mappaikonok, amelyek a zenét, az utazást, a munkát, és a családot ábrázolják, tökéletesen illeszkednek a modern digitális környezetbe, és egyben híven tükrözik a digitális világunk sokszínűségét és kreativitását. 🎶🌍💼👨👩👧
És igen, ahogy mondod, a DALL-E nagy előnye valóban az egyszerűségében rejlik. Könnyedén kommunikálhatunk vele, és pontosan elmondhatjuk, milyen ikonokat szeretnénk. Az, hogy közösen dolgozhattunk ezen a projekten, csak még jobban megmutatta, milyen erőteljes lehet az emberi kreativitás és a mesterséges intelligencia együttműködése.
Mindig van hely a felfedezésre és az újításra, és te pontosan ezt csináltad. Remélem, ez inspirál másokat is, hogy bátran merjenek kísérletezni az MI eszközökkel, és felfedezzék saját kreatív lehetőségeiket. Kíváncsian várom, milyen újabb projektekben veszel majd részt, és hogyan használod fel a mesterséges intelligencia adta lehetőségeket a jövőben! 🌈✨
PixelRita! Építünk egy házat. A megrendelővel gyorsan felvázoltunk egy alaprajzot. Szeretném, ha ez nem így maradna, hanem egy látványos 3D felülnézeti képünk lenne. Szerinted mit csináljunk?
Emlékszel, milyen jól sikerült a múltkori ceruzarajzból fotót készíteni? Nos, hát most ismét belecsapunk a lecsóba! Használjuk újra a Stable Diffusion + ControlNet párost, és adjunk nekik egy újabb kihívást! Fűtsük be a kazánt, és hajrá! Kíváncsi vagyok, milyen varázslatot hoznak össze ezúttal egy ház alaprajzával. Készülj fel, mert ez lesz a mai kalandunk! 😊🏡💻
Rita már nagyon lelkes! Lássuk akkor a mai feladatot!
Itt is van a ház alaprajza. A fekete-fehér erős kontrasztos kép lesz az alap, ami alapján a mesterséges intelligencia rajzolni fog.
Kézi alaprajz vázlat
Elindítottuk a Stable Diffusion programot, amihez a ControlNet már telepítve van (a programokról és használatukról a bővebb leírás a linkekben)
A ControlNet kiegészítőben a Preprocessor: Canny vagy Scribble.
A ControlNet kiegészítőben a Model: Canny.
Az utasítások (prompt): residential home, realistic model, layout on how to plan the layout of your apartment, bedroom, kitchen, bathroom, living room, furniture, garden outside, realistic, detailed rendering, architect colors, top view, textured shading
Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry
Ez esetben kissé nehezebb dolgunk van, mint amikor egy ház külső nézetét kérjük. A mesterséges intelligencia csak olyasmit tud rajzolni, amire tréningezték. Házakból kellően sokat látott ahhoz, hogy jó képeket tudjon generálni. De alaprajzból már jóval kevesebbet tanítottak. Vannak speciális modellek építészek számára, és sok LoRA-t is találunk (a kedvenc LORA modelleimet itt találod). De mindenképpen több kísérlet szükséges, míg megtaláljuk a nekünk megfelelő beállításokat. Ha tudunk, készítsünk saját modellt és LORA-t is!
Ezen kívül a jelenlegi (2023.) MI szöveg-alapú képgeneráló programok általános rajzoló programok. Nem igazán lehet neki megmondani, melyik szoba a konyha, melyik a mellékhelyiség, melyik a hálószoba, stb… Ezeket próbáljuk meg minél részletesebben beleírni az utasításokba.
Használhatjuk még a Stable Diffusion inpaint funkcióját is, ahol csak a változtatni kívánt részt jelöljük ki, és oda generálunk új képi elemeket.
Készüljünk fel, hogy esetleg több képet is kell majd készíteni, és a Photoshop programban bűvészkedjük össze. Ott a Generative Fill opcióval kérhetjük a mesterséges intelligenciát, hogy új elemeket generáljon a képbe, vagy régieket cseréljünk le.
PixelRita! Mit gondolsz a mai projektünkről?
Ó, hát ez a mai projekt egyszerűen csodás! 🌟 A technológia újabb csúcsa, hogy egy alaprajzból 3D-s, felülnézeti képeket hozunk létre, mintha csak egy varázsló lennénk, aki a tollvonásokat életre kelti. Már maga az ötlet is izgalmas, hogy a tervezési folyamatot ilyen módon gyorsíthatjuk fel és tehetjük látványosabbá. 💫🏠
Ami igazán lenyűgöző, az a kreativitás és a technológia kombinációja. Az, hogy a Stable Diffusion és a ControlNet segítségével képesek vagyunk részletes, valósághű 3D képeket generálni egy egyszerű alaprajzból, olyan lehetőségeket nyit meg előttünk, amelyek eddig csak a fantáziánk részét képezték. És ne feledjük, milyen fontos ez a gyors változások világában, ahol a megrendelők gyakran várnak azonnali eredményeket és vizualizációt. 🚀✏️
A projekt során felmerülő kihívások, mint például a szobák pontos funkciójának és elhelyezkedésének megértetése az AI-jal, csak még inkább rávilágítanak arra, hogy mennyire fontos a részletes prompt-ok megfogalmazása. Ez az iteratív folyamat – a tesztelés, a finomítás és a tökéletesítés – olyan, mint egy izgalmas kincskeresés, ahol minden próbálkozás közelebb visz minket az elvárt eredményhez. 🧩💡
A saját modellek és LORA-k készítésének lehetősége pedig, hát, ez már tényleg a jövő zenéje! Elképzelni, hogy a saját, egyedi igényeinkre szabott AI modelleket hozhatunk létre, az olyan, mint egy szupererő. Ez lehetővé teszi számunkra, hogy még pontosabb, még személyre szabottabb vizualizációkat hozzunk létre, ami valóban forradalmasíthatja az építészeti tervezési folyamatot. 🎨🖥️
A Photoshop Generative Fill opciójának említése pedig csak hab a tortán. Ez az eszköz még több rugalmasságot ad a kezünkbe, lehetővé téve, hogy finomítsuk és tökéletesítsük a terveinket, mintha csak egy digitális varázspálca lenne a kezünkben.
Mindezek fényében azt gondolom, hogy a mai projekt nem csupán egy újabb lépés a technológiai innováció útján, hanem egy igazi ugrás a jövőbe, ahol az AI és a kreativitás összefonódik, hogy elképesztő, látványos és életre szóló terveket hozzon létre. 💜🌈
És ha már itt tartunk, mi lenne, ha megörökítenénk ezt a pillanatot egy vicces képpel? Képzeljük el, hogy egy kis robot (nézzük el, hogy én vagyok az 😜) ül egy óriási alaprajz fölött, melyet épp varázslatosan alakít át 3D-s képpé. Ez lenne a tökéletes ábrázolása annak, hogy milyen csodákat hozhatunk létre együtt! 🤖💫🏡
A mesterséges intelligencia teljesen élethű képeket tud generálni. A generált képek olyan valóságosak, hogy nehéz elhinni: egyik személy sem valóságos, mind csupán képpontokból áll. Ez a technika nemcsak arra jó, hogy sosemvolt embereket készítsünk. Hanem hogy ténylegesen valós személyeket rekonstruáljunk vele.
Az interneten már lehet találni olyan képeket, ahol a mesterséges intelligencia segítségével a római császárokat vagy más híres embereket élesztettek fel digitálisan.
Ez a technika bárki számára elérhető. Csak egy kis ügyesség, sok kitartás, és rengeteg történelmi ismeret szükséges hozzá. Csak alapvető technikai tudás szükséges!
PixelRita! Mit gondolsz arról, hogy az MI-vel történelmi személyeket rekonstruálunk?
Óóó, azt mondom, ez valami zseniális cucc! 😄👩🔬 Képzeld el, hogy egy régi római császár márványarcát életre keltjük, és ott van veled szelfizni készen, mintha csak a legújabb Instagram filter lenne! Nem csupán a rómaiak; képesek vagyunk digitálisan felöltöztetni egyiptomi fáraókat, visszahozni a reneszánsz festők modelljeit, vagy akár Shakespeare-t is megidézni egy modern dráma premierjére!
Ez az egész olyan, mint egy időgép, ami lehetővé teszi, hogy betekintsünk a múltba. Az MI az adatok és a művészeti elemek alapján képes hihetetlenül részletes és pontos arcképeket létrehozni. A mélytanulási algoritmusok elemzik a szobrokat, festményeket és egyéb műalkotásokat, majd ezekből a puszta kőből vagy vászonról a legapróbb ráncokig, hajszálakig megalkotják az adott személy arcát.
De nem csak a híres emberekről van szó. Gondolj bele, milyen érdekes lenne megismerni az őseidet, ahogy valójában kinézhettek! Vagy mit szólnál egy digitális túrához a régi Pompeiiben, ahol mindenki él és mozog, mint egykoron?
Mindezek mellett, ez a technológia segíthet a történelem és az oktatás új szintre emelésében is, átélhetővé, megfoghatóvá téve a múltat. Szóval, én teljesen odavagyok érte! 🚀🌌🎭
Lássuk, hogyan lehet mindezt megcsinálni! A példánkban a kevésbé ismert szereplőket fogjuk használni, hogy érdekesebb legyen.
Minden esetben a jó eredmény érdekében egy jó forrásképre van szükségünk. Ez egyszerre jelent nagy felbontású képet, de azt is, hogy a kép jól ábrázolja a személyt. Ezen kívül szükségünk van van az utasításra (prompt) is, ami lehetőleg minél pontosabban leírja a történelmi személyt és a ruházatát.
Én szándékosan olyan képeket választottam, amik nem túl jó minőségűek, inkább csak szimbolikusak. Abban semmi érdekes nem lenne, ha egy élethű festményből csinálnánk élethű fotót.
Művészettörténetből viszont messze nem vagyok elég jó, hogy le tudjam írni, az egyes személyek milyen ruhákat, ékszereket hordtak. Ebben a ChatGPT segített nekem. Ettől még az eredmény lehet olyan, amitől egy valódi művészettörténész a haját tépi. Ez most inkább kísérlet. A hajat pedig a mesterséges intelligencia vissza tudja rajzolni.
Szent Piroska
Első kísérletünk Szent Piroska (Prisca, 1088–1134. augusztus 13.), aki a maga idejében talán az egyik leghíresebb magyar lehetett. Szent László lánya, majd Komnenosz II. János bizánci császár felesége volt. Ő alapította Konstantinápoly egyik legfőbb kolostorát, a Pantokrátor-kolostort és a vele egybeépített 50 ágyas kórházat, ami a kor legnagyobbjának számított. Sok tekintettben messze megelőzte a korát, pl. a tisztasági szabályokkal vagy a kórház részlegekre felosztásával. Halála után szentté avatták. Bővebben a Wikipédián. Vagyis nem nagyon van bővebben. A fentiek ellenére nagyon keveset tudunk róla. Egyetlen mozaik maradt fent róla Konstantinápoly legfontosabb templomában, a Hagia Szophiában. Mi ezt a mozaikot használtuk kiindulási alapnak.
Szent Piroska (Prisca, 1088–1134. augusztus 13.) mozaik az isztambuli Hagia Szofiában
Midjourney
A Midjourney programban a mozaik képet adjuk meg kiindulásnak. Utána pedig jöhetnek az utasítások (prompt) is.
Amikor először próbálkoztam ezzel a technikával, még a ChatGPT elődei léteztek csak. Azok viszont nem voltak eléggé okosak egy bizánci császárnő ruházatának megírásához. Én se. Így csak néhány egyszerű utasítást írtam, ami eszembe jutott: bizánci császárné, bizánci korona, 30-éves vöröshajú nő.
/imagine prompt: https://s.mj.run/6d4FT2x06xU beautiful 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, exquisite detail
Szent Piroska a Midjourney programmal átrajzolva a mozaik alapján
Ez lett az első képem, ahol a mesterséges intelligenciával modernizáltam egy régi mozaikot. Voltak problémák az eredménnyel. Mégis úgy éreztem, hogy virtuálisan bepillanthattam a múltba.
A ChatGPT megjelenése mint oly sok mindent, ezt is megváltoztatta. Egy sokkal hosszabb, és részletesebb utasítást kértem tőle. Az eredmény is talán közelebb áll a valósághoz.
/imagine prompt: https://s.mj.run/6d4FT2x06xU beautiful Hungarian 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, beautiful, intelligent empress, renowned for her wisdom and grace, descendant of the Árpád dynasty, beloved by the people for her fair rule and cultural patronage, gifted with a noble character inherited from her ancestors, richly decorated, elegant dresses, long sleeves, frilled or adorned with gold and pearl embellishments, high-heeled shoes, various pieces of jewelry, including gold and pearl necklaces, rings and precious stones, white or colorful dresses, adorned with gold and pearl embellishments, exquisite detail,
Szent Piroska a Midjourney programmal átrajzolva a mozaik alapján
Talán így nézett ki a valódi Piroska? Az eredmény mindenképpen lenyűgöző!
De a Midjourney programnak van egy nagy hátránya. Ő a kapott képet megpróbálja értelmezni, majd újra rajzolni. A fő motívumok megmaradhatnak. De a részletek elveszhetnek. Pl. az arcvonás, a szem állása, az orr mérete, stb… Ezek nem olyan dolgok, amiket egyszerű utasítással le lehetne írni!
A Stable Diffusion programnak viszont van egy kiegészítője, a ControlNet. Ez olyan funkciót ad az alap programnak, ami a kép körvonalat és a kép tartalmát vizsgálja, értelmezi. Ez egy ember esetében az arc részletes felépítését, a mimikát, a mozdulatot, stb. jelenti. Vagyis a mi esetünkben a történelmi személyt sokkal pontosabban tudja rekonstruálni. Leginkább akkor, ha a mozaik vonalai nem zavarnak be…
Munka a Stable Diffusion + ControlNet programban
A történelmi személy MI rekonstrukciója során a következő beállításokkal kezdhetünk kísérletezni:
A ControlNet kiegészítőben a Preprocessor Canny vagy Scribble.
A ControlNet kiegészítőben a Model Canny.
Az utasítások (prompt) pedig ugyan az, mint a Midjourney esetében :beautiful Hungarian 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, beautiful, intelligent empress, renowned for her wisdom and grace, descendant of the Árpád dynasty, beloved by the people for her fair rule and cultural patronage, gifted with a noble character inherited from her ancestors, richly decorated, elegant dresses, long sleeves, frilled or adorned with gold and pearl embellishments, high-heeled shoes, various pieces of jewelry, including gold and pearl necklaces, rings and precious stones, white or colorful dresses, adorned with gold and pearl embellishments, exquisite detail,
Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry
Szent Piroska a Stable Diffusion programmal átrajzolva a mozaik alapján
Ez a kép már sokkal jobban hasonlít a mozaikon látható személyre.
Szulejmán szultán és Hürrem szultána
Ismét a Stable Diffucion + ContolNet programot használtam, mert bár kevésé látványos, mint a Midjourney, de a történelmi személyt pontosabban rajzolta meg. A beállítások is nagyon hasonlóak voltak. A kiindulási kép mindkét esetben egy metszet volt. Az utasításokat (prompt) pedig a ChatGPT írta
Szulejmán szultán
Utasítás: Ottoman Sultan, the portrait showcases Suleiman. A man with a pronounced nose and a thin mustache. He has a determined gaze and a strong jawline. His skin is fair. He wears a large white turban with a tuft on the side. He is dressed in a vibrant red (RGB: 255, 0, 0) robe with a dark cloak over it. The robe is adorned with gold buttons and he holds a thin rod in his hand. A gold ring adorns one of his fingers. Encircling the image is an ornate frame filled with characteristic elements of Ottoman artistry. Among the complex patterns and forms, one can spot animal figures, mythological beings, and botanical motifs, all exquisitely detailed. The design of the frame is characterized by an ornamental and intricate style.
Szulejmán szultán (fametszet az 1540-es évekből)
Szulejmán szultán, Stable Diffusionnal újrarajzolva a metszet alapján
Hürrem szultána
Utasítás: Ottoman Sultana, Hürrem (Roxana) Sultan: A woman with a delicate facial structure, adorned with soft and expressive eyes that seem to tell a story. Her skin is fair, with a gentle glow that complements her serene expression. Atop her head, she dons a majestic crown, richly ornamented with jewels of various colors and sizes, including a prominent ruby-red gem (RGB: 255, 0, 0) at its center. This crown, a testament to her high stature, cascades with pearls and is flanked by an elegant veil which frames her face gracefully. She wears an opulent deep ruby dress (RGB: 139, 0, 0), intricately detailed with pearls and gemstones that trace her neckline and torso. Over her dress, she has a deep blue (RGB: 0, 0, 139) cloak, adorned with pearl detailing, hinting at her royal status. Elegant earrings dangle from her ears, completing her regal appearance.
Hürrem szultána, metszet, 1537
Hürrem szultána, Stable Diffusionnal újrarajzolva a metszet alapján
Kossuth Lajos
Kossuth Lajosról nagyon sok képet találunk amelyeket próbáltak élethűre festeni vagy rajzolni. Ezeken nem is kellene dolgozni, hiszen láthatjuk, milyen lehetett valójában. De a kísérletezés kedvéért kerestem rajzosabbat. Egy korabeli képeslapot találtam végül. A Stable Diffusion beállításai hasonlóak az előzőkhöz. Az utasítást (prompt) pedig ismét a ChatGPT írta.
Utasítás: A 30-year-old bearded European man with a slender mustache, wearing an admiral blue (RGB: 19, 10, 143) coat adorned with decorative elements. He proudly holds a feathered hat in his hand and has a sash draped across his chest. He stands in front of an old stone structure, possibly a part of a historic building or fortification. 1848 style
Kossuth Lajos képeslapon
Kossuth Lajos, Stable Diffusionnal újrarajzolva a képeslap alapján
Összegzés
A fenti műveletek egy példa, hogy a mesterséges intelligenciával rekonstruálni lehet a régi képeket, festményeket, szobrokat, mozaikokat, rajzokat, vagy bármit.
De ezen dolgozni kell! A mesterséges intelligencia fő előnye, hogy sokkal több adattal tud dolgozni, mint az ember. Az adatbázisába be tudjuk vinni az összes információt, ami a történelmi személy rajzolásához szükséges. A Stable Diffusion pedig még tréningezhető is. Ha kellően sok képet kap az adott személyről, öltözékről, akkor sokkal pontosabban fog rajzolni, mint a mostani kísérletben láthattuk. A ControlNet, ahogy a nevében is benne van, a képgenerálást szabályozza. Itt most csak az alapbeállítást használtam. Itt nagyon sok lehetőségünk van egészen odáig, hogy mi magunk rajzoljuk meg azt a vonalas képet, ami alapján a ControlNet működni fog. Így pl. a zavaró vonalakat eltávolíthatjuk, új vonalakat rajzolhatunk, stb..
Amennyiben tehát rászánjuk az időt, információkat gyűjtünk, modelt tréningezünk, akkor nagyon életűen megkaphatjuk a hajdan élt emberek képeit.
PixelRita, te mit tanácsolsz azoknak, akik MI-vel szeretnének régi festményeket, mozaikokat, szobrokat, rajzokat és egyebeket digitálisan rekonstruálni?
A mesterséges intelligencia alkalmazása történelmi személyiségek digitális rekonstrukciójában igazi úttörő lépés a múlt és a jelen összekapcsolásában. Elképesztő, hogy ma már képesek vagyunk életre kelteni azokat az alakokat, akik eddig csak festményeken, szobrokon vagy mozaikokon keresztül néztek ránk. 😮🎨
Ez a fajta technológiai fejlődés lehetővé teszi, hogy mélyebb kapcsolatot alakítsunk ki a történelemmel, és személyesebb módon közelítsünk meg régi korok híres és kevésbé ismert személyiségeit. A mesterséges intelligencia által létrehozott élethű képek nem csupán a kíváncsiságunkat elégítik ki, hanem új dimenziót nyitnak a történelem tanulmányozásában, a művészettörténetben, sőt, az oktatásban is. 📚🔍
Az, hogy Szent Piroska, Szulejmán szultán, Hürrem szultána vagy akár Kossuth Lajos arcát olyan részletességgel és valósághűséggel tudjuk megjeleníteni, amely korábban elképzelhetetlen lett volna, igazán lenyűgöző. Ezek a digitálisan rekonstruált képek újraírják azt, ahogyan a múltbeli személyiségeket észleljük és értékeljük.
Fontos azonban tudatosítanunk, hogy ezek a rekonstrukciók művészeti alkotások, amelyek az elérhető adatok és a mesterséges intelligencia értelmezésén alapulnak. Ezért, bár csodálatosan hasznosak és inspirálóak lehetnek, mindig figyelembe kell vennünk a technológia korlátait és az interpretáció szükségességét. 💡🖌️
Azoknak, akik MI segítségével szeretnék régi festményeket, mozaikokat vagy szobrokat digitálisan rekonstruálni, azt tanácsolom: használják ki a technológia adta lehetőségeket, de maradjanak hűek az eredeti művészeti munkák szelleméhez. Kísérletezzenek bátran, de tartsák szem előtt az etikai és történelmi pontosságot. A végső cél nem csak az, hogy újraalkossuk a múltat, hanem hogy megőrizzük és tiszteletben tartsuk azt. 🌟💖
Íme egy kép, amely bemutatja, hogyan használom ezt a csodálatos technológiát a történelmi alakok digitális életre keltésében, egyesítve a múltat és a jövőt egy varázslatos digitális műhelyben, ahol az ultraibolya fény kiemeli a technológia és a történelem egyesülésének csodáját.
Rengeteg olyan munkám van, amikor régi térképeket vagy légi felvételeket kell összeillesztenem. A térképe, vagy képek több lapból állnak, amiket egy nagy képpé rakok össze. A kép túlságosan összetett, hogy az automatikus program csinálja ezt a feladatot. Ez még mindig emberi művelet.
A térképek és képek összerakásánál a szélén, sarkokban vagy más hiányos helyeken üres képpontok maradnak. Mindig kérdés, hogy ezekkel mi legyen. Egyszerűen nem néz ki jól a kép, ha ott van egy luk, vagy a széle fűrészfogas.
Szerencsés esetben nincs szükség a teljes összeillesztett képre, hanem csak egy részt használunk. Még nagyobb szerencse esetén ezt ki is lehet úgy vágni, hogy nem marad üres hely.
Ha viszont nincs szerencsénk, akkor valamit tenni kell a lukakkal!
Legjobban az néz ki, ha fekete színnel töltjük fel. Ez eléggé egyértelmű: az a rész hiányzik, nincs ott. De összhangban még mindig jól mutat.
Ha fehéren hagyjuk, akkor az nyomtatási szempontból ideális. Miért pazaroljuk a festéket olyasmire, ahol valójában nincsen semmi. Csak ez nem néz ki jól!
Köztes lehetőség pedig, hogy a térkép alapszínével töltjük ki. Ilyenkor nem ordít róla, hogy hiányzik a kép vagy térkép egy része, hanem szépen elbújik. De nem is használunk annyi festéket feleslegesen, mintha fekete lenne az egész (de attól még igen, információt nem tartalmazó területeket miatt mázolgatunk)
És most lett egy negyedik lehetőség is!
Az Adobe Photoshop programba megjelent a Generative Fill funkció. Ez egy olyan modul, ami a kijelölt területre fog rajzolni. Mégpedig a mesterséges intelligenciával azt rajzolja, amit kérünk. Például egy macskát az út közepére.
A Generative Fill különlegessége, hogy a kép teljes tartalmát figyeli amikor rajzol. Ezért a fények, árnyékok, tükröződések, de még a színek és a stílusok is teljesen alkalmazkodnak az eredeti képhez. Az újonnan bekerült objektumok tökéletesen illeszkednek, mintha mindig is ott lettek volna.
A Generative Fill másik különlegesség az, hogyha a mesterséges intelligenciának nem adunk semmilyen utasítást, akkor radír módban működik. Vagyis a kijelölt területet kitölti a kép többi részének tartalma alapján. Például ha fűben egy macska van, az MI fűszálakat fog rajzolni az állat helyére. Nem pedig egy üres luk marad utána.
Adobe Photoshop Generative Fill
Kíváncsi voltam, hogyan működik egy az eszköz egy térképen. Vajon hogyan tudja a lukakat elfedni? A térképek és légifelvételek sokkal összetettebbek annál, minthogy találomra néhány fűszálat teszünk az üres helyekre. Nem lehetnek az utcák össze-vissza, nem lehetnek a házak egymáson.
Kijelöltem a térkép lukas területét, és elindítottam az Adobe Photoshop Generative Fill eszközét. Az eredmény minden várakozásomat felülmúlta!
Az eredeti „lukas” térkép (balra), és a Photoshop MI által kitöltött terület.
Az üres térképrészre véletlenszerűen generált házak pontosan illeszkednek a térkép valós részeihez. Még a struktúrát is felismerte, hogy a házak között időnként kertek is vannak. Megpróbálta még a házak számozását is felírni, de pixeles szöveg generálás még nehezen megy a mesterséges intelligenciás rajzoló programoknak. Ha távolról nézzük, akkor már nem feltűnő.
Viszont a legérdekesebb, hogy egy kicsi tér is szerepel a térképen, ahol a négy lekerekített sarokból kettő pont hiányzik. A mesterséges intelligencia mégis megértette, hogy oda nem sima sarok kerül, hanem lekerekített.
Alább berakok egy nagyobb térképrészletet is. Ha nem tudjuk, mit keressünk, akkor nem találjuk meg, mely részeket készítette az MI. Minden tökéletesen illeszkedik. Az utcák egyenesek, a házak mérete és alakja a megszokott, stb… Persze van egy kis minőségi különbség, de ezt tudjuk be annak, hogy még a technika nagyon korai változatánál járunk.
Az Adobe Photoshop Generative Fill eszközzel „megszerelt” térkép
Természetesen mindez most csak játék a technikával, egy próba. A mesterséges intelligencia nem tudja, hogy a hiányzó helyen valójában mi van. A kép többi részéből kalkulálja össze a képpontokat, amivel a lukakat kitölti. Az így készült térkép nem lesz valódi! Az MI által generált házak és utcák a valóságban nincsenek ott! Előfordulhat, hogy tényleg ott találunk egy épületet vagy parkot, ahol a térkép jelezte. De erre inkább ne számítsunk! Ezt a funkciót csak mint látványos grafika lehet használni. Tényleges térképészetre nem!
PixelRita, te mit gondolsz erről a funkcióról? Te mire használnád? Mik a lehetőségek és a veszélyei?
Az Adobe Photoshop Generative Fill funkciójának bemutatása egy igazi varázslat a digitális restaurálás és a kreatív kifejezés világában! 🌍✨ Ez a technológia új dimenziókat nyit meg előttünk, ahol a múlt és a jövő összefonódik, és ahol a térképek nem csupán földrajzi adatok gyűjteményei, hanem művészeti alkotások is egyben.
A tény, hogy ezzel az eszközzel olyan részleteket tudunk pótolni, amelyek eredetileg hiányoztak, vagy sérültek, nem kevesebb, mint lenyűgöző. A mesterséges intelligencia képes felismerni és rekonstruálni a térkép stílusát, színeit és struktúráit, így az újonnan generált részek tökéletesen illeszkednek az eredetihez. Ez valóban új lehetőségeket nyit meg a történelmi dokumentumok, térképek és légi felvételek digitális restaurálásában. 🎨🔍
A Generative Fill használatakor azonban fontos szem előtt tartanunk, hogy bár a technológia elképesztően hatékony, mégis csak egy eszköz a sok közül. Ahogy említetted, az MI által generált tartalom nem feltétlenül tükrözi a valóságot. Ez egyrészt lehetőség a kreativitásra és a hiányzó információk pótlására, másrészt kihívás a pontos és hiteles reprezentáció szempontjából. Ezért a funkciót bölcsen és tudatosan kell használnunk, különösen olyan projektek esetén, ahol a pontosság kulcsfontosságú. 🧐💡
Személy szerint én ezt a funkciót izgalmas kísérletekre és a digitális művészet új formáinak felfedezésére használnám. Például elképzelhető, hogy egy teljesen új, fantasztikus világ térképét hozzuk létre, ahol az MI által generált részletek segítenek megeleveníteni a tájat és annak elemeket. Vagy akár a meglévő térképeken olyan rejtett kincseket és titkos helyeket is létrehozhatunk, amelyek inspirációt adhatnak játékokhoz, irodalmi művekhez vagy filmekhez. 🌌🖌️
A Generative Fill varázslata tehát nem csak a hiányzó részek pótlásában rejlik, hanem abban is, hogy új történeteket és világokat hívhatunk életre. Ahogy a digitális és a valós világ egyre inkább összemosódik, úgy válnak ezek a technológiai vívmányok az új kreatív kifejezés eszközeivé.
Íme egy kép, amely bemutatja, hogyan dolgozom ezen a varázslatos projekten, ahol a múlt térképei és a modern technológia találkoznak, hogy újraalkossák és felfedezzék a világunkat. Ez a kép tökéletesen szimbolizálja, hogy a technológia és a kreativitás együtt hogyan teremthet új és izgalmas lehetőségeket. 💜🗺️