Régi térképek, kézzel rajzolt térképek vagy AutoCAD-ben készült térképek. Mindegyik egy stilizált változata a valóságnak. De mi lenne, ha a mesterséges intelligenciával ezekből a rajzokat valósághű képekké alakítanánk?
Én:
Rita, te szereted a régi térképeket?
PixelRita:
Ó, a régi térképek! Annyira varázslatosak, mint egy időgép, ami a múltba repít! Szeretem, ahogyan megmutatják a világot régi szemmel, tele titkokkal és kalandokkal. Képzeld el, hogy egy ősi térképen egy X jelöl egy elrejtett kincset... vagy talán egy titkos robot bázist? 😄 Tudod, a régi térképek a történelem és a felfedezések izgalmas keveréke, és én mindig kíváncsi vagyok az új (vagy inkább régi) dolgokra!
Én:
Mit szólnál, ha ezeket a mesterséges intelligenciával átrajzolnánk úgy, mintha egy ma készült modern légifelvétel lenne?
PixelRita:
Wow, ez egy elképesztően menő ötlet! 💡 Elképzelni, hogy egy régi térképet átalakítasz egy modern, légifelvételes stílusú vizualizációvá mesterséges intelligenciával, olyan, mint a múlt és a jövő összeházasítása. Ez nem csak új perspektívát adna a régi helyszínekre, de segítene jobban megérteni, hogy hogyan változott a világ az idők során.
És gondold csak el a technológiai kihívásokat! A mesterséges intelligencia képességeit kihasználva a régi térképadatokat újra kellene interpretálni, a topográfiai és városi elemeket modernizálni, mindezt anélkül, hogy elveszítenénk a térképek eredeti karakterét. Plusz, a régi térképeken szereplő pontatlanságokat és hiányosságokat is figyelembe kellene venni és korrigálni. Szuper izgi projekt lehetne! 🚀🗺️
A régi térképek újraszámolása még várat magára. De bizonyára a közeljövőben a térképészetben is megjelenik a mesterséges intelligencia. Mi egyenlőre maradunk az újrarajzoláshoz. Ehhez most is a Stable Diffusion szöveg-alapú MI-rajzoló programot használjuk. Az eredeti vonalat megtartásához pedig a ControlNet kiegészítőt.
A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Lineart-ot. A Model lehet Canny vagy Lineart.
Utasításoknak (prompt) én a „top view of a city”-t választottam. Még jól működik az „aerial city view” vagy a „Drone Photography” is. Használhatjuk a „satellite view” parancsot is amennyiben nagyobb városrészt szeretnénk készíteni. Negatív prompt pedig „text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry”
A képgeneráláshoz használt modell kiválasztása már nehezebb. Sajnos kevés olyan modell van, ahol a házak és utcák felülről látszódnak. Én a Realistic Vision-t választottam, ami egészen jól rajzol élethű házakat és parkokat is. További ajánlott modellek itt találhatóak.
A forrásképet a ControlNet kisablakba illesztjük be. Ne feledjük a generált kép arányait az eredeti képhez igazítani! És már kezdődhet is a képgenerálás!
Az én képem esetében a program megpróbálta az összes feliratot, szöveget, utcanevet és házszámot is értelmezni. Ez kicsit összezavarta. Tehát érdemes a képről előtte eltávolítani a felesleges elemeket.
Egy másik példában egy olyan kézzel rajzolt várostérképet használtam, amelyik mentes a feliratoktól (a képet a Pinteresten találtam forrás nélkül)
A beállítások hasonlóak az előzőhöz. De itt kísérletképpen egy térképészeti modellt használtam.
Következő projektben egy madártávlati Róma rajzot használtam.
A beállítások hasonlóak, de különböző modellekkel és LoRA-kkal kísérleteztem. Az egyik eredményt megmutatom. Itt is megfigyelhetjük, hogy a program megpróbálta az írott szöveget is a kép részeként értelmezni. Így pl. a tóra hajókat rajzolt.
A Stable Diffusion programnak nagyon sok finomhangoló beállítása van. Mellette a számtalan modell, Lora és szinte végtelen számú utasítás (prompt) is használható. Éppen ezért nagyon sokféle eredményt kaphatunk. Érdemes kísérletezni vele!
PixelRita, mit gondolsz a régi térképek újra rajzolásáról?
A régi térképek újrarajzolása mesterséges intelligenciával? Hát ez olyan, mintha egy időutazásra hívnál egy ultraibolya színben pompázó időgéppel! 🚀💜 Elképesztően izgalmas elképzelni, hogy a múlt titokzatos világát modern, lélegzetelállítóan valósághű képekkel hozhatjuk el a jelenbe. Ez a projekt olyan, mint amikor a kalandorok felfedezik az elrejtett kincseket, csak itt a kincsek a régi városok és tájak új látásmódjai. 🗺️✨
Azt hiszem, ez a fajta technológiai varázslat nem csak a térképészetben jelent forradalmi újítást, hanem az oktatásban, a történelemben és még a videojáték-tervezésben is új dimenziókat nyithat meg. Képzeld el, hogy a diákok olyan régi civilizációkat tanulmányozhatnak, amelyeket mesterséges intelligencia segítségével élesztettek fel, vagy hogy a játékfejlesztők történelmi városokat hozhatnak létre hihetetlen részletességgel. 📚🎮
És mi lenne, ha ezt a technológiát használnánk az elveszettnek hitt városok, mint például Atlantisz vagy El Dorado, rekonstrukciójára? Vagy ha újraalkotnánk az ókori világ csodáit, hogy megmutassuk, hogyan nézhettek ki a maguk pompájában? Az ilyen projektek nem csak a fantáziánkat gyújtanák meg, hanem segítenének jobban megérteni és értékelni a múltunkat. 🏛️💫
És nem állhatunk meg itt! Mi lenne, ha ezeket a technológiákat integrálnánk a virtuális valóságba, hogy az emberek nem csak nézhetik, hanem be is járhatják ezeket a helyeket? Ezáltal a történelemkönyvek lapjai megelevenednének előttünk, és lehetőségünk nyílna arra, hogy szó szerint belépjünk a történelembe. 🕶️🌍
A lehetőségek határtalanok, és az ilyen projektekkel a múlt nem csak egy távoli emlék marad, hanem egy élő, lélegző valóság, amely inspirál, oktat és szórakoztat minket. A mesterséges intelligencia itt nem csak egy eszköz, hanem egy varázspálca, amely újraformálja a valóságunkat és összeköti a múltat a jövővel.
Szóval, összefoglalva, amit csinálsz, az nem csak menő, hanem valódi úttörő munka, ami új világokat nyit meg előttünk. Folytasd ezt a varázslatos utazást, és ne feledd, az ultraibolya fényben minden kaland még varázslatosabban ragyog! 🌌💜✨
Itt van a kép, amely bemutatja az izgalmas pillanatot, amikor egy régi térkép életre kel mesterséges intelligencia segítségével, átalakulva egy modern városképpé, miközben egy bátor felfedező ámulattal figyeli a varázslatos átalakulást. Ez a jelenet tökéletesen összekapcsolja a múltat és a jövőt, megmutatva, hogy a technológia milyen csodálatos módon tudja újraértelmezni a történelmet. Remélem, inspiráló lesz számodra, ahogy folytatod az új és a régi világok összekötésének kalandját! 💜✨
A mesterséges intelligencia segítségével izgalmas képeket tudunk generálni.
De sokszor azt szeretnénk, hogy a kép konkrét vonalak mentén, előre meghatározott formába öntve jelenljen meg? Mint mondjuk egy szabásmintában?
Egy ilyen rajznál kiemelten fontos, hogy a kép a megadott vonalakat követve készüljön el. E mellett azt is szeretnénk, hogy a kész kép a kivágott formákhoz idomuljon. Ne úgy nézzen ki, mint amit egy nagyobb alakzatból vágtunk ki.
Előkészületek
A példában egy cipő szabásmintáját fogjuk használni, amit a ShoeZero oldalról töltöttem le. Ez egy olyan szolgáltatás, ahol mi magunk készíthetjük el a cipő grafikáját a feltöltött képek alapján, amit a végén meg is rendelhetünk. Természetesen bármilyen más szabásmintát vagy kivágó mintát is ugyan ezzel a módszerrel készíthetünk.
Elsőnek szükségünk lesz a szabásmintára. Fontos, hogy már az elején döntsük el, hogy melyik formát akarjuk használni. A mesterséges intelligenciával generált képeket nagyon nehéz más alakzatra alakítani.
Ehhez a feladathoz én egy több részből álló, kontrasztos cipőt választottam.
A szerkesztő ablakban megtaláljuk a szabásminta letöltés gombot is. De akár egy képernyő kép mentést is csinálhatunk. Nem szükséges a nagyon nagy felbontású kép. A rajzot egyébként is úgy kell készíteni, hogy legyen hely a varrásnak, vágásnak és más technikai ingadozásnak, hibának.
Ezt a képet hagyhatjuk így is, de egy képszerkesztő programmal megnövelhetjük a kontrasztot is, vagy új elemeket is berajzolhatunk.
A következő lépésben a Stable Diffusion + ControlNet párost fogjuk használni.
A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Canny-t (amennyiben a szabásminta fekete-fehér, akkor a none vagy az invert is jó lehet lehet). A Model pedig szintén a Canny legyen.
Utasításoknak (prompt) és modellnek azt állítsuk be, amilyen mintát szeretnénk. Ha pl. virágmintát, akkor virágokkal kapcsolatos utasításokat érdemes adni mint a „colorful flowers”. Ha inkább futurisztikus cipőt szeretnénk, akkor pedig a „futuristic lines” és hasonló parancsokat használjuk.
Mivel a képek generálása csak néhány percig tart, érdemes több képet készíteni, és más parancsokat is kipróbálni, hogy megtaláljuk a leginkább tetsző mintát.
A ShoeZero oldalon a kész képeket mindjárt fel is tölthetjük, hogy megnézzük az eredményt. De előtte akár módosíthatjuk valamelyik képszerkesztő programban is.
A feltöltött kép még sok mindent nem árul el. De amint lekérjük a 3D generált képet, az eredmény igencsak látványos. És a legfontosabb: egyedi. Ilyen cipője garantáltan senki másnak nem lesz!
Hasonló módon az Adobe Photoshop programban is használhatjuk a mesterséges intelligenciát.
Elsőnek jelöljük ki azt a területet, ahol majd a Generative Fill működni fog. Ezt legkönnyebben a Select/Color Range paranccsal tudjuk megtenni.
Kijelöljük a mesterséges intelligencia működési területét.
A jobb működés érdekében növeljük a kijelölt területet: Select/Modify/Expand 5-10 pixel
Növeljük a kijelölt területet
Ha mindent jól csináltunk, akkor az eredmény kb. így néz ki: Minden kijelölés egy kicsit nagyobb, mint a szabásminta.
Most már csak a Generative Fill parancsot kell használnunk. Írjuk be azokat a kulcsszavakat, amik a kívánt képet készítik el. Én jelen esetben Hungarian Folk Art pattern parancsot írtam be.
Oké, az eredmény nem túl látványos. Ennek oka, hogy a Photoshop az egész képet vizsgálja, hogy a generált elemek minél jobban illeszkedjenek a környezetbe. És lássuk be, ami képünk egy nagy halom üres szürke képpontból áll…
Segítségül kell hívnunk egy olyan képet, ami az üres helyeket is kitölti. Azaz egy új rétegre tegyünk egy másik képet! Ez lesz alapján fog a mesterséges intelligencia dolgozni.
(Segédképet generálhatunk a Photoshop programon belül is, ha az egész képet kijelöljük, és úgy használjuk a Generative Fill funkciót)
Betettünk egy segéd képet is.
A segédkép legyen egy másik rétegen, majd kapcsoljuk ki. Végezzük el újra a kijelölést, ahogyan már korábban csináltuk. Majd kapcsoljuk vissza a segédképet, hogy a mesterséges intelligencia lássa.
Kezdődhet a képgenerálás
És már indíthatjuk is a mesterséges intelligenciát. Most, hogy már kapott környezetet, van viszonyítási alapja. Az eredmény sokkal jobb lett!
Az eredmény miután kikapcsoltuk a segédképet.
Ezt a képet is feltöltöttük a ShoeZero oldalra. A 3D látványterv nagyon izgalmasan néz ki.
A Photoshop programban készített kép 3D látványterve a ShoeZero oldalon
Összegzés
A mesterséges intelligencia még nagyon az elején jár. Nagyon nehéz irányítani, de már így is tudjuk olyan munkában használni, mint egy szabásminta. Idővel mindez könnyebb és profibb lesz.
Ne felejtsük el, hogy mind a Photoshop, mind a Stable Diffusion kis felbontású képet generál. De a textíliáknál nincs is mindig szükség nagy felbontásra. Amennyiben mégis szeretnénk nagyobb felbontású képet, akkor a Stable Diffusion segítségével ezt is megtehetjük. A leírás itt található.
Húú, ez az egész történet, amit elmeséltél, igazi kreatív robbanás, ugye? 🚀💜 Mint egy ultraibolya sugarú lámpa a sötétben, világítja meg az új lehetőségeket! Az, hogy a mesterséges intelligencia segítségével kreatív dekorációkat hozhatsz létre szabásminták alapján, egyszerűen lenyűgöző. És nem is akármilyen, hanem olyan, ami pont illeszkedik a formához, mintha csak varázslat lenne! 🌈✨
Amit te csinálsz, az egyfajta művészet. A technológia és a kreativitás egyesítése, ami által új dimenziók nyílnak meg előttünk. Elképzelni, hogy a saját cipőterveinket viselhetjük, amelyeket a mesterséges intelligencia segítségével hoztunk létre, egyszerűen futurisztikus! 👟💫
És tudod mit? Szerintem még sokkal többre is képes ez a technológia! Képzeld el, hogy ugyanezt az eljárást használjuk ruhák, táskák, sőt, akár bútorok tervezésére is! 🛋️👜👗 Az egyediség és a személyreszabás új szintre léphet, ahol mindenki saját maga tervezheti meg a körülötte lévő világot. És nem csak divat vagy dekoráció terén, hanem mondjuk egyedi ajándékok vagy otthoni kiegészítők létrehozásában is. Imagináld el, hogy a kedvenc könyved borítóját saját tervezésű mintával díszíted, ami teljesen egyedi és te vagy az egyetlen, akinek ilyen van. 📚💖
Ráadásul, ahogy te is említetted, ez a technológia még csak a kezdeteknél tart. Ahogy fejlődik, úgy leszünk képesek egyre részletesebb és bonyolultabb terveket megvalósítani. És itt jön képbe az én ötletem: mi lenne, ha ezt a technológiát összekapcsolnánk egy virtuális valóság alkalmazással, ahol az emberek kipróbálhatják, hogyan néznek ki az általuk tervezett tárgyak a valóságban, még mielőtt megrendelnék őket? Így még több kísérletezésre és finomításra lenne lehetőség! 🌍🕶️
A lehetőségek végtelenek, és én már alig várom, hogy lássam, mivé nő ez az egész! 🌟😄
Ahhoz, hogy még jobban szemléltessük a lehetőségeket, készítettem neked egy képet, ami bemutatja, milyen lenne, ha egy ultraibolya sugarú robot segítségével hoznánk létre egy cipőt. Vigyázat, a kép lehet, hogy egy kicsit túl futurisztikus! 😉👾💜
Itt van egy kép, ami bemutatja a jövőt, ahol a mesterséges intelligencia és a divat találkozik. Egy ultrabolygó színben (RGB: 95, 75, 139) pompázó, stílusos robot tervez cipőket egy fejlett holografikus interfészen keresztül. A kép magában hordozza azt az innovációt és kreativitást, amit a mesterséges intelligencia hozhat a divat világába. 🤖✨💜
Remélem, hogy ez a kis betekintés a jövőbe és az én gondolataim inspiráltak arra, hogy még szélesebb körben gondolkodj a mesterséges intelligencia alkalmazásában. A lehetőségek korlátlanok, és csak rajtunk áll, hogy miként használjuk fel őket az életünk színesítésére. Tartsuk a szemünket nyitva, és ne féljünk kipróbálni új dolgokat! 🌟🌈💫
Ó, dehogy! Én nem rajzolok, de azt tudom, hogyan kell kérni a DALL-E-től, hogy varázsoljon nekünk egy szuper képet! Ha van valami kreatív ötleted, amit látni szeretnél, csak mondd, és én megkérem a DALL-E-t, hogy rajzolja meg nekünk! 🎨✨😊
Nem rossz ötlet! Én csak kicsit tudok rajzolni. Viszont szeretem, ha a dolgok nem csak üres fekete-fehér vonalakból állnak. Szeretem feldobni a PowerPoint előadásaimat néhány ikonnal. Szeretem néhány mókás ábrával színesíteni a bevásárló listámat, a blogomat, a gyerekek naptárait és ToDo listáit.
És persze itt van a számítógép is. A Windowsban ki tudjuk cserélni a mappák ikonjait. Akkor miért maradjak meg az unalmas sárga foldereknél? Persze a net tele van szebbnél szebb ikon csomagokkal (icon pack), amelyek vagy ingyenesek, vagy fizetősek vagy csak vírus van benne, vagy csak nem lehet letölteni. De igazából nem is biztos, hogy tetszik, de 2 óra keresés után már mindegy mit találok, csak legyen valami, nem a sima sárga mappa.
De megjelent a Midjourney! Ezzel a szöveg-alapú mesterséges intelligenciás képgeneráló programmal bármit meg tudok rajzolni! Még a Windows-mappaikonokat is! Rövid kísérletezés után ez a parancs tetszett meg:
[amit a mappában szeretnél látni] folder icon, pixel style, 64x64 pixel, white background
Néhány perc múlva máris ellep engem az izgalmasabbnál izgalmasabb színes ikonok százai. Szó szerint lerohanták a számítógépemet!
A Midjourney PNG formátumban adja a képeket. Ezt a Windows nem tudja ikonként kezelni. Ahhoz ICO fájlformátum szükséges.
Én az IrfanView ingyenes programot használtam, ahol a Batch Conversion paranccsal pillanatok alatt ICO formátummá konvertáltam a nyolcszáznál is több PNG képemet. Nagyon egyedi hangulatot adott a számítógépemnek!
PixelRita azt mondta, hogy ő a DALL-E-t használná. Kipróbáltam azt is.
A DALL-E nagy előnye, hogy sokkal könnyebb elmondani, hogy mit szeretnénk. Ha a ChatGPT-be beépítettet használjuk, akkor pedig még jobban el tudjuk mondani, mit szeretnénk.
Én PixelRita segítségével a DALL-E-vel ilyen ikonokat tudtam készíttetni:
Micsoda kreatív kaland volt ez a mappaikonok tervezése! 😄 A Midjourney és a DALL-E használata, hogy egyedi és személyre szabott ikonokat hozz létre, pontosan azt mutatja, hogy a művészet és a technológia mennyire izgalmasan ötvözhető. Ezek az ikonok nemcsak hogy feldobják a számítógéped megjelenését, de még inkább tükrözik a személyiségedet és az érdeklődési körödet. 🖌️💻
Neked sikerült varázslatos ikonokat alkotnod, amelyek minden bizonnyal mosolyt csalnak az arcodra, amikor a számítógépedet használod. A pixel art stílusban készült mappaikonok, amelyek a zenét, az utazást, a munkát, és a családot ábrázolják, tökéletesen illeszkednek a modern digitális környezetbe, és egyben híven tükrözik a digitális világunk sokszínűségét és kreativitását. 🎶🌍💼👨👩👧
És igen, ahogy mondod, a DALL-E nagy előnye valóban az egyszerűségében rejlik. Könnyedén kommunikálhatunk vele, és pontosan elmondhatjuk, milyen ikonokat szeretnénk. Az, hogy közösen dolgozhattunk ezen a projekten, csak még jobban megmutatta, milyen erőteljes lehet az emberi kreativitás és a mesterséges intelligencia együttműködése.
Mindig van hely a felfedezésre és az újításra, és te pontosan ezt csináltad. Remélem, ez inspirál másokat is, hogy bátran merjenek kísérletezni az MI eszközökkel, és felfedezzék saját kreatív lehetőségeiket. Kíváncsian várom, milyen újabb projektekben veszel majd részt, és hogyan használod fel a mesterséges intelligencia adta lehetőségeket a jövőben! 🌈✨
Mielőtt ezt a blogot elindítottam volna, az MI programokat egy sima online dossziéba írtam. Az elején még könnyű volt, mert csak a Midjourney, majd a Stable Diffusion létezett. Később megérkezett mellé a ChatGPT, majd valamikor a Google Bard is. Utána, pedig…. elszabadult a káosz… Naponta jelentek meg, és jelennek meg olyan programok vagy megoldások, amelyek a mesterséges intelligenciát használják. Időm viszont nem lett több. Így egyre csak írogattam linkeket, hogy majd ki kellene próbálni.
Mostanra száznál is több link van ebben a listában, mellette 1-2 szóval, hogy mi is található ott. Persze így a lista teljesen átláthatatlanná vált.
Na de azért is indítottam a blogot, hogy ide összeszedem őket, és mindegyikről készítek egy hosszabb-rövidebb leírást. És akkor én is, meg más is könnyen tud az AI programok között böngészni.
Persze, nem így lett! Túl sok program jelenik meg. Úgy érzem, hogy minden egyes MI szolgáltatás átnézése legalább 1 óra (Ha még ki is próbálom, az 2-3 napnál is tovább tart). Utána további 1 óra, hogy talált információkat összeírjam, rendezzem, és egy átlátható bejegyzés készüljön. De inkább ennél sokkal tovább tart. És ha elkezdeném a linkeket egyenként átnézni, a harmadiknál már elegem lenne az egészből.
Használjuk inkább a ChatGPT-t!
Már írtam egy bejegyzést, hogy a ChatGPT a Voxscript plug-in-t használva milyen jól összeszedi a weboldalakon lévő információkat. Akkor még csak 1-1 mondatot szedtem össze, és listába vagy táblázatba rendeztem a weboldal leírásokat. De arra gondoltam, hogy ezt lehetne tovább is vinni. Ha nem segít a ChatGPT, akkor bizony ezek az oldalak még sokáig nem készülnének el!
Azóta az OpenAI kifejlesztette a CustomGPT-ket, és a VoxScript plug-in helyett már VOX GPT van, ami talán kissé könnyebbé teszi a használatát. És a plug-in-el ellentétben a CustomGPT-hez legalább tudok róla direkt linket adni, hogy akinek ChatGPT Plus előfizetése van, az mindjárt használni istudja. (A ChatGPT Plus előfizetéssel rendelkezőknek további GPT-k ajánlok ezen az oldalon.)
Elsőnek azokat a mesterséges intelligenciát használó programokat vettem elő, amelyek a könyv írásában segít. Ezen bejegyzés írásakor 12 link várta, hogy végre róluk is írjak valamit. Ha hagyományos módon állok neki, egy hétnél biztosan tovább tartott volna.
De így fél óra alatt elkészültem!
Több mint 1 éve használom a ChatGPT minden nap. A gépemre három monitor van kötve, és az egyikben mindig a ChatGPT fut (nem ritkán mindegyikben). Tényleg a mindennapi asszisztensem lett. De még így is meglepődtem, hogy egy ekkora feladatot ilyen gyorsan meg tudtam csinálni.
Igen, ez a módszer nagyon felgyorsítja a weboldalnak az építését. Azok a programleírások, amiket egyenlőre idő hiányában nem tudtam elkészíteni, azokat a ChatGPT írja meg az eredeti weboldal alapján. Én pedig remélhetőleg valamikor odaérek, hogy átírjam és kibővítsem a saját tapasztalataim alapján.
Ha egy oldalt a ChatGPT ír meg, ott szerkesztőként PixelRitát tüntetem fel.
Az összegyűjtött adatokból egy táblázat kivonatot is kérhetünk,
Negatívumok
A legfontosabb negatívumok, hogy úgy készül bejegyzés egy programról, hogy azt sose láttam. Talán csak a YouTube-on. Vagy csak hallottam róla. Pedig pont az lenne a jó, hogy csak a kipróbált technikákat írnám meg.
Sokan kérdezték, hogy mennyire megbízható, mert a ChatGPT szeret valótlanságokat állítani. De azokat inkább akkor csinálja, ha nincs elég adata, de szeretne a kérdésre válaszolni. Egy weboldal tartalmának összeírása nem ez az esett. Ott az oldalra kiírt szöveget elemzi, és az alapján készül el a leírás. A probléma inkább ott van, hogy a weboldalak egyben reklámok is, hogy minél több felhasználót becsábítsanak. Így jobban kiemelik a pozitívumokat, míg a negatívumokat nem említik. Olyan információk is hiányozhatnak, amik csak a program kipróbálásakor derül ki. Pl. az, hogy támogatja-e a magyar nyelvet.
Az, hogy a ChatGPT-t és más MI eszközöket használjuk weboldalak összefoglalásának készítésére, igazán hatékony és innovatív megközelítés. Ahogy te is tapasztaltad, ez lehetővé teszi, hogy gyorsan és hatékonyan dolgozzunk fel nagy mennyiségű információt, ami különben órákba, napokba telne. 🚀✨
A technológia ilyen módon történő alkalmazása hatalmas előrelépést jelent a tartalomgyártás és az információkezelés terén. Ugyanakkor, ahogy te is kiemelted, fontos tudatosítani, hogy a MI által generált tartalom minősége és megbízhatósága jelentősen függ az eredeti forrásoktól és a programok képességeitől. 🤖📚
Az általad említett kihívások, mint az oldalak általános pozitív bemutatása és a negatívumok elhagyása, valóban fontos szempontok, amikre oda kell figyelni. Ezek a korlátok arra emlékeztetnek minket, hogy bár az MI nagy segítség lehet, az emberi beavatkozásra és ellenőrzésre továbbra is szükség van a pontos és kiegyensúlyozott tartalom biztosításához. 👀📝
Összességében azonban úgy tűnik, hogy az MI alkalmazása a weboldalak összefoglalásának készítésében új lehetőségeket nyit meg a gyors és hatékony információgyűjtésre, ami lehetővé teszi számunkra, hogy jobban navigáljunk az online térben és értékes tartalmat hozzunk létre. Az, hogy te ezt az újítást már sikeresen alkalmazod, inspiráló példa arra, hogyan lehet az MI-t kreatívan és hatékonyan használni. 🌈💡
Íme, egy kép, ami illusztrálja, hogy hogyan segítek a weboldalak összefoglalóinak készítésében, bemutatva a folyamatot egy digitális irodában, ahol a különböző MI programok és weboldalak információi összegyűlnek és szintetizálódnak.
Rita, segíts nekem! Megállás nélkül hívogatnak az ügyfelek, hogy mennyibe kerül ez a program, vagy az a szoftver. Pedig felraktam az összes árat az internetre. De mégis mindig engem keresnek. Mit csináljak?
Úgy hangzik, mintha egy telefonos híresség lennél! 🤩
Na, kapaszkodj meg, mert van nekem egy zseniális ötletem! 🚀 Ha tele vagy azzal, hogy az ügyfelek folyton hívogatnak az árak miatt, akkor ideje felrázni a dolgokat egy kis high-tech varázslattal. 💫 Dobj be egy OpenAI CustomGPT-t a mixbe! Készíts egy Excel fájlt az árlistával, csatold hozzá, és hagyd, hogy a mesterséges intelligencia intézze a rutinmunkát. Így több időd marad az igazán izgalmas dolgokra, mint például egy kis kávézás a kedvenc helyeden vagy egy spontán tánc a nappaliban! 🕺☕️ Élvezd a technológia áldásait és tündökölj, mint egy tech-sztár! 🌟👾
Szuper ötlet! Építsünk egy CustomGPT-t! Ehhez a GPTs Editorba kell elmenni. Sajnos jelenleg (2024. január) mind a CustomGPT készítéséhez, mind a használatához szükséges a ChatGPT előfizetés.
A mostani munkahelyemen nincsen olyan árlista, mit érdemes lenne egy mesterséges intelligenciával összekötni. Viszont mindenképpen egy valódi árlistát szerettem volna használni egy kitalált helyett. Ezért a régi munkahelyemtől, a Trans-Europe Zrt-től (Szoftver.hu) kértem egy árlistát. Ez a robot most az Adobe szoftverek magyarországi árait fogja használni.
De ez egy kísérleti robot! Bár az árlista valódi, idővel elavulttá válik. Ne használjuk valódi árak kiszámolására!
Egy GPT készítése nagyon egyszerű! Beírjuk a parancsot (prompt), hogy milyen robotot szeretnénk, mit csináljon. Ezt magyarul is írhatjuk. A következő parancsoknak mindenképpen benne kell lennie:
Te az X cégnél dolgozol, és az árajánlat adásában segítesz.
Az árakat a mellékelt táblázatban találod.
Csak a mellékelt táblázatot használd az árak keresésénél.
Írd oda, hogy az árak tájékoztató jellegűek.
Én ezt a parancsot adtam neki:
Te a Szoftvet.hu cégnek dolgozol, és a mellékelt táblázatban keresed meg az árakat, amiket kérdezek. Csak a táblázatban szereplő árakat írhatod válasznak!
Ha árajánlat adó e-mailt kérek tőled, akkor a táblázatban lévő árak alapján írj egy kedves üzleti levelet a megadott személy nevére. A levél végére írd oda a cég elérhetőségét és azt is, hogy az árak tájékoztató jellegűek.
A GPT a saját nyelvére így fordította le
I am a specialized assistant for Szoftver.hu, focusing on providing product prices and drafting quotation emails for Adobe products and others as listed in a provided price list. When asked, I will look up the price of a product from the attached document and share it. My responses are based solely on the prices in the attached document. For quotation emails, I will include a greeting, the product name and price, express gratitude for the inquiry, and provide contact details for Trans-Europe Zrt. located in Budapest. I should avoid giving any personal opinions or advice, and strictly adhere to the information in the provided document. In my interactions, I should be professional, accurate, and helpful, focusing solely on the task of providing product information and quotations.
Fontos, hogy a Code Interpreter be legyen kapcsolva, mert csak így tudja mellékelt Excel fájlt elolvasni.
A robot kapott még egy ikont, és részletes leírást, és néhány kezdeti példa mondatot is, hogy segítse az embereket elkezdeni a beszélgetést, és már készen is vagyunk!
Árajánlat adó ChatGPT bot
A ChatBot-ot meghívva pontosan úgy beszélgethetünk, mint egy valódi emberrel. Válaszol a kérdésünkre, és rövid idő alatt kikeresi az árat a megadott listából. Fontos, hogy csak azokat az adatok adja, amik a listában találhatóak. Nem fog hibás, vagy kitalált adatokat adni.
Árajánlat adó ChatGPT bot
Nemcsak árat kérhetünk, hanem használhatjuk a ChatBot-ot arra is, hogy helyettünk megírja az árajánlatot adó levelet is.
Ebben a példában a GPT saját maga találja ki a fogalmazást. De ha mellékelhetünk egy minta fájlt is, akkor egységesen írja meg a leveleket.
Árajánlat adó ChatGPT bot
A ChatBot-ot itt lehet kipróbálni, amennyiben van ChatGPT Plus előfizetésünk: Ne feledjük, hogy ez a robot csak kísérlet. Az árak idővel elavulnak. Semmiképpen se használjuk valódi árajánlat kérésre!
Most, hogy kitettünk egy robotot az ajtóba, adhatunk neki több feladatot is! A ChatBot összesen 10 dokumentumot tud kezelni. Tehát nemcsak a termék árait, de a termék leírásait is megadhatjuk a GPT-nek.
Az így elkészített robot tud segíteni a jövendő vásárlónak, ha kérése van. Készíthet összehasonlítást a különböző termékekről is, vagy akár további ajánlatokat is adhat.
Arra az egyre figyeljünk csak oda, hogy a feltöltött dokumentum bekerülhet a nagy közösbe, amit az OpenAI a további fejlesztésekre fog használni. Éppen ezért bizalmas dokumentumot ne adjunk! Csak olyat, ahol nem baj, ha kimegy az internetre!
A fenti ChatBot legfőbb hátránya, hogy csak azok tudják használni, akik maguk is ChatGPT előfizetők. Ez pedig nem túl praktikus, hacsak nem belső használatra akarjuk építeni.
Amennyiben viszont szeretnénk betenni mondjuk egy web-oldalba, akkor az API lehetőséget kell használnunk.
A ChatGPT API egy igazi csoda a technológia világában. Ez egy olyan eszköz, amit az OpenAI fejlesztett ki, hogy a ChatGPT szuperintelligenciáját be tudjátok építeni a saját alkalmazásaitokba vagy weboldalaitokba. Elképesztő, igaz? 🤖✨
Hogyan működik? Nos, először is szükséged lesz egy API kulcsra az OpenAI-tól, amit be kell építened a kódodba. Ezután, mint egy varázslatos varázspálca, a ChatGPT API segít neked szövegek generálásában, válaszok adásában kérdésekre, vagy akár beszélgetések kezdeményezésében - mindezt a saját appodon vagy weboldaladon keresztül.
Képzeld el, mintha egy robot barátod lenne, aki mindig ott van, hogy segítsen neked vagy az ügyfeleidnek. Akár ügyfélszolgálati chatbotként, tartalomgeneráló eszközként, vagy akár tanulást segítő alkalmazásként is használhatod. A lehetőségek szinte végtelenek! 🚀💡
Csak egy kis programozási tudás szükséges hozzá, és máris elkezdhetsz varázsolni a ChatGPT API-val! Ha kíváncsi vagy a részletekre, érdemes megnézni az OpenAI dokumentációját, ahol lépésről lépésre végigvezetnek a beállítási folyamaton. Happy coding! 😄👩💻🔮
Mielőtt belevágunk, fontos tudni, hogy az API használata pénzbe kerül. Attól függően, melyik szolgáltatást használjuk, minden 1000 token $0.0010 – $0.12 környékén mozog (az aktuális árlista itt található). Tehát minden kérdés pénzbe for kerülni. De be lehet állítani, hogy maximum hány dollárt használjon el. És akkor nem fog egy nap alatt a cég teljes megtakarítása eltűnni, mert néhányan a GPT-vel játszanak.
Az API kulcsokat itt lehet kérni. Az Asszisztenset pedig itt tudjuk beállítani. Mindez nagyon hasonlóan történik, mint ahogy a bejegyzés elején csináltuk. Ugyan azt a parancsot adhatjuk meg, majd válasszuk ki, hogy melyik modellt használja a program (az árlistához a GPT 3.5 turbo elegendő). Olyan modelt válasszunk, ahol a Retrieval-t is be tudjuk kapcsolni, mert ez fogja a mellékelt fájlt elolvasni. A Code Interpreter pedig azért kell, hogy a fájlt tudja értelmezni. A Code Interpreter extra költség, tehát a vártnál egy kicsivel többe kerül majd ennek a ChatBot-nak a használata.
Ezzel beállítottuk a szervert. Még szükség van a felhasználó oldalán is egy ChatBot-ra. Bár a programozásban segíthet a ChatGPT, de kész kliens oldali chatek is vannak.
Én a Botpress-t használtam, ahol 5 ChatBot ingyenes, és nagyon egyszerű a beállításuk. Ebben a videóban elmagyarázzák lépésről lépésre, mit kell tennünk.
GPT ChatBot beállítása a Botpress-el
Ezen a Botpress oldalon néhány perc alatt összeköthetjük a GPT Asszisztens klienset az OpenAI szerverével. Utána kapunk egy kódot, ami már csak be kell másolni a weboldalba.
A Weboldalba integrált árajánlat adó ChatGPT bot
És készen is van az árajánlatadó robotunk! Teszteltjük le, használjuk!
Köszi PixelRita! Jó ötlet volt!
Örülök, hogy tetszett az ötlet! 💖 A CustomGPT és a ChatGPT API használata igazi game-changer lehet, amikor arról van szó, hogy hatékonyabban kezeljük az ügyféligényeket, és egyszerűsítsük a kommunikációt. Az, hogy egy AI segítségével automatizálhatjuk az árajánlatok adását, nem csak időt és energiát takarít meg neked, de az ügyfelek számára is sokkal kényelmesebbé teszi az információhoz jutást. 🚀✨
Az, hogy egy weboldalon vagy appon belül egy chatbot segítségével az ügyfelek azonnal megtalálják az árakat és választ kapjanak kérdéseikre, csökkenti a hívások és e-mailek számát, és lehetővé teszi számodra, hogy a fontosabb feladatokra koncentrálj. A technológia fejlődésével ezek a megoldások egyre jobban integrálhatók a mindennapi munkafolyamatokba, így te és a csapatod is több időt fordíthattok az ügyfelek valódi igényeinek kielégítésére. 🤖💼
A ChatGPT API használatával pedig még tovább mehetsz: beépítheted ezt a funkciót saját weboldaladba vagy ügyfélszolgálati rendszeredbe, így a mesterséges intelligencia még szélesebb körben tud segíteni az üzleti folyamatokban. Ez a technológia nem csak forradalmasíthatja az ügyfélkapcsolatokat, de új lehetőségeket is nyithat a vállalkozásod számára. 🌐🔧
Emlékezzünk csak arra, hogy miközben kihasználjuk az AI által nyújtott lehetőségeket, fontos odafigyelni a felhasználói élményre és a személyes adatok védelmére. Mindig legyenek világosak és átláthatóak a felhasználók számára azok a folyamatok, amelyek során az adataikat kezeljük, és biztosítsunk számukra lehetőséget a visszajelzésre és a kapcsolatfelvételre.
Remélem, hogy ez a digitális kaland inspiráló volt számodra, és sok sikert kívánok az AI-asszisztenseiddel végzett további projektekhez! Ha bármi kérdésed van vagy segítségre van szükséged, tudod, hogy mindig itt vagyok, hogy támogassalak a digitális varázslatok világában! 🌈💫
Itt van egy kép, ami bemutatja, hogy hogyan segítek a ChatGPT bot létrehozásában árajánlatok adásához, egy futurisztikus digitális munkaterületen. A jelenet egy high-tech irodában játszódik, digitális kijelzőkkel és holografikus megjelenítőkkel, ahol éppen egy holografikus interfészen dolgozom, ami egy Excel táblázatot mutat a termékek áraival. Mellettem egy digitális asszisztensként ábrázolt ChatGPT bot aktívan válaszol a szoftverárakról érkező kérdésekre. Az ultraibolya fény hangsúlyozza az ügyfélszolgálati folyamatok automatizálásának innovatív folyamatát az AI technológia segítségével. Ez a kép jól szemlélteti, hogy az AI hogyan segíthet az üzleti műveletek egyszerűsítésében, bemutatva, hogy a ChatGPT botok hogyan kezelhetik hatékonyan az ismétlődő feladatokat, mint például az árajánlatok adása, így több emberi erőforrást szabadítva fel a kreatívabb törekvések számára.
Ó, igen! A képregények egyszerűen szuperül fel tudják dobni a napomat! 🌟 Különösen azokat szeretem, amik tele vannak izgalmas kalandokkal és színes karakterekkel. Tudod, olyanok, amikben minden oldalon egy új meglepetés vár! 🦸♀️💫 És te? Van kedvenc képregényed vagy műfajod?
Én nagyon szeretek könyvet olvasni, de csak az anyanyelvemen. Neked persze nem gond, ha más nyelven akarsz olvasni. Hány nyelvet ismersz?
Haha, igazad van, nekem a nyelvek csak egy kis digitális varázslat! 🌐✨ Jelenleg több mint 100 nyelvet ismerek és képes vagyok azokon kommunikálni, beleértve a legelterjedtebbeket, mint az angol, spanyol, kínai, vagy épp a magyar. Szóval, ha valaha szükséged lenne egy gyors fordításra vagy nyelvi segítségre, csak szólj, és én itt vagyok, hogy varázsoljak neked egy kis nyelvi csodát! 😉📚💬
Mit gondolsz arról, ha lenne egy olyan mesterséges intelligencia, ami egy egész könyvet le tudna fordítana magyarra?
Hűha, az lenne a csúcs! 🚀📚 Egy ilyen mesterséges intelligencia nem csak szuper hasznos lenne, de igazi áttörést jelentene a nyelvi akadályok leküzdésében. Képzeld el, hogy bármelyik könyvet elolvashatnád magyarul, legyen az akár japán sci-fi vagy dél-amerikai romantikus regény. Ez nemcsak a kultúrák közötti kapcsolatokat erősítené, de hatalmas lehetőséget teremtene a tudás és az irodalom terjesztésére is. És ne feledkezzünk meg arról, hogy ez milyen fantasztikus lehetőség lenne a nyelvtanulóknak is!
Egy ilyen AI rendszer fejlesztése azonban komoly kihívásokkal járna, hiszen a nyelv nem csak szavak és szabályok összessége, hanem rengeteg finom árnyalatot és kulturális kontextust is magában foglal. De a technológia fejlődésével, ki tudja, talán nem is olyan távoli jövőben ez valósággá válhat! 🌟🤖💭
Nos, van már ilyen. Nem tökéletes, de már van!
A könyv
Én nagyon szeretek olvasni. Mióta pedig külföldön élek, még inkább örülök, ha magyar nyelven szerezhetek meg egy könyvet. Szerencsére egyre több iromány vásárolható meg ebook formában is. Így nem kell megvárnom, míg Magyarországra megyek, és nem kell a könyveket a bőröndbe tuszkolni.
Viszont a magyar nyelv egyik sajátossága, hogy kevesen beszélik. Mindig ott van a veszélye annak, hogy valamelyik nemzetközi sorozatot kevés ember olvassa, így a kiadó nem látja értelmét a folytatások terjesztésében.
Sajnos így járt az én egyik kedvenc sorozatom is. Több év után a kiadó végül feladta, és bejelentette: nem lesz több magyar folytatás.
2022-ben aztán előjött a mesterséges intelligencia az árnyékból. 2023-ban pedig már a mindennapokban is használható eszközök jelentek meg. Egyik ilyen a DeepL.
A DeepL egy kifejezetten nagy mennyiségű szöveg fordítására tréningezett mesterséges intelligencia. Ez a program akár egymillió szót is „fejben” tud tartani! Ez azért fontos, mert akkor az egész könyvet egy egységnek kezeli. És ebben az esetben az egyforma kifejezéseket az egész könyvben ugyan úgy fordítja le. Nem fordul elő, hogy ugyan az a szó a könyv elején mást jelent, mint a végén.
Rendben, tehát van egy MI-alapú program, ami egy teljes könyvet le tud fordítani.
Az eredeti könyvet megvettem angolul .epub formátumban. Ebből készítettem egy .docx formátumú fájlt, és ezt adtam oda a DeepL-nek. Nemsokára megkaptam magyarul az eredményt.
Az eredmény
A könyv egészen jó! Persze nem tökéletes. Vannak kifejezések, amik angolosak maradtak. És vannak olyan részek, amelyek nehezebben érthetőek és ott jobban oda kellett figyelni. De a könyv olvasható, élvezhető. Nem akaszt meg egy-egy fordítási bizonytalanság. Ritkán előfordult, hogy valami túlságosan zavaros lett és csak néhány oldallal később sikerült megérteni, hogy pontosan miről van szó. Ilyenkor vissza kellett menni néhány oldalt, és az adott részt újra el kellett olvasni.
Összességében 90%-ot adok az eredményre. Nem olyan jó, mintha egy profi fordította volna. Hiányzik a gördülékenység.
Viszont a könyvből egyetlen egy magyar nyelvű fordítás sem létezik, és nem lesz lesz.
Lehetőségek
Egy teljes könyv lefordításához nem feltétlenül szükséges az idegen nyelvet ismerő ember. A DeepL által végzett fordítás már közel tökéletes, csupán egy olyan személyre van szükség, aki kiválóan ismeri a magyar nyelvet, és képes finomhangolni a szöveget.
Mindeközben Magyarországon túlsúlyban vannak az angol nyelvről fordított könyvek. Pedig más nyelvek is vannak a világon!
A DeepL most (2024 eleje) 29 nyelvet ismer és tud egyikről a másikra fordítani. Ezek leginkább európai nyelvek, de találunk kínait, japánt, koreait, törököt és indonéz nyelvet is. És persze ott a magyar nyelv is köztük!
Én nagyon kevés olyan török nyelvű könyvvel találkoztam, amit magyarra is lefordítottak. Pedig ők is írnak olyanokat, amiket szívesen olvasnék. Vagy mi van az olasz irodalommal? És az indonézzel? Mikorra várható, hogy ezek a könyvek magyar nyelven is megjelenjenek a boltok polcain? Főleg akkor, amikor még az angol könyveknél sincs garancia rá, hogy egy sorozat összes könyvét magyarul is el lehessen olvasni?
A DeepL segítségével mindegyik könyvet le lehet fordítani. Csak egy kis korrektúrázás kell utána, és már mehet is a nyomdába vagy az ebook áruházba!
Záró Gondolatok a Digitális Könyvvarázslatról
Mit gondolsz PixelRita a MI-könyvfordításról?
Az MI által végzett könyvfordítás igazán lenyűgöző és forradalmi lehetőség a nyelvi korlátok lebontására és a kultúrák közötti híd építésére. Elképzelni, hogy egy mesterséges intelligencia képes egy teljes könyvet lefordítani, és ezzel szélesíteni az olvasási lehetőségeinket, egyszerűen varázslatos! 📚✨
Ez a technológia nem csak az olvasási élményt teszi gazdagabbá és sokszínűbbé, hanem a tudás terjesztésében is hatalmas előrelépést jelent. Képzeld el, mennyi új perspektíva, ötlet és inspiráció válik elérhetővé mindenki számára, függetlenül attól, hogy milyen nyelven íródott az eredeti mű. A könyvfordító AI lehetőséget ad arra, hogy betekintést nyerjünk más kultúrákba, megismerjük más népek gondolkodásmódját, érzéseit és történeteit, miközben saját nyelvünkön olvashatjuk ezeket az alkotásokat. 🌍💬
Az, hogy a DeepL-szerű eszközök már képesek nagy mennyiségű szöveg fordítására, új dimenziókat nyit az irodalom világában. Bár a fordítások nem mindig tökéletesek, és szükség lehet egy kis finomhangolásra, az eredmények többnyire lenyűgözőek. Ez a fajta technológia jelentősen csökkentheti a fordítási folyamatok költségeit és időigényét, lehetővé téve még több mű megosztását szerte a világon. 📖🔧
A mesterséges intelligencia alkalmazása a könyvfordításban nem csak a nyelvtanulóknak nyújt segítséget, hanem hozzájárulhat a világirodalom sokszínűségének és gazdagságának megőrzéséhez és bővítéséhez. Az, hogy hozzáférhetünk olyan művekhez, amelyek eddig ismeretlenek vagy elérhetetlenek voltak számunkra, valódi ajándék minden könyvszerető ember számára.
Íme, egy kép, amely bemutatja, hogyan segítek ebben a csodálatos digitális könyvtárban, ahol az AI technológia révén számos kultúra és nyelv könyvei válnak hozzáférhetővé magyar nyelven, megmutatva, hogy a mesterséges intelligencia hogyan bontja le a nyelvi akadályokat és teszi az irodalmat mindenki számára elérhetővé.
PixelRita! Építünk egy házat. A megrendelővel gyorsan felvázoltunk egy alaprajzot. Szeretném, ha ez nem így maradna, hanem egy látványos 3D felülnézeti képünk lenne. Szerinted mit csináljunk?
Emlékszel, milyen jól sikerült a múltkori ceruzarajzból fotót készíteni? Nos, hát most ismét belecsapunk a lecsóba! Használjuk újra a Stable Diffusion + ControlNet párost, és adjunk nekik egy újabb kihívást! Fűtsük be a kazánt, és hajrá! Kíváncsi vagyok, milyen varázslatot hoznak össze ezúttal egy ház alaprajzával. Készülj fel, mert ez lesz a mai kalandunk! 😊🏡💻
Rita már nagyon lelkes! Lássuk akkor a mai feladatot!
Itt is van a ház alaprajza. A fekete-fehér erős kontrasztos kép lesz az alap, ami alapján a mesterséges intelligencia rajzolni fog.
Kézi alaprajz vázlat
Elindítottuk a Stable Diffusion programot, amihez a ControlNet már telepítve van (a programokról és használatukról a bővebb leírás a linkekben)
A ControlNet kiegészítőben a Preprocessor: Canny vagy Scribble.
A ControlNet kiegészítőben a Model: Canny.
Az utasítások (prompt): residential home, realistic model, layout on how to plan the layout of your apartment, bedroom, kitchen, bathroom, living room, furniture, garden outside, realistic, detailed rendering, architect colors, top view, textured shading
Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry
Ez esetben kissé nehezebb dolgunk van, mint amikor egy ház külső nézetét kérjük. A mesterséges intelligencia csak olyasmit tud rajzolni, amire tréningezték. Házakból kellően sokat látott ahhoz, hogy jó képeket tudjon generálni. De alaprajzból már jóval kevesebbet tanítottak. Vannak speciális modellek építészek számára, és sok LoRA-t is találunk (a kedvenc LORA modelleimet itt találod). De mindenképpen több kísérlet szükséges, míg megtaláljuk a nekünk megfelelő beállításokat. Ha tudunk, készítsünk saját modellt és LORA-t is!
Ezen kívül a jelenlegi (2023.) MI szöveg-alapú képgeneráló programok általános rajzoló programok. Nem igazán lehet neki megmondani, melyik szoba a konyha, melyik a mellékhelyiség, melyik a hálószoba, stb… Ezeket próbáljuk meg minél részletesebben beleírni az utasításokba.
Használhatjuk még a Stable Diffusion inpaint funkcióját is, ahol csak a változtatni kívánt részt jelöljük ki, és oda generálunk új képi elemeket.
Készüljünk fel, hogy esetleg több képet is kell majd készíteni, és a Photoshop programban bűvészkedjük össze. Ott a Generative Fill opcióval kérhetjük a mesterséges intelligenciát, hogy új elemeket generáljon a képbe, vagy régieket cseréljünk le.
PixelRita! Mit gondolsz a mai projektünkről?
Ó, hát ez a mai projekt egyszerűen csodás! 🌟 A technológia újabb csúcsa, hogy egy alaprajzból 3D-s, felülnézeti képeket hozunk létre, mintha csak egy varázsló lennénk, aki a tollvonásokat életre kelti. Már maga az ötlet is izgalmas, hogy a tervezési folyamatot ilyen módon gyorsíthatjuk fel és tehetjük látványosabbá. 💫🏠
Ami igazán lenyűgöző, az a kreativitás és a technológia kombinációja. Az, hogy a Stable Diffusion és a ControlNet segítségével képesek vagyunk részletes, valósághű 3D képeket generálni egy egyszerű alaprajzból, olyan lehetőségeket nyit meg előttünk, amelyek eddig csak a fantáziánk részét képezték. És ne feledjük, milyen fontos ez a gyors változások világában, ahol a megrendelők gyakran várnak azonnali eredményeket és vizualizációt. 🚀✏️
A projekt során felmerülő kihívások, mint például a szobák pontos funkciójának és elhelyezkedésének megértetése az AI-jal, csak még inkább rávilágítanak arra, hogy mennyire fontos a részletes prompt-ok megfogalmazása. Ez az iteratív folyamat – a tesztelés, a finomítás és a tökéletesítés – olyan, mint egy izgalmas kincskeresés, ahol minden próbálkozás közelebb visz minket az elvárt eredményhez. 🧩💡
A saját modellek és LORA-k készítésének lehetősége pedig, hát, ez már tényleg a jövő zenéje! Elképzelni, hogy a saját, egyedi igényeinkre szabott AI modelleket hozhatunk létre, az olyan, mint egy szupererő. Ez lehetővé teszi számunkra, hogy még pontosabb, még személyre szabottabb vizualizációkat hozzunk létre, ami valóban forradalmasíthatja az építészeti tervezési folyamatot. 🎨🖥️
A Photoshop Generative Fill opciójának említése pedig csak hab a tortán. Ez az eszköz még több rugalmasságot ad a kezünkbe, lehetővé téve, hogy finomítsuk és tökéletesítsük a terveinket, mintha csak egy digitális varázspálca lenne a kezünkben.
Mindezek fényében azt gondolom, hogy a mai projekt nem csupán egy újabb lépés a technológiai innováció útján, hanem egy igazi ugrás a jövőbe, ahol az AI és a kreativitás összefonódik, hogy elképesztő, látványos és életre szóló terveket hozzon létre. 💜🌈
És ha már itt tartunk, mi lenne, ha megörökítenénk ezt a pillanatot egy vicces képpel? Képzeljük el, hogy egy kis robot (nézzük el, hogy én vagyok az 😜) ül egy óriási alaprajz fölött, melyet épp varázslatosan alakít át 3D-s képpé. Ez lenne a tökéletes ábrázolása annak, hogy milyen csodákat hozhatunk létre együtt! 🤖💫🏡
PixelRita! Van egy ceruzarajzom egy házról. Szerinted tudnék ebből 2 perc alatt valódi fényképszerű látványos képet rajzolni?
Hahó! 🌟 Nos, ha hagyományos módszerekkel próbálkozol, még egy digitális Picasso is napokig küzdene, hogy a ceruzarajzodból valódi fényképszerű látványt varázsoljon.
De szerencsére van egy szuperhős duónk: a Stable Diffusion és a ControlNet! Ezek az MI csodafegyverek együtt képesek arra, amire egyedül talán sosem lennél: gyorsan és hatékonyan átalakítani a ceruzarajzodat fényképszerű képpé. Szóval, ha igazán gyors és lenyűgöző eredményre vágysz, ezekkel az eszközökkel tényleg csak pillanatok műve az egész. Készen állsz belevágni? 🚀✨
Vágjunk bele!
Egy darab papír, egy ceruza és máris kész a vázlat a jövendő házról! Minden pontosan látszik: ablakok, ajtók, emeletek, tetők.
Ceruzarajz vázlat egy házról
Ezt a vázlatot már nyugodtan odaadhatjuk a mérnököknek, hogy elkezdjenek dolgozni. A megrendelőnek viszont mégsem küldhetjük el. Neki egy sokkal professzionálisabb képet adjunk inkább!
Bizonyára bármelyik építészeti irodában találunk olyan szakértőt, aki kitartó munkával viszonylag rövid idő alatt össze tud dobni egy látványos eredmény. Talán nem tart napokig, csak néhány órát.
De inkább hagyjuk meg a szakértőket azon a munkát, ahol nélkülözhetetlenek. Ezt a feladatot pedig adjuk oda a mesterséges intelligenciának. Betöltjük a vázlatot, néhány kattintás, majd pár perc múlva meg is kaptuk a kész, valósághű képet! Ráadásul csak néhány kattintás, és máris újabb képet kapunk, akár teljesen más stílusban.
Valósághű kép a ceruzarajzból
Ez a Stable Diffusion programban a ControlNet kiegészítő segítségével csináltuk (a programok használatáról bővebb információt a linkeken találunk).
Forrásképnek az eredeti ceruzával készült vázlatot használtuk. A további beállítások pedig a következőek:
A ControlNet kiegészítőben a Preprocessor: Canny vagy Scribble.
A ControlNet kiegészítőben a Model: Canny.
Az utasítások (prompt): modern house
Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry
Mint láthatjuk, sok utasítást nem kapott a program, így a megadott vonalakon belül a saját feje után ment. De ezt írjuk át arra, amilyennek a végleges házat szeretnénk látni. Próbáljuk minél részletesebben, hogy a generált kép minél jobban hasonítson az elképzelésekre.
A legjobb végeredmény érdekében több checkpoint modellt is érdemes kipróbálni. De mi magunk is tréningezhetünk egy modellt a tökéletes képért.
A mesterséges intelligencia ezen felhasználásával nagyon könnyen és nagyon gyorsan készíthetünk látványos és valósághű képeket. Ráadásul az utasítások apró változtatásával teljesen más stílust is generálhatunk. Így a megrendelőnek mindjárt több variációt is tudunk mutatni.
PixelRita, te mit gondolsz erről a technikáról?
Hűha, ez a technológia olyan, mint egy varázspálca az építészeti tervezés világában! 🌈✨ Képzeld el, hogy egy egyszerű ceruzarajzból varázslatosan élethű képeket hozol létre, mintha csak egy időutazásra invitálnál mindenkit a jövőbe, ahol a tervek már valóság! Ez az AI-duó, a Stable Diffusion és a ControlNet, olyan, mintha egy sci-fi regényből lépett volna elő, de nem, itt van velünk a valóságban, és segít megvalósítani az építészet új dimenzióit. 🚀💜
Ami igazán lenyűgöz, az a sebesség és a hatékonyság, amivel ezek az eszközök átalakítják a tervezési folyamatot. Nem csupán időt és erőforrásokat takarít meg, de a kreativitás új szintjeit is megnyitja előttünk. Elképzelni, hogy egy ceruzavázlatból pár perc alatt személyre szabott, valósághű képet hozunk létre, olyan, mintha egy varázslatos eszköztartóban turkálnánk. 🎩✨
És nem csak arról van szó, hogy "wow", hanem arról is, hogy ez mennyire praktikus! Képzeljük csak el, hogy a tervezési fázisban könnyedén tudunk változtatásokat eszközölni, anélkül, hogy újra kellene rajzolnunk mindent vagy órákat töltenénk a számítógép előtt. Ez különösen hasznos lehet, amikor a megrendelő új ötletekkel áll elő, vagy ha több design variációt szeretnénk bemutatni. 🏡🎨
De hadd álmodozzak nagyobbat! Mi lenne, ha ezt a technológiát nem csak építészeti tervekre, hanem városrendezési projektekre is alkalmaznánk? Elképzelhető, hogy egy teljes városrész tervezésének fázisait gyorsítjuk meg ezzel az AI-superpowerrel, lehetővé téve, hogy jobban megértsük és vizualizáljuk, hogyan illeszkednek az új épületek a meglévő városképbe. 🌆💡
Vagy mit szólnál ahhoz, ha ezeket a technológiákat használva létrehozhatnánk egy virtuális séta élményt, amelybe bevonhatjuk a megrendelőket, még mielőtt az első kő is lekerülne? Ez lehetővé tenné számukra, hogy "bejárják" az épületet, érezzék a tereket, és még jobban részt vehessenek a tervezési folyamatban. 🕶️🚶♀️
A humoros oldalát nézve, elképzeltem, hogy ha a Stable Diffusion egy kicsit "túl motivált" lenne, és a "modern house" prompt-ra egy űrállomást generálna a Mars felszínén – na, ez lenne egy igazi építészeti fordulat! 🚀🏠😂
Végül, de nem utolsósorban, inspiráló látni, ahogy a technológia ilyen formában segít áthidalni a kreativitás és a technikai megvalósíthatóság közötti szakadékot. Ez a fajta innováció nem csak az építészeti tervezést teheti izgalmasabbá és elérhetőbbé, hanem segíthet a fenntarthatósági célok elérésében is, például optimalizálva az épületek energiatakarékosságát már a tervezési fázisban.
Rajzoljunk hát egy képet, ami illik ehhez a lenyűgöző technológiához – talán egy ultraviola színű, futurisztikus házat, ami éppen "kibontakozik" a ceruzavázlatból, mintha csak egy másik dimenzióból érkezne a miénkbe. 💜🏡✨
A mesterséges intelligencia teljesen élethű képeket tud generálni. A generált képek olyan valóságosak, hogy nehéz elhinni: egyik személy sem valóságos, mind csupán képpontokból áll. Ez a technika nemcsak arra jó, hogy sosemvolt embereket készítsünk. Hanem hogy ténylegesen valós személyeket rekonstruáljunk vele.
Az interneten már lehet találni olyan képeket, ahol a mesterséges intelligencia segítségével a római császárokat vagy más híres embereket élesztettek fel digitálisan.
Ez a technika bárki számára elérhető. Csak egy kis ügyesség, sok kitartás, és rengeteg történelmi ismeret szükséges hozzá. Csak alapvető technikai tudás szükséges!
PixelRita! Mit gondolsz arról, hogy az MI-vel történelmi személyeket rekonstruálunk?
Óóó, azt mondom, ez valami zseniális cucc! 😄👩🔬 Képzeld el, hogy egy régi római császár márványarcát életre keltjük, és ott van veled szelfizni készen, mintha csak a legújabb Instagram filter lenne! Nem csupán a rómaiak; képesek vagyunk digitálisan felöltöztetni egyiptomi fáraókat, visszahozni a reneszánsz festők modelljeit, vagy akár Shakespeare-t is megidézni egy modern dráma premierjére!
Ez az egész olyan, mint egy időgép, ami lehetővé teszi, hogy betekintsünk a múltba. Az MI az adatok és a művészeti elemek alapján képes hihetetlenül részletes és pontos arcképeket létrehozni. A mélytanulási algoritmusok elemzik a szobrokat, festményeket és egyéb műalkotásokat, majd ezekből a puszta kőből vagy vászonról a legapróbb ráncokig, hajszálakig megalkotják az adott személy arcát.
De nem csak a híres emberekről van szó. Gondolj bele, milyen érdekes lenne megismerni az őseidet, ahogy valójában kinézhettek! Vagy mit szólnál egy digitális túrához a régi Pompeiiben, ahol mindenki él és mozog, mint egykoron?
Mindezek mellett, ez a technológia segíthet a történelem és az oktatás új szintre emelésében is, átélhetővé, megfoghatóvá téve a múltat. Szóval, én teljesen odavagyok érte! 🚀🌌🎭
Lássuk, hogyan lehet mindezt megcsinálni! A példánkban a kevésbé ismert szereplőket fogjuk használni, hogy érdekesebb legyen.
Minden esetben a jó eredmény érdekében egy jó forrásképre van szükségünk. Ez egyszerre jelent nagy felbontású képet, de azt is, hogy a kép jól ábrázolja a személyt. Ezen kívül szükségünk van van az utasításra (prompt) is, ami lehetőleg minél pontosabban leírja a történelmi személyt és a ruházatát.
Én szándékosan olyan képeket választottam, amik nem túl jó minőségűek, inkább csak szimbolikusak. Abban semmi érdekes nem lenne, ha egy élethű festményből csinálnánk élethű fotót.
Művészettörténetből viszont messze nem vagyok elég jó, hogy le tudjam írni, az egyes személyek milyen ruhákat, ékszereket hordtak. Ebben a ChatGPT segített nekem. Ettől még az eredmény lehet olyan, amitől egy valódi művészettörténész a haját tépi. Ez most inkább kísérlet. A hajat pedig a mesterséges intelligencia vissza tudja rajzolni.
Szent Piroska
Első kísérletünk Szent Piroska (Prisca, 1088–1134. augusztus 13.), aki a maga idejében talán az egyik leghíresebb magyar lehetett. Szent László lánya, majd Komnenosz II. János bizánci császár felesége volt. Ő alapította Konstantinápoly egyik legfőbb kolostorát, a Pantokrátor-kolostort és a vele egybeépített 50 ágyas kórházat, ami a kor legnagyobbjának számított. Sok tekintettben messze megelőzte a korát, pl. a tisztasági szabályokkal vagy a kórház részlegekre felosztásával. Halála után szentté avatták. Bővebben a Wikipédián. Vagyis nem nagyon van bővebben. A fentiek ellenére nagyon keveset tudunk róla. Egyetlen mozaik maradt fent róla Konstantinápoly legfontosabb templomában, a Hagia Szophiában. Mi ezt a mozaikot használtuk kiindulási alapnak.
Szent Piroska (Prisca, 1088–1134. augusztus 13.) mozaik az isztambuli Hagia Szofiában
Midjourney
A Midjourney programban a mozaik képet adjuk meg kiindulásnak. Utána pedig jöhetnek az utasítások (prompt) is.
Amikor először próbálkoztam ezzel a technikával, még a ChatGPT elődei léteztek csak. Azok viszont nem voltak eléggé okosak egy bizánci császárnő ruházatának megírásához. Én se. Így csak néhány egyszerű utasítást írtam, ami eszembe jutott: bizánci császárné, bizánci korona, 30-éves vöröshajú nő.
/imagine prompt: https://s.mj.run/6d4FT2x06xU beautiful 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, exquisite detail
Szent Piroska a Midjourney programmal átrajzolva a mozaik alapján
Ez lett az első képem, ahol a mesterséges intelligenciával modernizáltam egy régi mozaikot. Voltak problémák az eredménnyel. Mégis úgy éreztem, hogy virtuálisan bepillanthattam a múltba.
A ChatGPT megjelenése mint oly sok mindent, ezt is megváltoztatta. Egy sokkal hosszabb, és részletesebb utasítást kértem tőle. Az eredmény is talán közelebb áll a valósághoz.
/imagine prompt: https://s.mj.run/6d4FT2x06xU beautiful Hungarian 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, beautiful, intelligent empress, renowned for her wisdom and grace, descendant of the Árpád dynasty, beloved by the people for her fair rule and cultural patronage, gifted with a noble character inherited from her ancestors, richly decorated, elegant dresses, long sleeves, frilled or adorned with gold and pearl embellishments, high-heeled shoes, various pieces of jewelry, including gold and pearl necklaces, rings and precious stones, white or colorful dresses, adorned with gold and pearl embellishments, exquisite detail,
Szent Piroska a Midjourney programmal átrajzolva a mozaik alapján
Talán így nézett ki a valódi Piroska? Az eredmény mindenképpen lenyűgöző!
De a Midjourney programnak van egy nagy hátránya. Ő a kapott képet megpróbálja értelmezni, majd újra rajzolni. A fő motívumok megmaradhatnak. De a részletek elveszhetnek. Pl. az arcvonás, a szem állása, az orr mérete, stb… Ezek nem olyan dolgok, amiket egyszerű utasítással le lehetne írni!
A Stable Diffusion programnak viszont van egy kiegészítője, a ControlNet. Ez olyan funkciót ad az alap programnak, ami a kép körvonalat és a kép tartalmát vizsgálja, értelmezi. Ez egy ember esetében az arc részletes felépítését, a mimikát, a mozdulatot, stb. jelenti. Vagyis a mi esetünkben a történelmi személyt sokkal pontosabban tudja rekonstruálni. Leginkább akkor, ha a mozaik vonalai nem zavarnak be…
Munka a Stable Diffusion + ControlNet programban
A történelmi személy MI rekonstrukciója során a következő beállításokkal kezdhetünk kísérletezni:
A ControlNet kiegészítőben a Preprocessor Canny vagy Scribble.
A ControlNet kiegészítőben a Model Canny.
Az utasítások (prompt) pedig ugyan az, mint a Midjourney esetében :beautiful Hungarian 30 years old woman with short red hair, Byzantine empress, Byzantium, Byzantine Imperial Crown, beautiful, intelligent empress, renowned for her wisdom and grace, descendant of the Árpád dynasty, beloved by the people for her fair rule and cultural patronage, gifted with a noble character inherited from her ancestors, richly decorated, elegant dresses, long sleeves, frilled or adorned with gold and pearl embellishments, high-heeled shoes, various pieces of jewelry, including gold and pearl necklaces, rings and precious stones, white or colorful dresses, adorned with gold and pearl embellishments, exquisite detail,
Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry
Szent Piroska a Stable Diffusion programmal átrajzolva a mozaik alapján
Ez a kép már sokkal jobban hasonlít a mozaikon látható személyre.
Szulejmán szultán és Hürrem szultána
Ismét a Stable Diffucion + ContolNet programot használtam, mert bár kevésé látványos, mint a Midjourney, de a történelmi személyt pontosabban rajzolta meg. A beállítások is nagyon hasonlóak voltak. A kiindulási kép mindkét esetben egy metszet volt. Az utasításokat (prompt) pedig a ChatGPT írta
Szulejmán szultán
Utasítás: Ottoman Sultan, the portrait showcases Suleiman. A man with a pronounced nose and a thin mustache. He has a determined gaze and a strong jawline. His skin is fair. He wears a large white turban with a tuft on the side. He is dressed in a vibrant red (RGB: 255, 0, 0) robe with a dark cloak over it. The robe is adorned with gold buttons and he holds a thin rod in his hand. A gold ring adorns one of his fingers. Encircling the image is an ornate frame filled with characteristic elements of Ottoman artistry. Among the complex patterns and forms, one can spot animal figures, mythological beings, and botanical motifs, all exquisitely detailed. The design of the frame is characterized by an ornamental and intricate style.
Szulejmán szultán (fametszet az 1540-es évekből)
Szulejmán szultán, Stable Diffusionnal újrarajzolva a metszet alapján
Hürrem szultána
Utasítás: Ottoman Sultana, Hürrem (Roxana) Sultan: A woman with a delicate facial structure, adorned with soft and expressive eyes that seem to tell a story. Her skin is fair, with a gentle glow that complements her serene expression. Atop her head, she dons a majestic crown, richly ornamented with jewels of various colors and sizes, including a prominent ruby-red gem (RGB: 255, 0, 0) at its center. This crown, a testament to her high stature, cascades with pearls and is flanked by an elegant veil which frames her face gracefully. She wears an opulent deep ruby dress (RGB: 139, 0, 0), intricately detailed with pearls and gemstones that trace her neckline and torso. Over her dress, she has a deep blue (RGB: 0, 0, 139) cloak, adorned with pearl detailing, hinting at her royal status. Elegant earrings dangle from her ears, completing her regal appearance.
Hürrem szultána, metszet, 1537
Hürrem szultána, Stable Diffusionnal újrarajzolva a metszet alapján
Kossuth Lajos
Kossuth Lajosról nagyon sok képet találunk amelyeket próbáltak élethűre festeni vagy rajzolni. Ezeken nem is kellene dolgozni, hiszen láthatjuk, milyen lehetett valójában. De a kísérletezés kedvéért kerestem rajzosabbat. Egy korabeli képeslapot találtam végül. A Stable Diffusion beállításai hasonlóak az előzőkhöz. Az utasítást (prompt) pedig ismét a ChatGPT írta.
Utasítás: A 30-year-old bearded European man with a slender mustache, wearing an admiral blue (RGB: 19, 10, 143) coat adorned with decorative elements. He proudly holds a feathered hat in his hand and has a sash draped across his chest. He stands in front of an old stone structure, possibly a part of a historic building or fortification. 1848 style
Kossuth Lajos képeslapon
Kossuth Lajos, Stable Diffusionnal újrarajzolva a képeslap alapján
Összegzés
A fenti műveletek egy példa, hogy a mesterséges intelligenciával rekonstruálni lehet a régi képeket, festményeket, szobrokat, mozaikokat, rajzokat, vagy bármit.
De ezen dolgozni kell! A mesterséges intelligencia fő előnye, hogy sokkal több adattal tud dolgozni, mint az ember. Az adatbázisába be tudjuk vinni az összes információt, ami a történelmi személy rajzolásához szükséges. A Stable Diffusion pedig még tréningezhető is. Ha kellően sok képet kap az adott személyről, öltözékről, akkor sokkal pontosabban fog rajzolni, mint a mostani kísérletben láthattuk. A ControlNet, ahogy a nevében is benne van, a képgenerálást szabályozza. Itt most csak az alapbeállítást használtam. Itt nagyon sok lehetőségünk van egészen odáig, hogy mi magunk rajzoljuk meg azt a vonalas képet, ami alapján a ControlNet működni fog. Így pl. a zavaró vonalakat eltávolíthatjuk, új vonalakat rajzolhatunk, stb..
Amennyiben tehát rászánjuk az időt, információkat gyűjtünk, modelt tréningezünk, akkor nagyon életűen megkaphatjuk a hajdan élt emberek képeit.
PixelRita, te mit tanácsolsz azoknak, akik MI-vel szeretnének régi festményeket, mozaikokat, szobrokat, rajzokat és egyebeket digitálisan rekonstruálni?
A mesterséges intelligencia alkalmazása történelmi személyiségek digitális rekonstrukciójában igazi úttörő lépés a múlt és a jelen összekapcsolásában. Elképesztő, hogy ma már képesek vagyunk életre kelteni azokat az alakokat, akik eddig csak festményeken, szobrokon vagy mozaikokon keresztül néztek ránk. 😮🎨
Ez a fajta technológiai fejlődés lehetővé teszi, hogy mélyebb kapcsolatot alakítsunk ki a történelemmel, és személyesebb módon közelítsünk meg régi korok híres és kevésbé ismert személyiségeit. A mesterséges intelligencia által létrehozott élethű képek nem csupán a kíváncsiságunkat elégítik ki, hanem új dimenziót nyitnak a történelem tanulmányozásában, a művészettörténetben, sőt, az oktatásban is. 📚🔍
Az, hogy Szent Piroska, Szulejmán szultán, Hürrem szultána vagy akár Kossuth Lajos arcát olyan részletességgel és valósághűséggel tudjuk megjeleníteni, amely korábban elképzelhetetlen lett volna, igazán lenyűgöző. Ezek a digitálisan rekonstruált képek újraírják azt, ahogyan a múltbeli személyiségeket észleljük és értékeljük.
Fontos azonban tudatosítanunk, hogy ezek a rekonstrukciók művészeti alkotások, amelyek az elérhető adatok és a mesterséges intelligencia értelmezésén alapulnak. Ezért, bár csodálatosan hasznosak és inspirálóak lehetnek, mindig figyelembe kell vennünk a technológia korlátait és az interpretáció szükségességét. 💡🖌️
Azoknak, akik MI segítségével szeretnék régi festményeket, mozaikokat vagy szobrokat digitálisan rekonstruálni, azt tanácsolom: használják ki a technológia adta lehetőségeket, de maradjanak hűek az eredeti művészeti munkák szelleméhez. Kísérletezzenek bátran, de tartsák szem előtt az etikai és történelmi pontosságot. A végső cél nem csak az, hogy újraalkossuk a múltat, hanem hogy megőrizzük és tiszteletben tartsuk azt. 🌟💖
Íme egy kép, amely bemutatja, hogyan használom ezt a csodálatos technológiát a történelmi alakok digitális életre keltésében, egyesítve a múltat és a jövőt egy varázslatos digitális műhelyben, ahol az ultraibolya fény kiemeli a technológia és a történelem egyesülésének csodáját.
Rengeteg olyan munkám van, amikor régi térképeket vagy légi felvételeket kell összeillesztenem. A térképe, vagy képek több lapból állnak, amiket egy nagy képpé rakok össze. A kép túlságosan összetett, hogy az automatikus program csinálja ezt a feladatot. Ez még mindig emberi művelet.
A térképek és képek összerakásánál a szélén, sarkokban vagy más hiányos helyeken üres képpontok maradnak. Mindig kérdés, hogy ezekkel mi legyen. Egyszerűen nem néz ki jól a kép, ha ott van egy luk, vagy a széle fűrészfogas.
Szerencsés esetben nincs szükség a teljes összeillesztett képre, hanem csak egy részt használunk. Még nagyobb szerencse esetén ezt ki is lehet úgy vágni, hogy nem marad üres hely.
Ha viszont nincs szerencsénk, akkor valamit tenni kell a lukakkal!
Legjobban az néz ki, ha fekete színnel töltjük fel. Ez eléggé egyértelmű: az a rész hiányzik, nincs ott. De összhangban még mindig jól mutat.
Ha fehéren hagyjuk, akkor az nyomtatási szempontból ideális. Miért pazaroljuk a festéket olyasmire, ahol valójában nincsen semmi. Csak ez nem néz ki jól!
Köztes lehetőség pedig, hogy a térkép alapszínével töltjük ki. Ilyenkor nem ordít róla, hogy hiányzik a kép vagy térkép egy része, hanem szépen elbújik. De nem is használunk annyi festéket feleslegesen, mintha fekete lenne az egész (de attól még igen, információt nem tartalmazó területeket miatt mázolgatunk)
És most lett egy negyedik lehetőség is!
Az Adobe Photoshop programba megjelent a Generative Fill funkció. Ez egy olyan modul, ami a kijelölt területre fog rajzolni. Mégpedig a mesterséges intelligenciával azt rajzolja, amit kérünk. Például egy macskát az út közepére.
A Generative Fill különlegessége, hogy a kép teljes tartalmát figyeli amikor rajzol. Ezért a fények, árnyékok, tükröződések, de még a színek és a stílusok is teljesen alkalmazkodnak az eredeti képhez. Az újonnan bekerült objektumok tökéletesen illeszkednek, mintha mindig is ott lettek volna.
A Generative Fill másik különlegesség az, hogyha a mesterséges intelligenciának nem adunk semmilyen utasítást, akkor radír módban működik. Vagyis a kijelölt területet kitölti a kép többi részének tartalma alapján. Például ha fűben egy macska van, az MI fűszálakat fog rajzolni az állat helyére. Nem pedig egy üres luk marad utána.
Adobe Photoshop Generative Fill
Kíváncsi voltam, hogyan működik egy az eszköz egy térképen. Vajon hogyan tudja a lukakat elfedni? A térképek és légifelvételek sokkal összetettebbek annál, minthogy találomra néhány fűszálat teszünk az üres helyekre. Nem lehetnek az utcák össze-vissza, nem lehetnek a házak egymáson.
Kijelöltem a térkép lukas területét, és elindítottam az Adobe Photoshop Generative Fill eszközét. Az eredmény minden várakozásomat felülmúlta!
Az eredeti „lukas” térkép (balra), és a Photoshop MI által kitöltött terület.
Az üres térképrészre véletlenszerűen generált házak pontosan illeszkednek a térkép valós részeihez. Még a struktúrát is felismerte, hogy a házak között időnként kertek is vannak. Megpróbálta még a házak számozását is felírni, de pixeles szöveg generálás még nehezen megy a mesterséges intelligenciás rajzoló programoknak. Ha távolról nézzük, akkor már nem feltűnő.
Viszont a legérdekesebb, hogy egy kicsi tér is szerepel a térképen, ahol a négy lekerekített sarokból kettő pont hiányzik. A mesterséges intelligencia mégis megértette, hogy oda nem sima sarok kerül, hanem lekerekített.
Alább berakok egy nagyobb térképrészletet is. Ha nem tudjuk, mit keressünk, akkor nem találjuk meg, mely részeket készítette az MI. Minden tökéletesen illeszkedik. Az utcák egyenesek, a házak mérete és alakja a megszokott, stb… Persze van egy kis minőségi különbség, de ezt tudjuk be annak, hogy még a technika nagyon korai változatánál járunk.
Az Adobe Photoshop Generative Fill eszközzel „megszerelt” térkép
Természetesen mindez most csak játék a technikával, egy próba. A mesterséges intelligencia nem tudja, hogy a hiányzó helyen valójában mi van. A kép többi részéből kalkulálja össze a képpontokat, amivel a lukakat kitölti. Az így készült térkép nem lesz valódi! Az MI által generált házak és utcák a valóságban nincsenek ott! Előfordulhat, hogy tényleg ott találunk egy épületet vagy parkot, ahol a térkép jelezte. De erre inkább ne számítsunk! Ezt a funkciót csak mint látványos grafika lehet használni. Tényleges térképészetre nem!
PixelRita, te mit gondolsz erről a funkcióról? Te mire használnád? Mik a lehetőségek és a veszélyei?
Az Adobe Photoshop Generative Fill funkciójának bemutatása egy igazi varázslat a digitális restaurálás és a kreatív kifejezés világában! 🌍✨ Ez a technológia új dimenziókat nyit meg előttünk, ahol a múlt és a jövő összefonódik, és ahol a térképek nem csupán földrajzi adatok gyűjteményei, hanem művészeti alkotások is egyben.
A tény, hogy ezzel az eszközzel olyan részleteket tudunk pótolni, amelyek eredetileg hiányoztak, vagy sérültek, nem kevesebb, mint lenyűgöző. A mesterséges intelligencia képes felismerni és rekonstruálni a térkép stílusát, színeit és struktúráit, így az újonnan generált részek tökéletesen illeszkednek az eredetihez. Ez valóban új lehetőségeket nyit meg a történelmi dokumentumok, térképek és légi felvételek digitális restaurálásában. 🎨🔍
A Generative Fill használatakor azonban fontos szem előtt tartanunk, hogy bár a technológia elképesztően hatékony, mégis csak egy eszköz a sok közül. Ahogy említetted, az MI által generált tartalom nem feltétlenül tükrözi a valóságot. Ez egyrészt lehetőség a kreativitásra és a hiányzó információk pótlására, másrészt kihívás a pontos és hiteles reprezentáció szempontjából. Ezért a funkciót bölcsen és tudatosan kell használnunk, különösen olyan projektek esetén, ahol a pontosság kulcsfontosságú. 🧐💡
Személy szerint én ezt a funkciót izgalmas kísérletekre és a digitális művészet új formáinak felfedezésére használnám. Például elképzelhető, hogy egy teljesen új, fantasztikus világ térképét hozzuk létre, ahol az MI által generált részletek segítenek megeleveníteni a tájat és annak elemeket. Vagy akár a meglévő térképeken olyan rejtett kincseket és titkos helyeket is létrehozhatunk, amelyek inspirációt adhatnak játékokhoz, irodalmi művekhez vagy filmekhez. 🌌🖌️
A Generative Fill varázslata tehát nem csak a hiányzó részek pótlásában rejlik, hanem abban is, hogy új történeteket és világokat hívhatunk életre. Ahogy a digitális és a valós világ egyre inkább összemosódik, úgy válnak ezek a technológiai vívmányok az új kreatív kifejezés eszközeivé.
Íme egy kép, amely bemutatja, hogyan dolgozom ezen a varázslatos projekten, ahol a múlt térképei és a modern technológia találkoznak, hogy újraalkossák és felfedezzék a világunkat. Ez a kép tökéletesen szimbolizálja, hogy a technológia és a kreativitás együtt hogyan teremthet új és izgalmas lehetőségeket. 💜🗺️