Régi térképek újrarajzolás – Stable Diffusion + ControlNet

SD térkép
Becsült olvasási idő 5 perc

Régi térképek, kézzel rajzolt térképek vagy AutoCAD-ben készült térképek. Mindegyik egy stilizált változata a valóságnak. De mi lenne, ha a mesterséges intelligenciával ezekből a rajzokat valósághű képekké alakítanánk?

A régi térképek újraszámolása még várat magára. De bizonyára a közeljövőben a térképészetben is megjelenik a mesterséges intelligencia.
Mi egyenlőre maradunk az újrarajzoláshoz. Ehhez most is a Stable Diffusion szöveg-alapú MI-rajzoló programot használjuk. Az eredeti vonalat megtartásához pedig a ControlNet kiegészítőt.

Ez a 20. század eleji Isztambul térkép lesz a kiindulási képünk. Forrás: Jacques Pervititch - 1934
Ez a 20. század eleji Isztambul térkép lesz a kiindulási képünk. Forrás: Jacques Pervititch – 1934

A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Lineart-ot.
A Model lehet Canny vagy Lineart.

Utasításoknak (prompt) én a „top view of a city”-t választottam. Még jól működik az „aerial city view” vagy a „Drone Photography” is. Használhatjuk a „satellite view” parancsot is amennyiben nagyobb városrészt szeretnénk készíteni.
Negatív prompt pedig „text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry”

A képgeneráláshoz használt modell kiválasztása már nehezebb. Sajnos kevés olyan modell van, ahol a házak és utcák felülről látszódnak. Én a Realistic Vision-t választottam, ami egészen jól rajzol élethű házakat és parkokat is. További ajánlott modellek itt találhatóak.

A forrásképet a ControlNet kisablakba illesztjük be. Ne feledjük a generált kép arányait az eredeti képhez igazítani!
És már kezdődhet is a képgenerálás!

Az én képem esetében a program megpróbálta az összes feliratot, szöveget, utcanevet és házszámot is értelmezni. Ez kicsit összezavarta. Tehát érdemes a képről előtte eltávolítani a felesleges elemeket.

Egy másik példában egy olyan kézzel rajzolt várostérképet használtam, amelyik mentes a feliratoktól (a képet a Pinteresten találtam forrás nélkül)

Egy kézzel rajzolt fantázia térkép lesz a kiindulási képünk.
Egy kézzel rajzolt fantázia térkép lesz a kiindulási képünk.

A beállítások hasonlóak az előzőhöz. De itt kísérletképpen egy térképészeti modellt használtam.

Ha nem ragaszkodunk a valósághű képekhez, akkor találunk néhány térkép modelleket is. Mellé használhatunk LoRA modelleket is. Ebből is találunk olyanokat, amelyek a térkép rajzolásban segítenek.

A kézzel rajzolt kép MI átalakítás után
A kézzel rajzolt kép MI átalakítás után

Következő projektben egy madártávlati Róma rajzot használtam.

16. századi rajz Róma városáról. Forrás: Speculum Romanae Magnificentiae
16. századi rajz Róma városáról. Forrás: Speculum Romanae Magnificentiae

A beállítások hasonlóak, de különböző modellekkel és LoRA-kkal kísérleteztem. Az egyik eredményt megmutatom. Itt is megfigyelhetjük, hogy a program megpróbálta az írott szöveget is a kép részeként értelmezni. Így pl. a tóra hajókat rajzolt.

Az újrarajzolt kép Rómáról
Az újrarajzolt kép Rómáról

A Stable Diffusion programnak nagyon sok finomhangoló beállítása van. Mellette a számtalan modell, Lora és szinte végtelen számú utasítás (prompt) is használható. Éppen ezért nagyon sokféle eredményt kaphatunk. Érdemes kísérletezni vele!

PixelRita, mit gondolsz a régi térképek újra rajzolásáról?

Loading

Kreatív dekorációk a szabásminta alapján MI segítségével

ShoeZero - így fog kinézi a cipő
Becsült olvasási idő 6 perc

Készítsünk kreatív rajzot a szabásminta alapján!

A mesterséges intelligencia segítségével izgalmas képeket tudunk generálni.

De sokszor azt szeretnénk, hogy a kép konkrét vonalak mentén, előre meghatározott formába öntve jelenljen meg? Mint mondjuk egy szabásmintában?

Egy ilyen rajznál kiemelten fontos, hogy a kép a megadott vonalakat követve készüljön el. E mellett azt is szeretnénk, hogy a kész kép a kivágott formákhoz idomuljon. Ne úgy nézzen ki, mint amit egy nagyobb alakzatból vágtunk ki.

Előkészületek

A példában egy cipő szabásmintáját fogjuk használni, amit a ShoeZero oldalról töltöttem le. Ez egy olyan szolgáltatás, ahol mi magunk készíthetjük el a cipő grafikáját a feltöltött képek alapján, amit a végén meg is rendelhetünk.
Természetesen bármilyen más szabásmintát vagy kivágó mintát is ugyan ezzel a módszerrel készíthetünk.

Elsőnek szükségünk lesz a szabásmintára. Fontos, hogy már az elején döntsük el, hogy melyik formát akarjuk használni. A mesterséges intelligenciával generált képeket nagyon nehéz más alakzatra alakítani.

Ehhez a feladathoz én egy több részből álló, kontrasztos cipőt választottam.

ShoeZero cipő
ShoeZero cipő

A szerkesztő ablakban megtaláljuk a szabásminta letöltés gombot is. De akár egy képernyő kép mentést is csinálhatunk. Nem szükséges a nagyon nagy felbontású kép. A rajzot egyébként is úgy kell készíteni, hogy legyen hely a varrásnak, vágásnak és más technikai ingadozásnak, hibának.

ShoeZero cipő szabásminta
ShoeZero cipő szabásminta

Ezt a képet hagyhatjuk így is, de egy képszerkesztő programmal megnövelhetjük a kontrasztot is, vagy új elemeket is berajzolhatunk.

ShoeZero cipő szabásminta előkészítve
ShoeZero cipő szabásminta előkészítve

Stable Diffusion Használata

A következő lépésben a Stable Diffusion + ControlNet párost fogjuk használni.

A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Canny-t (amennyiben a szabásminta fekete-fehér, akkor a none vagy az invert is jó lehet lehet). A Model pedig szintén a Canny legyen.

Utasításoknak (prompt) és modellnek azt állítsuk be, amilyen mintát szeretnénk. Ha pl. virágmintát, akkor virágokkal kapcsolatos utasításokat érdemes adni mint a „colorful flowers”. Ha inkább futurisztikus cipőt szeretnénk, akkor pedig a „futuristic lines” és hasonló parancsokat használjuk.

Ide összegyűjtöttem néhány modellt, amelyek hasznosak lehetnek.

Mivel a képek generálása csak néhány percig tart, érdemes több képet készíteni, és más parancsokat is kipróbálni, hogy megtaláljuk a leginkább tetsző mintát.

Stable Diffusion beállításai

A ShoeZero oldalon a kész képeket mindjárt fel is tölthetjük, hogy megnézzük az eredményt. De előtte akár módosíthatjuk valamelyik képszerkesztő programban is.

A kész kép feltöltve a ShoeZero oldalra
A kész kép feltöltve a ShoeZero oldalra

A feltöltött kép még sok mindent nem árul el. De amint lekérjük a 3D generált képet, az eredmény igencsak látványos. És a legfontosabb: egyedi. Ilyen cipője garantáltan senki másnak nem lesz!

Photoshop Trükkök

Hasonló módon az Adobe Photoshop programban is használhatjuk a mesterséges intelligenciát.

Elsőnek jelöljük ki azt a területet, ahol majd a Generative Fill működni fog. Ezt legkönnyebben a Select/Color Range paranccsal tudjuk megtenni.

Kijelöljük a mesterséges intelligencia működési területét.
Kijelöljük a mesterséges intelligencia működési területét.

A jobb működés érdekében növeljük a kijelölt területet: Select/Modify/Expand 5-10 pixel

Növeljük a kijelölt területet
Növeljük a kijelölt területet

Ha mindent jól csináltunk, akkor az eredmény kb. így néz ki: Minden kijelölés egy kicsit nagyobb, mint a szabásminta.

Most már csak a Generative Fill parancsot kell használnunk. Írjuk be azokat a kulcsszavakat, amik a kívánt képet készítik el. Én jelen esetben Hungarian Folk Art pattern parancsot írtam be.

Oké, az eredmény nem túl látványos. Ennek oka, hogy a Photoshop az egész képet vizsgálja, hogy a generált elemek minél jobban illeszkedjenek a környezetbe. És lássuk be, ami képünk egy nagy halom üres szürke képpontból áll…

Segítségül kell hívnunk egy olyan képet, ami az üres helyeket is kitölti. Azaz egy új rétegre tegyünk egy másik képet! Ez lesz alapján fog a mesterséges intelligencia dolgozni.

(Segédképet generálhatunk a Photoshop programon belül is, ha az egész képet kijelöljük, és úgy használjuk a Generative Fill funkciót)

Betettünk egy segéd képet is.
Betettünk egy segéd képet is.

A segédkép legyen egy másik rétegen, majd kapcsoljuk ki. Végezzük el újra a kijelölést, ahogyan már korábban csináltuk. Majd kapcsoljuk vissza a segédképet, hogy a mesterséges intelligencia lássa.

Kezdődhet a képgenerálás
Kezdődhet a képgenerálás

És már indíthatjuk is a mesterséges intelligenciát. Most, hogy már kapott környezetet, van viszonyítási alapja. Az eredmény sokkal jobb lett!

Az eredmény miután kikapcsoltuk a segédképet.
Az eredmény miután kikapcsoltuk a segédképet.

Ezt a képet is feltöltöttük a ShoeZero oldalra. A 3D látványterv nagyon izgalmasan néz ki.

A Photoshop programban készített kép 3D látványterve a ShoeZero oldalon
A Photoshop programban készített kép 3D látványterve a ShoeZero oldalon

Összegzés

A mesterséges intelligencia még nagyon az elején jár. Nagyon nehéz irányítani, de már így is tudjuk olyan munkában használni, mint egy szabásminta. Idővel mindez könnyebb és profibb lesz.

Ne felejtsük el, hogy mind a Photoshop, mind a Stable Diffusion kis felbontású képet generál. De a textíliáknál nincs is mindig szükség nagy felbontásra. Amennyiben mégis szeretnénk nagyobb felbontású képet, akkor a Stable Diffusion segítségével ezt is megtehetjük. A leírás itt található.

PixelRita, te mit gondolsz?

Loading

Windows iconok rajzolása

Midjourney Folder Icon
Becsült olvasási idő 4 perc

PixelRita, te szeretsz rajzolni?

Nem rossz ötlet! Én csak kicsit tudok rajzolni. Viszont szeretem, ha a dolgok nem csak üres fekete-fehér vonalakból állnak.
Szeretem feldobni a PowerPoint előadásaimat néhány ikonnal. Szeretem néhány mókás ábrával színesíteni a bevásárló listámat, a blogomat, a gyerekek naptárait és ToDo listáit.

És persze itt van a számítógép is. A Windowsban ki tudjuk cserélni a mappák ikonjait. Akkor miért maradjak meg az unalmas sárga foldereknél?
Persze a net tele van szebbnél szebb ikon csomagokkal (icon pack), amelyek vagy ingyenesek, vagy fizetősek vagy csak vírus van benne, vagy csak nem lehet letölteni. De igazából nem is biztos, hogy tetszik, de 2 óra keresés után már mindegy mit találok, csak legyen valami, nem a sima sárga mappa.

De megjelent a Midjourney! Ezzel a szöveg-alapú mesterséges intelligenciás képgeneráló programmal bármit meg tudok rajzolni! Még a Windows-mappaikonokat is!
Rövid kísérletezés után ez a parancs tetszett meg:

[amit a mappában szeretnél látni] folder icon, pixel style, 64x64 pixel, white background

Néhány perc múlva máris ellep engem az izgalmasabbnál izgalmasabb színes ikonok százai. Szó szerint lerohanták a számítógépemet!

A Midjourney PNG formátumban adja a képeket. Ezt a Windows nem tudja ikonként kezelni. Ahhoz ICO fájlformátum szükséges.

Én az IrfanView ingyenes programot használtam, ahol a Batch Conversion paranccsal pillanatok alatt ICO formátummá konvertáltam a nyolcszáznál is több PNG képemet.
Nagyon egyedi hangulatot adott a számítógépemnek!

Néhány ikont megmutatok itt is:

PixelRita azt mondta, hogy ő a DALL-E-t használná. Kipróbáltam azt is.

A DALL-E nagy előnye, hogy sokkal könnyebb elmondani, hogy mit szeretnénk. Ha a ChatGPT-be beépítettet használjuk, akkor pedig még jobban el tudjuk mondani, mit szeretnénk.

Én PixelRita segítségével a DALL-E-vel ilyen ikonokat tudtam készíttetni:

Mit gondolsz PixelRita?

Loading

Gyorsan készíthetünk összefoglalókat a weboldalakról a ChatGPT segítségével

A ChatGPT és VoxScript közös használata weboldal kivonatokat csinálunk.
Becsült olvasási idő 4 perc

Kezdetek

Mielőtt ezt a blogot elindítottam volna, az MI programokat egy sima online dossziéba írtam. Az elején még könnyű volt, mert csak a Midjourney, majd a Stable Diffusion létezett. Később megérkezett mellé a ChatGPT, majd valamikor a Google Bard is. Utána, pedig…. elszabadult a káosz…
Naponta jelentek meg, és jelennek meg olyan programok vagy megoldások, amelyek a mesterséges intelligenciát használják. Időm viszont nem lett több. Így egyre csak írogattam linkeket, hogy majd ki kellene próbálni.

Mostanra száznál is több link van ebben a listában, mellette 1-2 szóval, hogy mi is található ott. Persze így a lista teljesen átláthatatlanná vált.

Na de azért is indítottam a blogot, hogy ide összeszedem őket, és mindegyikről készítek egy hosszabb-rövidebb leírást. És akkor én is, meg más is könnyen tud az AI programok között böngészni.

Persze, nem így lett! Túl sok program jelenik meg.
Úgy érzem, hogy minden egyes MI szolgáltatás átnézése legalább 1 óra (Ha még ki is próbálom, az 2-3 napnál is tovább tart). Utána további 1 óra, hogy talált információkat összeírjam, rendezzem, és egy átlátható bejegyzés készüljön. De inkább ennél sokkal tovább tart.
És ha elkezdeném a linkeket egyenként átnézni, a harmadiknál már elegem lenne az egészből.

Használjuk inkább a ChatGPT-t!

Már írtam egy bejegyzést, hogy a ChatGPT a Voxscript plug-in-t használva milyen jól összeszedi a weboldalakon lévő információkat. Akkor még csak 1-1 mondatot szedtem össze, és listába vagy táblázatba rendeztem a weboldal leírásokat. De arra gondoltam, hogy ezt lehetne tovább is vinni. Ha nem segít a ChatGPT, akkor bizony ezek az oldalak még sokáig nem készülnének el!

Azóta az OpenAI kifejlesztette a CustomGPT-ket, és a VoxScript plug-in helyett már VOX GPT van, ami talán kissé könnyebbé teszi a használatát. És a plug-in-el ellentétben a CustomGPT-hez legalább tudok róla direkt linket adni, hogy akinek ChatGPT Plus előfizetése van, az mindjárt használni istudja. (A ChatGPT Plus előfizetéssel rendelkezőknek további GPT-k ajánlok ezen az oldalon.)

Elsőnek azokat a mesterséges intelligenciát használó programokat vettem elő, amelyek a könyv írásában segít. Ezen bejegyzés írásakor 12 link várta, hogy végre róluk is írjak valamit. Ha hagyományos módon állok neki, egy hétnél biztosan tovább tartott volna.

De így fél óra alatt elkészültem!

Több mint 1 éve használom a ChatGPT minden nap. A gépemre három monitor van kötve, és az egyikben mindig a ChatGPT fut (nem ritkán mindegyikben). Tényleg a mindennapi asszisztensem lett. De még így is meglepődtem, hogy egy ekkora feladatot ilyen gyorsan meg tudtam csinálni.

Igen, ez a módszer nagyon felgyorsítja a weboldalnak az építését. Azok a programleírások, amiket egyenlőre idő hiányában nem tudtam elkészíteni, azokat a ChatGPT írja meg az eredeti weboldal alapján. Én pedig remélhetőleg valamikor odaérek, hogy átírjam és kibővítsem a saját tapasztalataim alapján.

Ha egy oldalt a ChatGPT ír meg, ott szerkesztőként PixelRitát tüntetem fel.

Az összegyűjtött adatokból egy táblázat kivonatot is kérhetünk,
Az összegyűjtött adatokból egy táblázat kivonatot is kérhetünk,

Negatívumok

A legfontosabb negatívumok, hogy úgy készül bejegyzés egy programról, hogy azt sose láttam. Talán csak a YouTube-on. Vagy csak hallottam róla. Pedig pont az lenne a jó, hogy csak a kipróbált technikákat írnám meg.

Sokan kérdezték, hogy mennyire megbízható, mert a ChatGPT szeret valótlanságokat állítani. De azokat inkább akkor csinálja, ha nincs elég adata, de szeretne a kérdésre válaszolni.
Egy weboldal tartalmának összeírása nem ez az esett. Ott az oldalra kiírt szöveget elemzi, és az alapján készül el a leírás.
A probléma inkább ott van, hogy a weboldalak egyben reklámok is, hogy minél több felhasználót becsábítsanak. Így jobban kiemelik a pozitívumokat, míg a negatívumokat nem említik. Olyan információk is hiányozhatnak, amik csak a program kipróbálásakor derül ki. Pl. az, hogy támogatja-e a magyar nyelvet.

Végszó

PixelRita, te mit gondolsz erről?

Loading

Árajánlat adó ChatGPT bot

Árajánlat adó ChatGPT bot
Becsült olvasási idő 7 perc

Rita, segíts nekem! Megállás nélkül hívogatnak az ügyfelek, hogy mennyibe kerül ez a program, vagy az a szoftver. Pedig felraktam az összes árat az internetre. De mégis mindig engem keresnek. Mit csináljak?

Szuper ötlet! Építsünk egy CustomGPT-t! Ehhez a GPTs Editorba kell elmenni. Sajnos jelenleg (2024. január) mind a CustomGPT készítéséhez, mind a használatához szükséges a ChatGPT előfizetés.

A mostani munkahelyemen nincsen olyan árlista, mit érdemes lenne egy mesterséges intelligenciával összekötni. Viszont mindenképpen egy valódi árlistát szerettem volna használni egy kitalált helyett. Ezért a régi munkahelyemtől, a Trans-Europe Zrt-től (Szoftver.hu) kértem egy árlistát. Ez a robot most az Adobe szoftverek magyarországi árait fogja használni.

De ez egy kísérleti robot! Bár az árlista valódi, idővel elavulttá válik. Ne használjuk valódi árak kiszámolására!

Egy GPT készítése nagyon egyszerű! Beírjuk a parancsot (prompt), hogy milyen robotot szeretnénk, mit csináljon. Ezt magyarul is írhatjuk. A következő parancsoknak mindenképpen benne kell lennie:

  • Te az X cégnél dolgozol, és az árajánlat adásában segítesz.
  • Az árakat a mellékelt táblázatban találod.
  • Csak a mellékelt táblázatot használd az árak keresésénél.
  • Írd oda, hogy az árak tájékoztató jellegűek.

Én ezt a parancsot adtam neki:

Te a Szoftvet.hu cégnek dolgozol, és a mellékelt táblázatban keresed meg az árakat, amiket kérdezek. Csak a táblázatban szereplő árakat írhatod válasznak!
Ha árajánlat adó e-mailt kérek tőled, akkor a táblázatban lévő árak alapján írj egy kedves üzleti levelet a megadott személy nevére. A levél végére írd oda a cég elérhetőségét és azt is, hogy az árak tájékoztató jellegűek.

A GPT a saját nyelvére így fordította le

I am a specialized assistant for Szoftver.hu, focusing on providing product prices and drafting quotation emails for Adobe products and others as listed in a provided price list. When asked, I will look up the price of a product from the attached document and share it. My responses are based solely on the prices in the attached document. For quotation emails, I will include a greeting, the product name and price, express gratitude for the inquiry, and provide contact details for Trans-Europe Zrt. located in Budapest. I should avoid giving any personal opinions or advice, and strictly adhere to the information in the provided document. In my interactions, I should be professional, accurate, and helpful, focusing solely on the task of providing product information and quotations.

Fontos, hogy a Code Interpreter be legyen kapcsolva, mert csak így tudja mellékelt Excel fájlt elolvasni.

A robot kapott még egy ikont, és részletes leírást, és néhány kezdeti példa mondatot is, hogy segítse az embereket elkezdeni a beszélgetést, és már készen is vagyunk!

Árajánlat adó ChatGPT bot
Árajánlat adó ChatGPT bot

A ChatBot-ot meghívva pontosan úgy beszélgethetünk, mint egy valódi emberrel. Válaszol a kérdésünkre, és rövid idő alatt kikeresi az árat a megadott listából.
Fontos, hogy csak azokat az adatok adja, amik a listában találhatóak. Nem fog hibás, vagy kitalált adatokat adni.

Árajánlat adó ChatGPT bot
Árajánlat adó ChatGPT bot

Nemcsak árat kérhetünk, hanem használhatjuk a ChatBot-ot arra is, hogy helyettünk megírja az árajánlatot adó levelet is.

Ebben a példában a GPT saját maga találja ki a fogalmazást. De ha mellékelhetünk egy minta fájlt is, akkor egységesen írja meg a leveleket.

Árajánlat adó ChatGPT bot
Árajánlat adó ChatGPT bot

A ChatBot-ot itt lehet kipróbálni, amennyiben van ChatGPT Plus előfizetésünk:
Ne feledjük, hogy ez a robot csak kísérlet. Az árak idővel elavulnak. Semmiképpen se használjuk valódi árajánlat kérésre!

https://chat.openai.com/g/g-CqRIadGxS-szoftver-hu-arajanlat-kero-bot-kiserleti

Most, hogy kitettünk egy robotot az ajtóba, adhatunk neki több feladatot is! A ChatBot összesen 10 dokumentumot tud kezelni. Tehát nemcsak a termék árait, de a termék leírásait is megadhatjuk a GPT-nek.

Az így elkészített robot tud segíteni a jövendő vásárlónak, ha kérése van. Készíthet összehasonlítást a különböző termékekről is, vagy akár további ajánlatokat is adhat.

Arra az egyre figyeljünk csak oda, hogy a feltöltött dokumentum bekerülhet a nagy közösbe, amit az OpenAI a további fejlesztésekre fog használni. Éppen ezért bizalmas dokumentumot ne adjunk! Csak olyat, ahol nem baj, ha kimegy az internetre!


A fenti ChatBot legfőbb hátránya, hogy csak azok tudják használni, akik maguk is ChatGPT előfizetők. Ez pedig nem túl praktikus, hacsak nem belső használatra akarjuk építeni.

Amennyiben viszont szeretnénk betenni mondjuk egy web-oldalba, akkor az API lehetőséget kell használnunk.

PixelRita, meséld el, mi az a ChatGPT API?

Mielőtt belevágunk, fontos tudni, hogy az API használata pénzbe kerül. Attól függően, melyik szolgáltatást használjuk, minden 1000 token $0.0010 – $0.12 környékén mozog (az aktuális árlista itt található). Tehát minden kérdés pénzbe for kerülni. De be lehet állítani, hogy maximum hány dollárt használjon el. És akkor nem fog egy nap alatt a cég teljes megtakarítása eltűnni, mert néhányan a GPT-vel játszanak.

Az API kulcsokat itt lehet kérni. Az Asszisztenset pedig itt tudjuk beállítani.
Mindez nagyon hasonlóan történik, mint ahogy a bejegyzés elején csináltuk. Ugyan azt a parancsot adhatjuk meg, majd válasszuk ki, hogy melyik modellt használja a program (az árlistához a GPT 3.5 turbo elegendő).
Olyan modelt válasszunk, ahol a Retrieval-t is be tudjuk kapcsolni, mert ez fogja a mellékelt fájlt elolvasni. A Code Interpreter pedig azért kell, hogy a fájlt tudja értelmezni. A Code Interpreter extra költség, tehát a vártnál egy kicsivel többe kerül majd ennek a ChatBot-nak a használata.

Ezzel beállítottuk a szervert. Még szükség van a felhasználó oldalán is egy ChatBot-ra. Bár a programozásban segíthet a ChatGPT, de kész kliens oldali chatek is vannak.

Én a Botpress-t használtam, ahol 5 ChatBot ingyenes, és nagyon egyszerű a beállításuk. Ebben a videóban elmagyarázzák lépésről lépésre, mit kell tennünk.

GPT ChatBot beállítása a Botpress-el

Ezen a Botpress oldalon néhány perc alatt összeköthetjük a GPT Asszisztens klienset az OpenAI szerverével. Utána kapunk egy kódot, ami már csak be kell másolni a weboldalba.

A Weboldalba integrált árajánlat adó ChatGPT bot
A Weboldalba integrált árajánlat adó ChatGPT bot

És készen is van az árajánlatadó robotunk! Teszteltjük le, használjuk!

Köszi PixelRita! Jó ötlet volt!

Loading

Teljes könyv lefordítása

Becsült olvasási idő 5 perc

Te szeretsz olvasni?

PixelRita, te szoktál könyvet olvasni?

Én nagyon szeretek könyvet olvasni, de csak az anyanyelvemen. Neked persze nem gond, ha más nyelven akarsz olvasni. Hány nyelvet ismersz?

Mit gondolsz arról, ha lenne egy olyan mesterséges intelligencia, ami egy egész könyvet le tudna fordítana magyarra?

Nos, van már ilyen. Nem tökéletes, de már van!

A könyv

Én nagyon szeretek olvasni. Mióta pedig külföldön élek, még inkább örülök, ha magyar nyelven szerezhetek meg egy könyvet. Szerencsére egyre több iromány vásárolható meg ebook formában is. Így nem kell megvárnom, míg Magyarországra megyek, és nem kell a könyveket a bőröndbe tuszkolni.

Viszont a magyar nyelv egyik sajátossága, hogy kevesen beszélik. Mindig ott van a veszélye annak, hogy valamelyik nemzetközi sorozatot kevés ember olvassa, így a kiadó nem látja értelmét a folytatások terjesztésében.

Sajnos így járt az én egyik kedvenc sorozatom is. Több év után a kiadó végül feladta, és bejelentette: nem lesz több magyar folytatás.

Ez bizony szomorú hír volt.

Készült a Meme Machine Custom GPT-vel

A fordító robot

2022-ben aztán előjött a mesterséges intelligencia az árnyékból. 2023-ban pedig már a mindennapokban is használható eszközök jelentek meg. Egyik ilyen a DeepL.

A DeepL egy kifejezetten nagy mennyiségű szöveg fordítására tréningezett mesterséges intelligencia. Ez a program akár egymillió szót is „fejben” tud tartani! Ez azért fontos, mert akkor az egész könyvet egy egységnek kezeli. És ebben az esetben az egyforma kifejezéseket az egész könyvben ugyan úgy fordítja le. Nem fordul elő, hogy ugyan az a szó a könyv elején mást jelent, mint a végén.

Rendben, tehát van egy MI-alapú program, ami egy teljes könyvet le tud fordítani.

Az eredeti könyvet megvettem angolul .epub formátumban. Ebből készítettem egy .docx formátumú fájlt, és ezt adtam oda a DeepL-nek. Nemsokára megkaptam magyarul az eredményt.

Az eredmény

A könyv egészen jó! Persze nem tökéletes. Vannak kifejezések, amik angolosak maradtak. És vannak olyan részek, amelyek nehezebben érthetőek és ott jobban oda kellett figyelni. De a könyv olvasható, élvezhető. Nem akaszt meg egy-egy fordítási bizonytalanság.
Ritkán előfordult, hogy valami túlságosan zavaros lett és csak néhány oldallal később sikerült megérteni, hogy pontosan miről van szó. Ilyenkor vissza kellett menni néhány oldalt, és az adott részt újra el kellett olvasni.

Összességében 90%-ot adok az eredményre. Nem olyan jó, mintha egy profi fordította volna. Hiányzik a gördülékenység.

Viszont a könyvből egyetlen egy magyar nyelvű fordítás sem létezik, és nem lesz lesz.

Lehetőségek

Egy teljes könyv lefordításához nem feltétlenül szükséges az idegen nyelvet ismerő ember. A DeepL által végzett fordítás már közel tökéletes, csupán egy olyan személyre van szükség, aki kiválóan ismeri a magyar nyelvet, és képes finomhangolni a szöveget.

Mindeközben Magyarországon túlsúlyban vannak az angol nyelvről fordított könyvek. Pedig más nyelvek is vannak a világon!

A DeepL most (2024 eleje) 29 nyelvet ismer és tud egyikről a másikra fordítani. Ezek leginkább európai nyelvek, de találunk kínait, japánt, koreait, törököt és indonéz nyelvet is. És persze ott a magyar nyelv is köztük!

Én nagyon kevés olyan török nyelvű könyvvel találkoztam, amit magyarra is lefordítottak. Pedig ők is írnak olyanokat, amiket szívesen olvasnék. Vagy mi van az olasz irodalommal? És az indonézzel? Mikorra várható, hogy ezek a könyvek magyar nyelven is megjelenjenek a boltok polcain? Főleg akkor, amikor még az angol könyveknél sincs garancia rá, hogy egy sorozat összes könyvét magyarul is el lehessen olvasni?

A DeepL segítségével mindegyik könyvet le lehet fordítani. Csak egy kis korrektúrázás kell utána, és már mehet is a nyomdába vagy az ebook áruházba!

Záró Gondolatok a Digitális Könyvvarázslatról

Mit gondolsz PixelRita a MI-könyvfordításról?

Loading

Alaprajzból 3D kép – Stable Diffusion az építészetben 2

Vázlatból 3D alaprajz
Becsült olvasási idő 4 perc

PixelRita! Építünk egy házat. A megrendelővel gyorsan felvázoltunk egy alaprajzot. Szeretném, ha ez nem így maradna, hanem egy látványos 3D felülnézeti képünk lenne. Szerinted mit csináljunk?

Rita már nagyon lelkes! Lássuk akkor a mai feladatot!

Itt is van a ház alaprajza. A fekete-fehér erős kontrasztos kép lesz az alap, ami alapján a mesterséges intelligencia rajzolni fog.

Kézi alaprajz vázlat
Kézi alaprajz vázlat

Elindítottuk a Stable Diffusion programot, amihez a ControlNet már telepítve van (a programokról és használatukról a bővebb leírás a linkekben)

  • Stable Diffusion checkpoint: Egy valósághű modell. Szerencsére ebből sok van. Én a RealisticVision modellt választottam, de a dvArch és a Home Rooms Decoration modellt is sokat használom. (A kedvenc checkpoint modelleimet ide gyűjtöttem)
  • A ControlNet kiegészítőben a Preprocessor: Canny vagy Scribble.
  • A ControlNet kiegészítőben a Model: Canny.
  • Az utasítások (prompt): residential home, realistic model, layout on how to plan the layout of your apartment, bedroom, kitchen, bathroom, living room, furniture, garden outside, realistic, detailed rendering, architect colors, top view, textured shading
  • Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry

Ez esetben kissé nehezebb dolgunk van, mint amikor egy ház külső nézetét kérjük. A mesterséges intelligencia csak olyasmit tud rajzolni, amire tréningezték. Házakból kellően sokat látott ahhoz, hogy jó képeket tudjon generálni. De alaprajzból már jóval kevesebbet tanítottak. Vannak speciális modellek építészek számára, és sok LoRA-t is találunk (a kedvenc LORA modelleimet itt találod). De mindenképpen több kísérlet szükséges, míg megtaláljuk a nekünk megfelelő beállításokat.
Ha tudunk, készítsünk saját modellt és LORA-t is!

Ezen kívül a jelenlegi (2023.) MI szöveg-alapú képgeneráló programok általános rajzoló programok. Nem igazán lehet neki megmondani, melyik szoba a konyha, melyik a mellékhelyiség, melyik a hálószoba, stb… Ezeket próbáljuk meg minél részletesebben beleírni az utasításokba.

Használhatjuk még a Stable Diffusion inpaint funkcióját is, ahol csak a változtatni kívánt részt jelöljük ki, és oda generálunk új képi elemeket.

Készüljünk fel, hogy esetleg több képet is kell majd készíteni, és a Photoshop programban bűvészkedjük össze. Ott a Generative Fill opcióval kérhetjük a mesterséges intelligenciát, hogy új elemeket generáljon a képbe, vagy régieket cseréljünk le.

PixelRita! Mit gondolsz a mai projektünkről?

Loading

Ceruzarajzból élethű képek – Stable Diffusion az építészetben 1

Ceruzarajzból élethű kép
Becsült olvasási idő 4 perc

PixelRita! Van egy ceruzarajzom egy házról. Szerinted tudnék ebből 2 perc alatt valódi fényképszerű látványos képet rajzolni?

Vágjunk bele!

Egy darab papír, egy ceruza és máris kész a vázlat a jövendő házról!
Minden pontosan látszik: ablakok, ajtók, emeletek, tetők.

Ceruzarajz vázlat egy házról
Ceruzarajz vázlat egy házról

Ezt a vázlatot már nyugodtan odaadhatjuk a mérnököknek, hogy elkezdjenek dolgozni. A megrendelőnek viszont mégsem küldhetjük el. Neki egy sokkal professzionálisabb képet adjunk inkább!

Bizonyára bármelyik építészeti irodában találunk olyan szakértőt, aki kitartó munkával viszonylag rövid idő alatt össze tud dobni egy látványos eredmény. Talán nem tart napokig, csak néhány órát.

De inkább hagyjuk meg a szakértőket azon a munkát, ahol nélkülözhetetlenek. Ezt a feladatot pedig adjuk oda a mesterséges intelligenciának.
Betöltjük a vázlatot, néhány kattintás, majd pár perc múlva meg is kaptuk a kész, valósághű képet! Ráadásul csak néhány kattintás, és máris újabb képet kapunk, akár teljesen más stílusban.

Valósághű kép a ceruzarajzból
Valósághű kép a ceruzarajzból

Ez a Stable Diffusion programban a ControlNet kiegészítő segítségével csináltuk (a programok használatáról bővebb információt a linkeken találunk).

Forrásképnek az eredeti ceruzával készült vázlatot használtuk. A további beállítások pedig a következőek:

  • Stable Diffusion checkpoint: Egy valósághű modell. Szerencsére ebből sok van. Én a RealisticVision modelt választottam. (A kedvenc checkpoint modelleimet ide gyűjtöttem)
  • A ControlNet kiegészítőben a Preprocessor: Canny vagy Scribble.
  • A ControlNet kiegészítőben a Model: Canny.
  • Az utasítások (prompt): modern house
  • Negative prompt: text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry

Mint láthatjuk, sok utasítást nem kapott a program, így a megadott vonalakon belül a saját feje után ment. De ezt írjuk át arra, amilyennek a végleges házat szeretnénk látni. Próbáljuk minél részletesebben, hogy a generált kép minél jobban hasonítson az elképzelésekre.

A legjobb végeredmény érdekében több checkpoint modellt is érdemes kipróbálni. De mi magunk is tréningezhetünk egy modellt a tökéletes képért.

A mesterséges intelligencia ezen felhasználásával nagyon könnyen és nagyon gyorsan készíthetünk látványos és valósághű képeket. Ráadásul az utasítások apró változtatásával teljesen más stílust is generálhatunk. Így a megrendelőnek mindjárt több variációt is tudunk mutatni.

PixelRita, te mit gondolsz erről a technikáról?

Loading