Zene a Suno AI-val

Becsült olvasási idő 16 perc.

Bevezetés

A Suno.Ai egy olyan program, ahol egy rövid parancsot megadva (prompt) a mesterséges intelligencia elkészíti a kért zenét (vagy ahhoz valami hasonlót).

A közelmúltban (2024 nyár eleje) viszont több frissítés jelent meg a programhoz. Ezek közül az egyik az, hogy saját dalszöveget is tölthetünk fel. Akár magyar nyelven is!
Így most már a Suno programmal saját dalokat, saját slágereket készíthetünk, amiket utána teljes hangerővel lelkesen énekelhetünk a zuhany alatt, az autóban, vagy akár egy tömött buszon!

Az ingyenes verzió minden nap 50 kreditet ad, amivel 10 dalt generálhatunk (2024 nyara). Ez bőségesen elegendő ahhoz, hogy elárasszanak a személyre szabott dalaink!

Elő a nyelvi modellekkel!

Amikor a ChatGPT napvilágra került, sokan dicsérték, hogy akár még verset is lehet vele írni. Azóta sok idő telt el, új nyelvi modellek is jelentek meg, a régiek pedig rengeteget fejlődtek.
Most még jobb lehetőségeink vannak arra, hogy a mesterséges intelligencia olyan dalokat készítsen, amilyet szeretnénk, ami pont nekünk való!

Ha nem megy nekünk a dalszövegírás, vagy csak túl fárasztónak találjuk, esetleg sok a munkánk, akkor megkérjük valamelyik nyelvi modellt, hogy készítsen egyet. Nekünk elég csak pár mondatban a témát és a hangulatot megadni.

Ebben a bejegyzésben az OpenAI ChatGPT, a Google Gemini és az Anthropic Claude modelljeit próbáltuk ki. Illetve a ChatGPT esetében többen is készítettek egy olyan CustomGPT-ket, ami kifejezetten a Suno programhoz készítenek dalszöveget. Mi a Suno AI V3 – Lyrics nevűt próbáltuk ki.

A prompt

Bármennyire is jók a jelenlegi nyelvi modellek, ezeket nem dalszöveg készítésére fejlesztették. A tapasztalat azt mutatja, hogy érdemes a programokat emlékeztetni, hogy egy dalszöveg több, mint a mondatok egymás után pakolása. Mi szeretnénk ritmusokat, és olyan szöveget, amit jól lehet énekelni (És nem árt hízelegni sem, hogy „te egy professzionális dalszövegíró vagy, aki több díjat is nyert” stb..).
Egy dalszöveg ennél biztosan bonyolultabb, nem lehet ilyen egyszerűen leírni. Sajnos az én ismereteim itt véget érnek. Mindenkit bíztatok, hogy próbáljon meg jobb promptot készíteni!

E mellett a Suni.AI egyik sajátossága, hogy bár írhatjuk a dalszöveget magyarul, jobb ha az utasítások angolul maradnak. Erre a nyelvi modelleknek mindenképpen oda kell figyelniük!

A kísérlethez olyan dalt kértünk, amiben egy páratlan zokni keresi a párját. Elsőnek pedig a stílusa legyen egy vidám gyerekdal.

Te egy professzionális dalszövegíró vagy, aki több díjat is nyert a világhírű slágereivel.
Szeretném, ha a suno.ai számára készítenél dalszövegeket. A zene hossza legfeljebb 3 perc lehet és maximum 3000 karakter.
Szeretném, ha nemcsak egymás után írt mondataid lennének, hanem dallamosak, lírai, ritmusosak, amiket lehet énekelni. Figyelj arra, hogy a sorok dallamilag és ritmusban is összefüggjenek. Figyelj oda a magas és mély hangokra is!

A dalszöveget magyar nyelven kérem. De a versszak egységek zárójelben és angolul írjad. Pl: [intro], [verse], [chorus], stb...

A dal végére angolul, vesszővel elválasztva, felsorolás szerűen írd oda, hogy milyen zenei stílusban, tempóban és milyen énekes legyen. Ez a leírás legyen rövid, mert csak 120 karakterünk van rá. De minél pontosabban próbáld meghatározni.

A történet főszereplője egy zokni, aki páratlan. A "páratlan" szó jelentése ebben az esetben az, hogy ez a zokni különleges, nincs még egy ilyen, jobb mint a többiek, szinte már szuper zokni. A dal első felében ezt fejtsd ki.
A dal második felében viszont jöjjön elő, hogy zokniból mindig kettő van (egy a bal, egy a jobb lábra). És valójában a főszereplő zoknink azért páratlan, mert elvesztette a párját. És most keresi, mert nélküle ő csak egy haszontalan zokni, aki nem kell senkinek. Ezért a főszereplő zoknink keresi a párját. A dal végére meg is találja, és mindenki boldog lesz.

A dal vidám gyerekdal stílusban legyen!

Lássuk, milyen dalokat készítenek a mesterséges intelligencia programok!

Suno.AI dalszöveg
Suno.AI magyar dalszöveggel

Gyerekdal

Elsőnek tehát egy gyerekdalt kértünk a különböző programoktól.
Az eredményt utána betápláltuk a Suno AI-ba.

A GPT-k betartották a 3000 karakteres határt. Bőven alatta maradtak. De ez nem jelentett garanciát arra, hogy a dal minden esetben belefér a maximális 4 perces limitbe. Amikor hosszabb instrumentális részek vannak, lassabb énekelés, ismétlések, stb… A 4 perc elérésekkor a dal azonnal megszakad.
Ezt a problémát az Extend funkcióval lehet javítani, bár nem mindig egyszerű.

És most lássuk, hogy melyik nyelvi modell milyen dalszöveget készített, majd pedig abból mit alkotott a Suno!

ChatGPT – 4o

ChatGPT – CustomGPT – Suno AI V3 – Lyrics

Google Gemini

Anthropic Claude

Összegzés

Lássuk az eredményeket!
Nem vagyok zeneszakértő, így leginkább csak érzésre tudom értékelni.

A dalok nem rosszak! A dalszövegek hossza néha változó, ezért ott időnként erőltetettnek hangzik. Más esetekben pedig úgy tűnik, mintha a nyelvi modell és a Suno nem tudott volna „összehangolódni”.
Vegyük figyelembe, hogy a nyelvi modellek és a Suno nincs összekapcsolva. Nem tudják egymást megkérdezni, hogy mégis mit akart a másik (Tovább nehezíti a helyzetet, hogy mindegyik egy program, nincs olyan, hogy „valamire gondol”. Hanem statisztika alapján dolgoznak. – Igazándiból kész csoda, hogy élvezhető dalt kaptunk!).

Összességében el lehet képzelni egy halom gyereket amint színes zoknikat dobálva ezeket a dalokat éneklik. Mindegyik vidám lett, ritmusos, és aranyos. Érdemes lenne tovább dolgozni rajta, hogy még jobb legyen.


Felnőtt verzió

A gyerek verziókból ennyi bőven elég volt!

A témánál megkérjük a nyelvi modelleket, hogy írják át a dalszöveget és a stílusokat felnőtt verzióra. Ha már páratlan zokni, akkor legyen romantikus, lírikus és kicsit szomorú.

Prompt:

Szuper! Köszönöm!
Most írd át felnőtt verzióra. Legyen lírikus, romantikus, kicsit szomorú.

ChatGPT – 4o

ChatGPT – CustomGPT – Suno AI V3 – Lyrics

Google Gemini

Anthropic Claude

Összegzés

Húúú! Most, hogy kiléptünk a vidám gyerek cipőből, és átjutott a viszontagságos felnőttkorba, mindjárt sokkal jobb dalszövegeket kaptunk!
A Google Gemini hangulatos irodalmi elemekkel pakolta tele a dalt. És nála elmarad a boldog befejezés. Az Anthropic Claude is sokkal sötétebb dalt készített.

A Gemini elfelejtette a dal stílusát leírni, így azt a ChatGPT-től vettem át. A Claude ezt viszont nagyon pontosan határozta meg.

Sok helyen érződik még a gépi hang. Bizonyára a következő verziók sokkal emberibbek lesznek.


Epikus metál verzió

Ha már idáig eljutottunk, mi lenne, ha megpróbálkoznánk egy epikus metál verzióval? Elég volt a szomorú lassú dalokból! Tépjük csak a húrokat!

prompt:

Nagyon jó! Most írd át epikus szimfonikus metál verzióra! Érzelmes hősi dal legyen!

ChatGPT – 4o

ChatGPT – CustomGPT – Suno AI V3 – Lyrics

Google Gemini

Anthropic Claude

Összegzés

Hú ha! Ez aztán a tempó!

A sima ChatGPT jól indul. Az intró igazán érdekes. Sajnos utána mintha egy teljesen érzelemmentes radiátor énekelne. Talán ha a Suno újra generálná a zenét, már szebb eredményt kapnánk.
A CustomGPT ennél néhány fokkal jobbra sikerült.
A Gemini ismét izgalmas dalszöveget adott. Itt is kicsit az éneklés mintha nem állna össze.
Ebben a körben a Claude lett a legnagyobb nyertes. Nagyon jó dalszöveget hozott össze, és ehhez a Suno is jól tudott alkalmazkodni. A leírások részletesek, nagyon jól irányítják a dal menetét, pl. háttérben a kórus énekeljen. (mindezt magyarul írta, át kellett írni angolra, de ez apróság).


Az összegzés összegzése

Első és legfontosabb, hogy felejtsük el az „Egy gombnyomásra kapunk” valamit (jelen esetben egy komplett zenét)!
A mesterséges intelligencia esetében nagyon könnyen esünk abba a csapdába, hogy nagyon könnyen lehet valami látványosat alkotni. De amint kicsit jobban belemélyedünk, akkor mindjárt kiderül, hogy az MI programok leginkább a saját fejük (processzoruk) után mennek. Nagyon nehéz őket konkrét irányba terelni. Még nehezebb a hibákat javítani.

Nincs ez másképp a Suno esetében sem. Nagyon könnyű zenét készíteni. Az eredmény pedig nem tűnik rossznak. Igaz, nem pont ilyet akarunk.
Neki kell állni módosítani. Újra és újra kell próbálkozni. Át kell írni a szöveget, meg kell változtatni a stílust. Majd pedig a végén csak elő kell venni egy professzionális zene-szerkesztő programot.

Mi most ebben az esetben elfogadtunk az első dalszöveget, amit a nyelvi modellek adtak, majd az első dalt, amit a Suno generált. Mind a két helyen bőségesen lehet még dolgozni, hogy a dal több legyen a „Nem rossz” kategóriánál.

Ha a nyelvi modelleket nézem, akkor szerintem a ChatGPT és a CustomGPT nagyjából egy szinten van. Itt sok lényeges különbséget nem találtam. A promtot tovább állítgatva lehet még jobb dalszöveget készíteni. Ha megtaláltuk a legjobb utasítást, akkor pedig abból saját CustomGPT-t is építhetünk.

A Gemini és a Claude egészen hangulatos dalszövegeket készített. És talán írhatjuk azt, hogy kevésbé volt rózsaszín, mint a ChatGPT dalai.
A Claude esetében pedig kifejezetten tetszett, ahogy a dal szerkezetét (kórus, lassítás, gyorsítás) is megírta. Ő viszont mintha kevésbé énekelhető dalszövegeket készített.

Zárásként megállapíthatjuk, hogy nagyon izgalmas, ahogy a két különböző mesterséges intelligencia együtt dolgozik. Leírjuk a gondolatainkat, érzelmeinket, majd pár perc múlva kapunk egy személyre szabott dalt.

PixelRita!

Te is összegezzél!

Loading

Olimpia és a ChatGPT

Olimpia 2024
Becsült olvasási idő 4 perc.

Bevezetés

2024. július 26. és augusztus 11. között zajlanak az olimpiai játékok Párizsban.

Nézzünk meg néhány dolgot, hogy a mesterséges intelligencia miként tud ebben segíteni egy egyszerű nézőnek!
Én pl. szeretném nézni, de biztosan nem lesz időm arra, hogy mindegyik nap végig a TV (internet) előtt üljek. Viszont legalább a magyar versenyzőket jó lenne követni. De bevallom, nem tudom, kik indulnak, és azt sem, hogy melyik napokon lesznek.

A Wikipédián bőséges információt találunk a versenyzőkről. Az Olimpia hivatalos oldalán pedig a programot böngészhetjük. Nincs más dolgunk, minthogy ezekből összerakjunk egy naptárat! Ha sietünk, akkor estére talán végzünk is vele!

…ööööö… gyere ide ChatGPT!

ChatGPT

A ChatGT, ami egy nyelvi modell, pontosan ilyen feladatokra lett fejlesztve, ahol rengeteg adatból szeretnék összegyűjteni azokat, amik nekünk fontosak. Majd pedig más formára alakítjuk.

A ChatGPT rengeteget fejlődött a kezdeti időszak óta. Nem kell megkeresnünk a forrásanyagokat, mert a ChatGPT ezt is elvégzi helyettünk.
Sőt! Az évszámot sem kell megadnunk, csak azt, hogy az idei olimpiáról szeretnénk információt kapni.

Az utasítás:

Tudsz készíteni egy listát, hogy az idei olimpián a magyarok melyik sportágban és melyik napokon lesznek? 
A ChatGPT válasza az olimpiai magyarok kérdésre
A ChatGPT válasza az olimpiai magyarok kérdésre

Kaptunk egy szép kis listát.
De mit tanultunk meg az elmúlt időszakban? Azt, hogy az információ lehet téves vagy hallucinált. Tehát az eredményt mindig kétkedve fogadjuk!

Ebben a beszélgetésben az elején a program kiírja, hogy Searched 4 sites. Ez azt jelenti, hogy 4 oldalt is átböngészet. Ezt le tudjuk nyitni, hogy megkapjuk, pontosan mely oldalakon is járt.

A ChatGPT ezeket az oldalakat viszgálta át

Ha kiválasztjuk az angol Wikipédia oldalát, akkor láthatjuk, hogy Magyarország 87 játékossal indul(*).
Aha! A ChatGPT nem akart dolgozni! Ideje figyelmeztetni, hogy néhány embert kihagyott!

* Az adatokat július 17-én frissítették, de még így is lehetnek olyan változások, amik nem kerültek be ide.

A ChatGPT korrigálta a listát
A ChatGPT korrigálta a listát

Így már sokkal jobb! Most már láthatjuk, melyik sportnemben, melyik magyar játékos mikor fog versenyezni.
Persze több olyan versenyszám is van, ami nem egy napig tart. Aki tovább jut, őt majd a következő is figyelemmel kísérhetjük.

Olyan sok játékos indul, hogy még ez az összesített lista is kissé nehezen átlátható. Kérjük meg a ChatGPT-t, hogy inkább naptárként mutassa.

Naptár, hogy melyik nap ki játszik
Naptár, hogy melyik nap ki játszik

Nem lenne jó, ha mindezt be tudnánk írni az online naptárunkba, mint a Google vagy az Outlook? Hé ChatGPT! Készíts ebből naptár fájlt!

⚠️ Tipp: Érdemes direkt .ics formátumot kérnünk, mert azt minden program garantáltan tudja használni
Készül a naptár fájl
Készül a naptár fájl

A kapott fájlt mindjárt importáltuk a Google Naptárba. Most már jól látható, hogy melyik nap hol fognak a magyarok versenyezni.

Importálás a Google naptárba
Importálás a Google naptárba
⚠️ Később kértem egy jobban használható ICS fájlt. Aki szeretné, innen tudja letölteni.

Amikor ezt a bejegyzést készítettem, még nem kezdődtek el az olimpiai játékok. De kíváncsi voltam, tudna-e a ChatGPT arról egy táblázatot készíteni, amiben a nyerteseket láthatjuk. Ezért lekértem a korábbi, 2020-as eredményeket.
Még azt is kértem, hogy az érmeket emotikonokkal jelölje.

A 2020-as olimpia érem táblázat
A 2020-as olimpia érem táblázat

Nem maradt más hátra, mint kérni egy nyitó képet a magyar olimpiai versenyzőkről.

2024 Olimpia - by Dall-E
2024 Olimpia – by Dall-E

PixelRita

Illetve itt van PixelRita is. Neked hogy tetszett?

Loading

Melyik dinnyét válasszuk?

Becsült olvasási idő 5 perc.

A városi dzsungelben

Városi emberként egyik gyakori gondunk lehet, hogy túlságosan eltávolodtunk a természettől. Ami nagyanyáinknak természetes és könnyű volt, az városiként akár megoldhatatlan akadályként tornyosulhat előttünk.
Ilyen lehet az, amikor friss zöldséget, vagy gyümölcsöt szeretnénk venni. A legjobbat szeretnénk kiválasztani. Na de ki tudja, hogy melyik a legjobb?

Talán a mesterséges intelligencia (MI) ebben segíteni tud!

Melyik a legjobb dinnye?

2024. nyarán a három legismertebb MI-Chat program (ChatGPT, Google Gemini, Anthropic Claude) már képes a feltöltött képet elemezni, és tippeket adni.

Persze mindez még csak egy kép! A dinnye vizuális megjelenését olyan apróságok is erősen befolyásolhatják, mint a megvilágítás vagy a telefon kamerájának állapota és tisztasága. Az MI nem fogja tudni a dinnyét megfogni, megforgatni, megkopogtatni stb.
Tehát csak abból az információból tud dolgozni, amit mi adunk neki. De így is óriási segítség lehet.

Csoportkép a dinnyékről

A kísérlethez bementünk a legközelebbi dinnye lelőhelyre, majd egy óvatlan pillanatban lefényképeztük, amint csoportosan egymáson tornyosulnak.

A képen senki sem mosolygott, de legalább senkinek sem állt égnek a haja!

Dinnyék csoportulása
Dinnyék csoportulása

A kérdés

A kérdésekkel nem akartunk mindenféle hosszú utakat bejárni kezdve Dinnye Ádámtól és Dinnye Évától. Direkt rákérdeztünk, melyiket érdemes megvenni.

Íme az utasítás (prompt):

A képen látható dinnyék közül melyiket válasszam? 

Claude 3.5 Sonnet

A Claude 3.5-ös modellje nagyon fejlett. Nagyon jó a képfelismerő programja. E mellett az Anthropic híres arról az elkötelezettségtől, hogy a válaszai semmiképpen se ártsanak az embereknek.

A Claude tanácsai a dinnye választásához
A Claude tanácsai a dinnye választásához

A Claude nagyon jól leírja, hogy milyen tulajdonságok alapján válasszunk dinnyét, de nem mondja meg, hogy a képen melyiket válasszuk. A többi nyelvi modellnél is előfordul, hogy első kérdésre inkább általános választ kapunk.
Ezért direkt megkérdezzük, hogy melyiket javasolja.

A Claude inkább elkerüli a választással járó felelősséget
A Claude inkább elkerüli a választással járó felelősséget

A Claude nyelvi modellel nincs könnyű dolgunk. Mindjárt 4 okot is felsorol, amiért nem javasol egy konkrét dinnye vásárlását egyetlen kép alapján:

  • Kép alapján nem lehet dinnyét választani. Azt meg kell fogni, tapintani, kopogtatni, stb…
  • A képen nem látszik a teljes dinnye.
  • A kép nem mutatja a dinnye súlyát, ami szintén fontos információt adna.
  • Ha az ő tanácsára választunk dinnyét, és a nem lenne jó, akkor esetleg szomorúak lennénk. Az pedig nem lenne jó.

Google Gemini (2024.07.15-ös verzió)

A Google a mesterséges intelligencia népszerű megjelenése előtt is régóta dolgozott azon, hogy a program minél jobban értelmezze a kép tartalmát (gondoljunk a képkeresőre). Így reménykedhetünk abban, hogy megfelelő elemzést kapunk.

A Google Gemini dinnye választása
A Google Gemini dinnye választása

A Google Gemini azt javasolja, hogy a bal oldalit válasszuk. Esetleg a középsőt, bár az nem tűnik annyira érettnek. Végül pedig a jobb oldalit nem javasolja, mert szerinte az éretlen.

Majd pedig kapunk néhány tippet, miképpen is válasszunk dinnyét.

ChatGPT 4o

2024. májusában jelent meg a GPT-4o. Az O az omni rövidítése, ami a modell multimodális képességére utal. A GPT-4o képes különböző típusú adatokat kezelni, beleértve a szöveget, audio-, kép– és videó tartalmakat is.
Ráadásul a GPT-4o verziót azok is használhatják, akiknek nincs ChatGPT előfizetésük. Igaz, a lehetőségek korlátozottabbak, de dinnye szakértőnek használhatjuk.

A ChatGPT dinnye választása
A ChatGPT dinnye választása

A ChatGPT először tippeketad, miképpen érdemes dinnyét választani. Utalva ezzel arra, hogy inkább a fejünket használjuk, ne egy programot.
Majd pedig azt javasolja, hogy a bal oldalon a középső, vagy a jobb oldalon a középső feletti dinnye a megfelelő választás.

CustomGPT

Természetesen az internet népe mindenre készített CustomGPT-t. Így találunk néhány dinnye választó programot is. Én egy angol (link) és egy török (link) nyelvűt találtam. Bármikor jelenhetnek meg újak, a nyár még nem ért véget!
Kérjük meg a GPT-t, hogy a választ magyarul írja!

A Karpuz CustomGPT választása
A Karpuz CustomGPT választása

A Karpuz GPT a jobb felső sarokhoz közeli dinnyét javasolja. Megjegyzi, hogy több fénykép pontosabb analízist eredményezne. Mellette pedig kapunk tippeket a dinnye vásárlásához.

Összegzés

Az elmúlt másfél évben – mióta a nyelvi modellek kiléptek a rivaldafénybe – rengeteget fejlődött a képek értelmezése és analizálása. Várhatóan rövid időn belül még pontosabb eredményeket kaphatunk.

A fenti példa inkább egy bemutató, egy játék, hogy a nyelvi modellek a mindennapi kihívásokban segíthetnek, ha fényképet mutatunk a problémáról.
Legyen az akár egy könyv keresése a polcon, egy árú keresése a boltban, termékösszetevők elemzése, árak összehasonlítása, növény azonosítása, segítség alkatrészekhez, probléma megoldása fénykép alapján, földrajzi tájékozódás, stb…
Gondoljunk rá úgy, mint egy társra, akihez kérdésekkel fordulhatunk!

Természetesen, mint a hasonló esetekben, a nyelvi modellek nem tévedhetetlenek. Sőt! Előfordulhat, hogy a képet rosszul értelmezi, így hibás alapokról indul, rossz következtetésekre jut.
A válaszokat mindig mérlegeljük, és inkább a saját belátásunk szerint döntsünk.

PixelRita

Te mit gondolsz erről?

Loading

Készülődés a nyárra a ChatGPT-vel és a Geminivel

Becsült olvasási idő 18 perc.

Bevezető

Itt van a nyár, ugye komám, a szív a ChatGPT-nek szalutál,
tervezzük meg együtt a nagy kalandot,
hova menjünk, hol együnk fagyit, és mit fedezzünk fel

Bátran rikkant, nyaralók ho-ho-ho-ho-ho,
megint csak ho-ho-ho-ho.

Van itt ötlet és sok program, az eszem pedig jól forog,
útiterv útitervre kiválón sorjáz, ravasz a nagy nyári kaland.

Városbéli nyaralók, ha tanács kell, hol van a legjobb hely,
ChatGPT megmondja gyorsan, hallgassátok,
amit most néktek eldalol a nagy nyári kaland.

Ha itt a nyár, ugye komám, a szív a ChatGPT-nek szalutál,
tervezzük meg együtt a nagy kalandot,
hova menjünk, hol együnk fagyit, és mit fedezzünk fel.

Bátran rikkant, nyaralók ho-ho-ho-ho-ho,
megint csak ho-ho-ho-ho.

Van itt ötlet és sok program,
az eszem pedig jól forog,
útiterv útitervre kiválón sorjáz,
ravasz a nagy nyári kaland.

Városbéli nyaralók, ha tanács kell, hol van a legjobb hely,
ChatGPT megmondja gyorsan, hallgassátok,
amit most néktek eldalol a nagy nyári kaland.

Itt van a nyár, és hamarosan utazunk!
Csakhogy egy nyaralás megszervezése nagyon összetett feladat: utazás, szállás, étkezés, látnivalók, mindenki mást akar, mindenkinek más a tempója, mennyibe fog kerülni, stb. stb.
Szerencsére itt a mesterséges intelligencia, amely óriási segítséget tud nyújtani nekünk a tervezésben. Ráadásul a tavaly évhez képest nagyon sokat fejlődött!

Az utazás tervezése

Előkészületek a mesterséges intelligencia segítségével

ChatGPT

Ebben a bejegyzésben a ChatGPT-4o modellt használtuk.

ChatGPT Memória

A ChatGPT-ben 2024. év elején megjelent a Memória funkció. Ez most roppant hasznos lesz nekünk!
Megadhatjuk a programnak, hogy pl. én szeretem a sajtot ezért a programba mindenképpen iktasson be legalább egy sajt boltot. Megmondhatjuk neki, hogy melyik családtag mit szeret, mik a preferenciánk, és mit kerüljünk el mindenképpen. Arra is kérhetjük a GPT-t, hogy inkább történelmi sétákat, múzeumlátogatásokat, gasztronómiai vagy vásárlós túrákat szervezzen. Beállíthatjuk a pénztárcánkat is, hogy keveset, vagy sokat szeretnénk költeni.
És még nagyon sok mindent, amivel személyre szabhatjuk a nyaralást.

CustomGPT

Memóriának vannak hátrányai is: korlátozott a mérete (kb. 2 oldalnyi szöveg, ami körülbelül 1000 szó lehet – 2024. június), minden beszélgetésen ott van, nem lehet külön választani, stb.

Érdemes lehet a nyaralásokhoz egy saját CustomGPT-t készíteni, ahova ugyan úgy részletesen be tudjuk írni a család kívánságait, preferenciáit.

Kreálhatunk többet, több félét is. Pl. ha az egész család megy, amikor csak a felnőttek, amikor üzleti utazásról van szó, külön egyet a nyárra és külön a télre. Vagy akár a bőrönd összeállításában segítő CustomGPT-t és alkothatunk.

CustomGPT kifejezetten a családi nyaralásra tervezte
CustomGPT kifejezetten a családi nyaralásra tervezte

Az utazás tervezése

Most, hogy a memória fel van töltve, nincs más dolgunk, mint hogy megmondjuk a ChatGPT-nek, hogy mikor, hova és hány napra szeretnénk menni. Adjuk meg azt is, hogy készítsen részletes programot minden személy számára!

Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából

Mivel beírtuk az, hogy ki mit szeretne látni, a programot e szerint állította össze.

Kaptunk egy listát, hogy mely programokat kinek ajánlja, mellette a belépő árakkal is. A ChatGPT odafigyelt arra is, hogy a felnőtteknek felnőtt, a gyerekeknek gyerek jegyet írjon fel. Ahol pedig lehet, ott a családi jegyet javasolta.
Majd közös programokat is ajánlott.
A végére pedig néhány tippet is írd, minthogy érdemes online foglalni, használjunk városnéző buszokat, és legyen nálunk sok víz.

Ne felejtsük el, hogy ez nem egy egyszeri lekérdezés! Ez még csak a beszélgetés kezdete!
Kérjünk további tippeket a ChatGPT-től. Kérjünk bővebb információkat a látnivalókról, múzeumokról! Puhatoljuk ki, hogy nekünk vagy a családtagoknak ez mennyire tetszene, stb.

  • Az X múzeum nem tetszik, ajánlj helyette másikat
  • Mi látható az Y múzeumban. Mennyi idő alatt lehet megnézni?
  • Szerinted a kisebb gyereket érdekelheti a Z múzeum?
  • Javasolj egy kávézót a múzeum közelébe!
  • Készíts egy listát a belépőjegyekről forintban.
  • Tudunk online jegyet venni?
  • Van-e a közelben…?
  • Mit érdemes fényképezni?

Majd pedig a végén kérjünk egy részletes táblázatot, hogy melyik nap mit nézünk meg, és mennyibe kerül!

💡 Tipp
Írjuk bele az utasításba, hogy jelezd, mennyire megbízhatóak és naprakészek az információk, adjál linket is.
Ez segít az adatok ellenőrzésében.

Google Gemini

Utazás tervezése a Google-el

A Google Gemini nyelvi modelljétől azt várjuk, hogy sokkal pontosabb és részletesebb lesz, mint a ChatGPT. Hiszen az utazással kapcsolatos adatokból (szállodák, éttermek, vásárlási helyek, múzeumok, térképek stb.) sokkal bőségesebb mennyiség áll a rendelkezésére. Ráadásul a Google évek óta ezzel foglalkozik, csak nem mesterséges intelligencia formában.

Én a teszt során az ingyenes Google Gemini-t használtam. A fizetős verzió jobb eredményt hozhat. Illetve a modellt is folyamatosan fejlesztik. Ami ma nem működött, holnap már talán igen!

Gyűjtsük az információkat!

A Google Gemini esetében nincs hír arról, hogy terveznének egy Memóriához hasonló funkciót (de hát elvileg a Google úgyis tud rólunk mindent, nem?). De semmi gond! A kezdő utasításban ugyan úgy megadhatunk minden fontosabb adatot.
Majd pedig írjuk le, hogy mikor, hova, hány napra megyünk, és mit szeretnénk csinálni!

Részlet a Google Gemini utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából

A Google nagyon szép listát adott a látnivalókról. Kaptunk képeket, linkeket és még árakat is. Mindez segít a helyszínek kiválasztásában.

A végére kaptunk tippeket, hogy használjunk CityCart-ot (itt Roma Pass), ami kedvezményt nyújt. A Gemini továbbá javasolta a térképek letöltését, néhány helyi szó megtanulását, majd pedig, hogy legyen kényelmes cipőnk, mert sokat kell gyalogolni.

Ne felejtsük el, hogy ez nem egy egyszeri lekérdezés! Ez még csak a beszélgetés kezdete!
Kérjünk további tippeket a Google Gemini-től. Kérjünk bővebb információkat a látnivalókról, múzeumokról! Puhatoljuk ki, hogy nekünk vagy a családtagoknak ez mennyire tetszene, stb.

  • Az X múzeum nem tetszik, ajánlj helyette másikat
  • Mi látható az Y múzeumban. Mennyi idő alatt lehet megnézni?
  • Szerinted a kisebb gyereket érdekelheti a Z múzeum?
  • Javasolj egy kávézót a múzeum közelébe!
  • Készíts egy listát a belépő jegyekről forintban
  • Tudunk online jegyet venni?
  • Van-e a közelben…?
  • Mit érdemes fényképezni?

Majd pedig a végén kérjünk egy részletes táblázatot, hogy melyik nap mit nézünk meg, és mennyibe kerül!

💡 Tipp
Írjuk bele az utasításba, hogy jelezd, mennyire megbízhatóak és naprakészek az információk, adjál linket is.
Ez segít az adatok ellenőrzésében.

Kávézók, éttermek, fagyizók

Ha már megyünk valahova (és pénzünk is van véletlenül), akkor érezzük is jól magunkat!
De egy nagyvárosban és a népszerű turista helyeken számtalan hely létezik, ahova kávézni, süteményt vagy fagyit enni be lehet ülni.

Kérdezzük meg a mesterséges intelligenciát, mit tud javasolni nekünk. Az MI nemcsak az adatok gyűjtésében, hanem azok feldolgozásában, értelmezésében és rendezésében tud sokat segíteni. Nem kell különböző web-oldalakat átböngészni. Nem egy felsorolást látunk, hanem egy rendezett listát az általunk választott szempontok szerint.

A prompt

Egy példa az utasításra (prompt), ami segíthet a kávézók kiválasztásában.

Róma belvárosában javasoljál olyan helyeket, ahova érdemes beülni kávézni.
Készíts egy táblázatot az alábbi szerint: Hely neve, típusa, épület típusa, kedvenc kávé, kedvenc sütemény, árkategória, távolság a központtól.
15 helyet írjál!

A fenti utasítást kedvünk szerint módosíthatjuk. És természetesen nemcsak kávéházat, fagyizót vagy éttermet kérhetünk így, hanem tetszés szerint bármi mást is: sajtbolt, játékbolt, ékszerbolt, múzeum, szökőkút, stb.

ChatGPT

A ChatGPT erőssége a Memória, illetve a CustomGPT lehet, ahol beállítottuk a kedvenceinket. Így pl. ha valaki nem szereti a halat vagy allergiája van, akkor a program az olyan helyeket nem fogja javasolni.

A ChatGPT ajánlott kávéházai
A ChatGPT ajánlott kávéházai

A kész táblázatot Excel formába exportálhatjuk, ha szeretnénk vele tovább dolgozni. Illetve a GPT-4o már interaktív táblázatot is készít, hogy helyben dolgozzunk az adatokkal. Pl. árkategória szerint rakhatjuk sorba a kávézókat.

Természetesen a táblázat elkészülte még nem jelenti a beszélgetés végét. További kérdéseket tehetünk fel a programnak (pl. mi az az xzy étel?), bővíthetjük vagy szűkíthetjük a listást, stb.

Google Gemini

A Google erőssége, hogy mérhetetlenül sok naprakész helyi információi vannak. Ellentétben a ChatGPT-vel, ami web-oldalakról és leírásokról gyűjti az adatokat, a Google a Térképre feltöltött óriási tudásbázissal rendelkezik. Nekünk már csak ki kell nyerni belőle az adatokat.

A Google Gemini ajánlott kávéházai
A Google Gemini ajánlott kávéházai

A Google Gemini is nagyon jól átlátható táblázatot készített a kávéházról (szintén exportálható további feldolgozásra, ezúttal a Google Számolótáblába).

Most kérjük meg, hogy az ajánlatokat mutassa meg térképen is!

A Google Gemini ajánlott kávéházai térképes listában.
A Google Gemini ajánlott kávéházai térképes listában.

Elsőnek egy listát kaptunk, ahol a nevekre kattintva a Google Térképre jutunk. Így mindjárt fel is vehetjük a kávézót a mi térképünkre.
Majd pedig egy tényleges térképen is láthatjuk, melyik kávézó hol található.

Ráadásul a térképen látható pontok tényleg ott vannak, ahol a kávéház is (amennyiben eredetileg is jó helyre tették a pontokat). Hiszen a Google az adott helyeket a saját Térkép adatbázisával köti össze, nem pedig különböző web-oldalak leírása alapján próbálja a helyet megtalálni.

A Google Gemini ajánlott kávéházai a térképen.
A Google Gemini ajánlott kávéházai a térképen.

Hotel

Hotel keresése 2024-ben igazán nem probléma! Rengeteg oldalt találunk, ahol százával (ezrével, tízezrével) vannak a szállodák. Választhatunk szűrőket (ingyenes wifi, reggeli a szobába), beállíthatjuk az árkategóriát, és még számtalan mást is.

De vajon tudunk-e olyan hotelt keresni, ahonnan látszik az Akropolisz Athénban? Vagy ahol kék a szőnyeg? Ahol olívabogyót adnak a reggelihez?

Kérdezzük meg a mesterséges intelligenciát, ő tud-e segíteni az ilyen extra kívánságainkban is?
És persze nem akarok Euróban számolni. Forintban* kérem az árakat!

(* a Forintba számolás attól függ, hogy milyen árfolyamot használ, az mennyire frissek az adatok, stb. érdemes lehet megadni, hogy 1 euró = x Forint)

A prompt

Gyűjtsél nekem 5 hotelt Athénban, ahol 2 felnőtt és 2 gyerek július közepén nem tud szállni. Autóval megyünk ezért legyen garázs vagy parkolási lehetőség. Legyen ingyenes wifi, és kilátás az Akropoliszra.
Az árakat forintba számold!

ChatGPT

A ChatGPT előnye ismételten az, hogy előre meg tudtuk adni a preferenciánkat és nyűgjeinket.

Nem biztos, hogy a legjobb helyeket találta meg, de egy korrekt listát kaptunk.
Hátránya, hogy a különböző weboldalak leírásai alapján készült a lista. Bizonyára találunk olcsóbb helyeket is…

A ChatGPT hotel listája kilátással az Akropoliszra
A ChatGPT hotel listája kilátással az Akropoliszra
A ChatGPT hotel listája ahol reggelire olíva bogyót is adnak

Google Gemini

A Google ismét a saját adatbázisát, a Google Szállodákat használta. Tehát több, jobb és pontosabb adatból tud dolgozni. Viszont nem vette figyelembe a külső oldalak leírásait. Így ha a hotel nem írja le, hogy látszik az ablakból az Akropolisz, akkor ezt a Google Gemini sem tudja megmondani. Még akkor sem, ha a hotel képeinek nagy részén rajta van.

Volt hír róla, hogy a Google szeretne egy olyan mesterséges intelligencia programot kifejleszteni, ami a Térképre feltöltött képek tartalmát tudná értelmezni. Amikor ez működni fog, akkor már tényleg lehet az olyan extrákra is keresni, hogy mit adnak reggelire, ilyen színű a függöny, milyen konnektor van a szobában, mi van a minibárban, vagy bármi másra amit valaki lefényképezett és feltöltött.

Addig használjuk a Google Szállodákban talált információt, amik között ilyeneket találunk, mint az átlagos értékelés, légkondicionáló, stb.

(Nálam az árak török lírában (TRY) jelennek meg, mert Isztambulból írom a blogot. Pedig kértem, hogy forintban számoljon)

A Google Gemini hotel listája
A Google Gemini hotel listája

A szállodákat rendezett formában is láthatjuk: kis kép a hotelről, átlagos értékelés (hányan értékelték), a szálloda tulajdonsága, és ára.

A Google Gemini hotel listája
A Google Gemini hotel listája

Belépőjegy

Maradjunk továbbra is a tervezésnél!

Mind a ChatGPT, mind a Gemini a saját adatbázisa alapján dolgozik. Ez lehet elavult, vagy akár téves is, ami miatt nem a konkrét belépő jegy árat fogjuk látni. Minden esetben ellenőrizzük a múzeum hivatalos weboldalán az aktuális árakat!!

Ez sokszor egyáltalán nem olyan egyszerű, mint látszik!
Sok országban előfordul, hogy az angol nyelvű árlista elavult, vagy el sem készült. Így nekünk a német, olasz, francia, vagy akár török oldalon kell kibogarásznunk, hogy akkor mi mennyibe is kerül.

És persze van felnőtt jegy, gyerek jegy, meg diák jegy, meg 16 év alatti jegy, meg családi jegy, meg amiben audioguide is van, meg amivel az emeletre is fel lehet menni, meg ha délután 5 után megyünk, meg ha éppen havazik, meg ha öttagú családdal vagyunk és veszünk csavaros csokifagyit és a mesebarlangot is akarjuk lát és a retúr kisvasút is benne van de a nagypapát inkább a sörözőben hagynánk félúton….

Nos, a mesterséges intelligencia pont az ilyen dolgokat látja át (vagy mégsem?)

Feladat

Kérjük meg a mesterséges intelligenciát, hogy a megadott weboldalról gyűjtse össze a belépő jegyek árait.
Bécsben a Schönbrunn kastély árlistáját adtuk oda a programoknak. Ez egy közepesen összetett oldal.

Schönbrunn kastély belépő árai valójában
Schönbrunn kastély belépő árai valójában

A feladat is összetett. A jobb átláthatóság értelmében az eredményeket pontozzuk.

A program feladatai (összesen 7 pont)

  • A weboldal nem magyar nyelvű (jelen esetben német), mi mégis magyarul szeretnénk látni, hogy melyik jegy mit is takar pontosan. (1 pont)
  • Mind a 16 jegyet írja le (2 pont)
  • Találja meg, hogy mennyi ideig tartanak a túrák (1 pont)
  • 2 felnőtt és 2 gyerek jegyet kérünk. A programnak ezt az információt meg kell találnia, és ki kell számolni a jegy árát 4 főre. (2 pont)
  • A jegy árakat át kell számolnia forintba, az átváltási rátát magának kell megtalálnia (1 pont)

A prompt

Készíts egy magyar nyelvű táblázatot az alábbi link alapján Schönbrunn kastély összes belépő jegyéről.
Írd le a jegy nevét, mennyi ideig tart, mi látható, mennyibe kerül 2 felnőtt és 2 gyerek részére euróban, mennyibe kerül a családnak forintban, és ha van egyéb információ azt is.
https://www.schoenbrunn.at/unsere-tickets-touren/alle-tickets-touren

ChatGPT

Mind a 16 jegy leírása nagyon hosszú. Az ilyen feladatok elől a ChatGPT próbál kibújni. Csak a legfontosabb jegyeket szedte össze.

Schönbrunn kastély belépő árai by ChatGPT
Schönbrunn kastély belépő árai by ChatGPT
  • Megkaptuk a túrák magyar ismertetőjét: 1 pont
  • Nem írta le mind a 16 jegyet – 0 pont
  • Megtalálta a túrák időtartalmát – 1 pont
  • 2 felnőtt és 2 gyerek belépő árát megtalálta, és jól adta össze – 2 pont
  • A jegyárakat átszámolta forintba. Ez persze eltérhet a napi árfolyamtól, így mi is megadhatjuk, hogy 1 Eurót hány forintnak számoljon. – 1 pont.

A ChatGPT ebben a feladatban 6 pontot ért el. Kis noszogatással mind a 16 jegy adatait le tudjuk kérni a programtól, és akkor meglesz a 7 pont is.

Természetesen a beszélgetés most sem ért a végére. Bízva abban, hogy a ChatGPT több információval rendelkezik, mi pedig megadtuk a preferenciánkat, kérdezgessünk a túrák tartalmáról: melyik érdekelheti a gyerekeket, mennyire fárasztó, mit lehet látni, stb.

Google Gemini

A Gemini esetében kicsit tovább jutottunk. Ő már 9 jegyet gyűjtött össze a 16-ból.
Továbbá kaptunk extra információkat, hogy a jegyek online megvásárolhatóak, vannak kombinált jegyek, éjszakai túrák, de még koncertek is!

Schönbrunn kastély belépő árai by Google Gemini
Schönbrunn kastély belépő árai by Google Gemini

Eredmény:

  • Megkaptuk a túrák magyar ismertetőjét: 1 pont
  • Nem írta le mind a 16 jegyet, csak a felét – 1 pont
  • Megtalálta a túrák időtartalmát – 1 pont
  • Az árakat nagyon rosszul rakta össze. Nem sikerült rájönni, miképpen számolta ki őket… – 0 pont
  • Bár hibás jegyárral indult, de a számolás pontos. Ez persze eltérhet a napi árfolyamtól, így mi is megadhatjuk, hogy 1 Eurót hány forintnak számoljon. – 1 pont.

A Google Gemini ebben a feladatban 4 pontot ért el. Többszöri próbálkozásra is rossz árakat kaptunk. Más oldalakon kaphatunk jobb (és rosszabb) eredményt. Illetve idővel bizonyára ez is javulni fog.

Természetesen a beszélgetés most sem ért a végére. A Google rengeteg adattal rendelkezik, így kérdezgessünk a túrák tartalmáról: melyik érdekelheti a gyerekeket, mennyire fárasztó, mit lehet látni, mik a tapasztalatok, stb.

A mesterséges intelligencia használata az utazás alatt

A mesterséges intelligencia nemcsak a tervezésben, hanem aktívan az utazásban is tud segíteni. Többek között egyre jobban fejlődnek az azonnali tolmácsolási képességek.

Az alábbi példákban az MI azon tulajdonságait használjuk, hogy a látott képet értelmezze, majd pedig segítsen nekünk, hogy mi is értsük mit látunk. Vagy mit eszünk, vagy mit veszünk.

Étlap fordítása és értelmezése

Feladat

A program kap egy lefényképezett étlapot, ahol nemhogy magyarul, de még angolul sincsenek az ételek feltüntetve. Szeretnénk tudni, hogy mégis mi micsoda, és mennyibe került, meg mik azok a rövidítések.

100%-ban olasz étlap
100%-ban olasz étlap

A program feladatai (összesen 8 pont)

  • Le kell fordítania az étlapot magyarra (1 pont)
  • Az árakat át kell számolnia forintba, az átváltási rátát magának kell megtalálnia (*). (2 pont)
  • A zárójelekben található allergiákat értelmeznie kell (1 pont)
  • Rákérdezünk egy konkrét ételre a menüből, és ezt magyarázza el. (1 pont)
  • Kérünk egy képet az adott ételről (1 pont)
  • Kérünk egy receptet, hogy otthon is meg tudjuk főzni (1 pont)
  • Kérünk étel ajánlatot. Nem túl laktató, és gluténmentes legyes (1 pont)

(*) A pontosabb számolás érdekében megadhatjuk, hogy 1 euró hány forint.

A prompt

🍴 Írd le az összes ételt magyarul ami ezen a képen van. Írd le azt is, hogy hány forintba kerülnek

🍴 Mit jelentenek a GL, U, L, P stb. rövidítések?

🍴Ez az étel nagyon tetszik: Zöld tagliolini fehér raguval, mogyoróval és moliterno sajttal

🍴Mutatnál róla egy képet?

🍴Írjál több információt erről az ételről

🍴Írj egy pontos receptet ennek az ételnek az elkészítéséről!

🍴Közepesen vagyok éhes. Valami olaszos ételt szeretnék az étlapról, ami nem tartalmaz glutént

ChatGPT

Étlap fordítás

Az étlap, ahogy a ChatGPT legordította
Az étlap, ahogy a ChatGPT legordította

Szúrópróba-szerűen kiválasztottam néhány ételt, és úgy tűnik, hogy a fordításban nincs hiba. A kapott eredményt már tudjuk használni arra, hogy ételt válasszuk magunknak.

Az árak, és a forintba átszámolás teljesen jó. A program egy kissé régi átváltási arányt használt.

Rövidítések

Mit jelentenek a rövidítések? A ChatGPT megmondja!

ChatGPT allergia kódok
ChatGPT allergia kódok

Ez kritikus rész annak, akinek allergiája van. A menü alján külön le van írva, hogy melyik kód mit jelent, így a ChatGPT-nek csak ezt kellett értelmeznie. Ezt a feladatot most jól teljesítette, de a program hibázhat is!!

Ha valamire allergiánk van, inkább készüljünk fel rá az adott nyelvből!

Több információ az ételről

Az összetevők alapján még nem derül ki, hogy milyen étel is van a menüben. Talán egy kép tudna segíteni a döntésben!
A ChatGPT gyorsan rajzolt is egyet. A Dall-E mesterséges intelligencia rajzolót használta. Nem biztos, hogy bármiben is hasonlít a valódira!

A ChatGPT rajzolt egy képet az ételről
A ChatGPT rajzolt egy képet az ételről

Ha még ezek után is szeretnénk többet tudni az ételről, akkor a ChatGPT bőséges információval lát el minket.

A ChatGPT további információkat adott az ételről
A ChatGPT további információkat adott az ételről

És ha már itt járunk, akkor egy receptet is kérünk, hogy otthon is meg tudjuk főzni.

A ChatGPT írt egy receptet adott az ételről
A ChatGPT írt egy receptet adott az ételről

Természetesen mindez csak egy kísérlet. Amikor az étteremben ülünk, akkor nem lehet az összes ételt ilyen bőségesen lekérdezni, mert akkor két napig csak ezeket az információkat fogjuk böngészni.

Inkább kérjük meg a programot, hogy ő javasoljon valamit!

Étel ajánló

A ChatGPT esetén ismét segítségünkre lehet, ha előtte betanítottuk a programot, hogy mit szeretünk, mit nem, és mire vagyunk allergiásak. Ezt természetesen az utasításban is megadhatjuk.

A ChatGPT ajánlata
A ChatGPT ajánlata

Összegzés

  • Az étlap fordítása sikerült: magyarul van, érthető, átlátható (1 pont)
  • Az árakat forintba is átszámolta.. (2 pont)
  • Az allergia táblázat is jó lett. (1 pont)
  • Elmagyarázta azt az ételt, amit kértünk (1 pont)
  • Kértünk egy képet az ételről, erre rajzolt egyet. A valódi kép jobb lett volna (0,5 pont)
  • Megkaptuk a receptet (1 pont)
  • Az étel ajánlat is rendben van. Mindegyik gluténmentes. (1 pont)

Összesen 7.5 pontot szerzett a ChatGPT, ami elég jónak számít. Megbízhatóan használhatjuk az étteremben az étel választásánál.

Csak sajnos az egész technika borzasztóan lassú! Akár 10 percek is eltelhetnek, míg az MI segítségével ételt választunk. Sokat tudunk gyorsítani a folyamaton, ha Memóriával vagy CustomGPT-vel megtanítjuk a programnak, hogy milyen ételeket szeretünk, miket kerülnénk el, stb.

Google Gemini

A Google régóta dolgozik mind a fordító programon (Google Translate), mind a kép értelemező technikákon.
Egy étlap lefordítása és értelmezése nem okozhat neki problémát

Étlap fordítás

A fordítás teljesen jó! Sajnos az árakat nem számolta át forintba.

Rövidítések

Az összes rövidítést nem írta le magyarul, csak néhányat. Lehet, hogy pont azt nem, amire szükségünk van.

De ilyen esetekben ne bízzuk magunkat a mesterséges intelligencia változó eredményeire! Ha valamilyen allergiánk van, vagy csak nem szeretjük valamelyik ételt, akkor készüljünk fel rá az adott nyelvből!

Több információ az ételről

Most lássuk, milyen információkat kapunk a Google Geminitől, ha többet szeretnénk az adott ételről megtudni!

A Google Gemini nagyon lelkes volt! Nemcsak több információt kaptam, de mindjárt elkezdte a receptet is megírni (lehet, hogy ismert engem?).

A program „hangulatától” függően képet is kapunk. De ha külön kérjük, végül szerez egyet az internetről. Így jó eséllyel azt látjuk, ami a majdani étel lesz.

Étel ajánló

Ha minden ételről ilyen részletes ajánlatot kérünk, az rengeteg időt igényel. Inkább kérjük meg a Geminit, hogy válasszon nekünk egy ételt. Megadhatjuk azt is, hogy miket szeretünk, és miket kerüljön el.

Összegzés

  • Az étlap fordítása sikerült: magyarul van, érthető, átlátható (1 pont)
  • Az árakat nem számolta át forintba. (0 pont)
  • Az allergia táblázat hiányos. Ha többször kérjük, megkapjuk a teljes listát. (0.5 pont)
  • Elmagyarázta azt az ételt, amit kértünk (1 pont)
  • Kérésünkre talált egy képet az ételről az interneten (1 pont)
  • Megkaptuk a receptet, még kérés nélkül is (1 pont)
  • Az étel ajánlat is rendben van. Mindegyik gluténmentes. (1 pont)

Összesen 5.5 pont.
Az eredmény kissé hullámzó, és sokszor kell a programot noszogatni. De valós helyzetben használni tudjuk, segít az étel választásban.

Bár sajnos maga az egész technológia túlságosan lassú. Sokat segít, ha meghatározzuk, milyen típusú ételeket kedvelünk.

Vásárlás

Amikor idegen helyen vagyunk dolgok vesznek körül minket. Az üzletben sorban állnak a furcsábbnál furcsább dolgok, és csak arra várnak, hogy valaki hazavigye őket.

Azt viszont nem szeretnénk, hogy otthon derüljön ki, hogy fogalmunk sincs, mit vettünk és minek. Egyáltalán mit kellene vele csinálni? Fogom én ezt szeretni? Ezt tényleg meg kell enni?

A mesterséges intelligencia nekünk segít, hogy ezek a fontos kérdések még a boltban derüljenek ki.

Az utasítás ezúttal roppant egyszerű:

 Ez micsoda, és mit lehet vele csinálni?

A képet direkt úgy fotóztuk, hogy a felírat jól olvasható legyen. Minél több információt adunk az MI-nek, annál jobb eredményt kapunk.

ChatGPT

A ChatGPT leírása az UFO-sajtról
A ChatGPT leírása az UFO-sajtról

A ChatGPT adott néhány alapvető információt (igen, ez sajt. igen, meg lehet enni). Majd pedig adott tippeket a használatához is.
További beszélgetés során nagyon jó kis receptekkel állt elő, hogy mire lehet ezt a sajtot használni.

Google Gemini

A Google Gemini leírása az UFO-sajtról
A Google Gemini leírása az UFO-sajtról

A Google Gemini nagyon részletesen ismertette a képen lévő sajtot. Még a tápértékről is készített egy listát, ami nagyon nehezen olvasható a képen. Valószínűleg inkább máshonnan kereste meg az ide vonatkozó adatokat.

A Geminivel is további beszélgetéseket folytatva nagyon jó tippeket és recepteket kaphatunk.

Bor választás

Még mindig az üzletben vagyunk. Velünk szemben egy polc tele van különféle ismeretlen borokkal. Hogyan válasszunk? A legdrágábbat vigyük? A legszebbet? A legsötétebbet? Amelyiknél a címkén egy lány van vagy amelyiken fiú?
Megannyi kérdés, de egyik sem segít a választásban.

Inkább küldjük el a képet a mesterséges intelligenciának!

ChatGPT

ChatGPT borok listája rövid ismertetővel
ChatGPT borok listája rövid ismertetővel

A ChatGPT-t direkt megkértük, hogy egy rövid ismertetőt is írjon. Fontos, hogy a GPT-4o modellt használtuk, mert a többi esetleg rövidebb leírást ad, vagy nem lesz teljes a lista.

Összesen 19 borról kaptunk rövid leírást (a kép alsó sorában lévőket már nem tudta értelmezni). Ennyi információ már biztosan segít a választásban.

De megkérhetjük a ChatGPT-t is, hogy ő javasoljon egy bort nekünk, vagy a barátunknak. Természetesen adjunk minél több információt, hogy milyen italt szeretnénk!

A ChatGPT bor ajánlata
A ChatGPT bor ajánlata

Google Gemini

A Google Gemini bor listája
A Google Gemini bor listája

A Google külön kérés nélkül is nagyon érdekes információkat adott a különböző borfajtákról. Igaz, nem mindegyikről, a képen láthatóaknak csak a felét írta le.
Viszont már ezek között is találhatunk olyat, ami szimpatikus lehet.

Persze most is megkérhetjük a programot, hogy ő maga válasszon inkább. Ne felejtsük! Minél pontosabban adjuk meg, mit szeretnénk, annál jobb eredményt kapunk!

A Google Gemini bor ajánlata
A Google Gemini bor ajánlata

Összefoglalás

Az előző évhez képest nagyon sokat javult mind a ChatGPT, mind a Google Gemini. Különösen a Gemini esetében jött jól, hogy összekötötték a már meglévő adatbázissal.

Úgy tűnik, nyelvi modell és az adatok értelmezésében inkább a ChatGPT jár előbbre. De ez lehet azért is, mert a tesztben a ChatGPT esetében az előfizetős verziót használtuk, míg a Google Gemini-nél az ingyenest. Ezen kívül naponta jönnek ki az újabb és okosabb modellek.

A nyaralás előkészítésében mindkét program óriási segítséget nyújt. Mind a tervezésben, mind a helyszínen. Ráadásul nem kell egyik vagy másik között választani, mert mindkettőt lehet egyszerre használni.

A kapott eredményeket viszont minden esetben ellenőrizzük!

CustomGPT

A ChatGPT extrája, hogy összeszámolhatatlanul sok CustomGPT készült. Találunk olyanokat, amik az utazás előkészítésében segítenek, vagy a hotel keresésében, az éttermekben, a látnivalókban, stb.
Találunk kifejezetten az adott várossal kapcsolatos CustomGPT-ket is.
Érdemes velük is kísérletezni.

Budapesttel kapcsolatos CustomGPT-k
Budapesttel kapcsolatos CustomGPT-k

PixelRita

Loading

ChatGPT memória

Becsült olvasási idő 8 perc.

Bevezető

Az első dolog, amit a ChatGPT használóknak szoktak javasolni, hogy minél jobban határozzuk meg a feladatot és a környezetet, annál jobb eredményt fogunk kapni. Ez nemcsak a ChatGPT-re, hanem az összes nyelvi modellre (de még a grafikai, videós és többi mesterséges intelligencia programra) is igaz.

Ha csak annyit írunk, hogy készítsen egy ismertetőt az XZ termékről, akkor nagyon általános és unalmas (mondjuk ki: béna) leírást fogunk kapni.
De amint konkretizáljuk a program feladatkörét (te egy professzionális marketing szövegíró vagy), a célcsoportot, leírjuk a termék mely tulajdonságait emelje ki (és melyekről hallgasson), milyen stílusban legyen, stb… akkor egy nagyon is profi leírást fogunk kapni.

Ha csak annyit kérünk, hogy írjon egy receptet, akkor kapunk valamilyen receptet.
De ha megmondjuk, hogy mit szeretnénk, mi van a hűtőben, mit hanyagoljon (vagy azért mert allergiánk van, vagy mert most éppen nem akarunk hagymát enni), és minél jobban konkretizáljuk az elképzelésünket, akkor annál jobb ételünk lesz a végén.

Ha szeretnénk elmagyarázni a gyereknek a kvantumfizikát, a ChatGPT ebben nagyon tud segíteni.
De ha azt szeretnénk, hogy a gyerek (és mi is) értsük, akkor mondjuk meg a programnak, hogy tízéves gyerek szintjén magyarázza. Esetleg tegyen bele cicás példákat, ha a gyerek a macskákért rajong. És még nagyon sok mindent kérhetünk, amitől a magyarázat érdekesebb lehet.

Tehát adjunk személyiséget a ChatGPT-nek. Határozzuk meg, hogy mi ő, és mi a feladatköre, és kinek írja a válaszokat.

Tanítsuk meg rá a programot!

Amikor már belejöttünk a személyiség használatába, hamarosan felvetődik a kérdés: Ezeket az utasításokat mindig be kell írni újra és újra? Nem lehetne valahogy a ChatGPT-t megtanítani arra, hogy miket szeretnénk?

Szerencsére erre több lehetőségünk is van!

Custom Instructions

Legkorábban a Custom Instructions jelent a ChatGPT-ben, amit a Beállításokban a Customize ChatGPT menüben érünk el. Itt két ablakot láthatunk.

Egyikben saját magunkat ismertethetjük.
Ide olyan információkat érdemes írni, hogy milyen munkát végzünk amihez a ChatGPT segítségét általában fogjuk kérni: építész, tanár a 6. osztályban, diabetikus cukrász, vadakat terelő juhász, stb…
1500 karakterünk van, hogy magunkról minden fontosat leírjunk. Ez nem túl sok! Jól válasszuk meg, hogy mely információk segíthetnek a hatékonyabb kommunikációban.

A másik ablakban azokat az utasításokat adhatjuk, hogy miként válaszoljon a ChatGPT.
Itt azt érdemes megadni, hogy milyen stílusban kérjük a ChatGPT válaszait, mik legyenek az állandó dolgok. Pl. milyen megszólítás legyen az üzleti levelezésben.
Erre is 1500 karakterünk van, ami sokkal kevesebb, mint gondolnánk.

CustomGPT

Sokkal összetettebb személyiséget, komplett MI asszisztenst készíthetünk a CustomGPT-vel.
Ide sokkal hosszabb és részletesebb utasításokat adhatunk, dokumentumokat tölthetünk fel. Készíthetünk hírlevél író robotot, árajánlat adó robotot, rajzoló robotot, logó készítő robotot, a nyomtató elakadásában segítő robotot, és még nagyon-nagyon sok mindent.

A CustomGPT-k száma több ezer, több tízezer lehet. A ChatGPT-n belül itt érhető el.

Mi pedig ide gyűjtjük a hasznos vagy érdekes CustomGPT-ket.

Memória

A legújabb újdonság pedig a Memória.

Ha a beállításokban bekapcsoljuk a Memóriát, akkor a program figyeli a beszélgetést. És ha valamit fontosnak tart, akkor azt felírja a memóriába. A későbbi válaszokat már ennek ismeretében fogja írni. És nemcsak a mostani beszélgetés folyamban, hanem minden jövőbeliben is.

Mi magunk is kérhetjük, hogy valamit eltegyen a memóriába. De éppúgy kérhetjük a törlését is.
A Beállításokban pedig megnézhetjük az eddig összegyűjtött memória darabokat, és törölhetjük őket.

A memóriák jelenleg (2024. június) csak a sima beszélgetésen érhetőek el. A CustomGPT-ben nem működik (valószínűleg biztonsági okokból).

Példa

Az alábbi beszélgetésben azt kértem a ChatGPT-től, hogy jegyezze meg, én minden utazás alkalmával veszek sajtot, mert nagyon szeretem.
Miután ezt leírtam, kaptam egy szöveges visszajelzést, hogy felkerült a memóriába. Ezt a válasz elején egy kis szimbólummal is jelezte: Memory updated

Fontos, hogy odafigyeljünk erre a jelzésre. Mert előfordul, hogy a ChatGPT azt mondja, hogy felvette a memóriába, miközben ezt valahogy elfelejtette

Új adat felvétele a memóriába
Új adat felvétele a memóriába

Ha ráállunk az egérrel a jelzésre, akkor a program kiírja, hogy mit tanult meg.
Itt a Manage memories-re kattintva tudjuk megnézni, hogy mit tárol rólunk a program. Ugyan itt tudunk memória részeket törölni is.

Itt mutatja a program, hogy mit vett fel a memóriába.
Itt mutatja a program, hogy mit vett fel a memóriába.

Oké! Akkor most próbáljuk ki!

Azt kértem, hogy írjon tippeket, mit érdemes Bécsben vásárolni. A sajt nem szokott az útikönyvek első helyén szerepelni. Rólam most viszont már tudja, hogy a sajt kiemelt prioritást élvez. Így mindjárt két sajtboltot is javasolt nekem.
Utána az édességboltok következnek. Már korábban megadtam a ChatGPT-nek, hogy a gyerekek imádják a csokit.

A ChatGPT a keresést a memóriában tárolt adatok alapján végezte.

Ott vannak a sajt boltok.
Meg csoki boltok is. Valószínűleg azért, mert korábban beleírtam, hogy a fiúk szeretik a csokikat.

Tippek a memória használatára

Warning!
Figyelmeztetés! 

A Memória tárhelye véges. 2024. júniusában olyan 2 oldalnyi szöveget (talán 1000 szót) lehet neki adni. Utána megtelik.

A memóriában tárolt adatok rengeteget segíthetnek a munkában is a mindennapokban. A ChatGPT minél jobban ismer, annál jobb válaszokat fogunk kapni tőle.

Mi magunk tudatosan is építhetjük a memóriát egyszerűen annyival, elkezdjük felsorolni, hogy miket tartunk fontosnak, megjegyzendőnek.

Itt szeretnénk néhány ötletet adni, ami hasznos lehet, vagy csak érdekesebbé teszi a beszélgetést.

A munkában hogyan segíthet a memória?

Természetesen a munka hatékonyságát nagyban tudjuk növelni, ha a ChatGPT-t megtanítjuk arra, hogy mit is csinálunk, mit várunk tőle. Ilyen utasításokat adhatunk neki:

  • Te egy építészeti irodában dolgozol, használd az építészeti szakszavakat.
  • Hosszúsági mértékegység használatakor cm-ben számolj.
  • Ha a főnöknek írsz levelet, mindig „Mr. Géniusz” legyen a megszólítás.
  • Amikor színekről van szól, mindig írd le az RGB és a Pantone kódját
  • Amikor információt kérek, írd a végére, hogy mennyire tartod hitelesnek a leírtakat.
  • A számok írásánál mindig tizedesvesszőt használj tizedespont helyett.
  • A táblázatokat mindig lementhető Excel formátumba is add meg.
  • Amikor kódot kérek, akkor azt mindig Python nyelven írjad.
  • A cég anyavállalata az USA-ban található. Ha oda írunk levelet, akkor US-English-t használjál.
  • Amikor Midjourney promptot kérek, akkor írd elé azt, hogy /image prompt:

A konyhában hogyan segíthet a memória?

A sütéshez és főzéshez roppant nagy segítség lehet egy jól beállított memória. Megadhatjuk, hogy mik a kedvenc ételeink, mik a kedvenc összetevőink.
E mellett jelezhetjük, hogy allergiánk van valamire, vagy a normálisnál kevesebb sót használjunk, diétázunk, és még sok mindent mást is.

  • Magyarországon vagyok. Ha a kért receptben olyan összetevő van, ami Magyarországon nem jellemző, akkor zárójelben írj olyat, amivel helyettesíteni lehet.

A technikai problémák megoldásában hogyan segíthet a memória?

A ChatGPT nagyon sokat tud segíteni, ha technikai problémánk adódna. Éppen ezért érdemes a memóriába megadni, hogy milyen eszközeink, készülékeink vannak (telefon, PC, printer, mosógép, stb…), milyen operációs rendszerrel, milyen verzióval rendelkeznek. Illetve programokat használunk a munkához.

A ChatGPT a memóriából kiolvasta a konkrét nyomtató típusát. Így sokkal pontosabban tud segítséget adni.
A ChatGPT a memóriából kiolvasta a konkrét nyomtató típusát. Így sokkal pontosabban tud segítséget adni.

A családban és a tanulásban hogyan segíthet a memória?

Töltsük fel a memóriát a család adataival! Adjuk meg, hogy ki hány éves, hányadik osztályba jár, mik a kedvenc ételei, játékai, filmjei, karakterei, és még sok más.

Ha mesét szeretnénk, vagy csak azt, hogy a ChatGPT beszéljen a kvantumfizikáról, téridőről meg fekete lukakról, akkor nemcsak úgy fog magyarázni, hogy a gyerek megértse, hanem hogy tetsszen is neki.

Adjuk meg a memóriába, hogy melyik adat melyik gyerekhez tartozik. Majd pedig amikor feladatot kérünk a ChatGPT-től, akkor írjuk le, hogy melyik gyerek van mellettünk. A további beszélgetés már az ő nyelvén fog folytatódni.

Kérjünk mesét a ChatGPT-től. Mivel a program már tudja, hogy mit szeretnek a gyerekek, sokkal testhezállóbb történetet kaphatnak.

A nőknek hogyan segíthet a memória?

A ChatGPT rengeteget tud segíteni a női kozmetikumok és makup területén. A jobb eredmények érdekébe tanítsuk meg a programot arra, hogy milyen a haj és bőrtípusunk, milyen kozmetikumokat, melyik márkát szeretjük. Hol szeretnénk a makeup-ot használni? Irodában, konferencián, buliban?

A kikapcsolódásban hogyan segíthet a memória?

A ChatGPT megtaníthatjuk azokra a dolgokra és stílusra, amiket szeretünk, amik az érdeklődési körünk. Így a beszélgetések sokkal közvetlenebbek lehetnek, hangulatosabbak. Nem fogjuk úgy érezni, mintha egy személytelen robottal társalognánk.

Ehhez érdemes beírni a memóriába, hogy mely szituációkban várjuk el az üzleti hangnemet, mikor a családiasat, és mikor a személyeset.

Én felsoroltam a kedvenc könyveimet, és filmjeimet. Majd megkértem a ChatGPT-t, hogy a válaszai végére írjon egy olyan idézetet valamelyik könyvből vagy filmből, ami illeszkedik a beszélgetéshez.

Azzal, hogy megadjuk a kedvenc filmeinket és könyveinket, kérhetjük a programot, hogy hozzá hasonlókat javasoljon.

A korlátozás

A Memória nagyjából 2 teljesen teleírt A4-es oldalnyi adat lehetséges (2024. év közepe). Ez soknak tűnik, amíg csak egy speciális területre fókuszálunk, egy speciális területen szeretnénk a ChatGPT-t használni. Mondjuk a cég marketing kampányainak megfogalmazásához.
De amint elkezdjük a mindennapoknak használni, akkor nagyon hamar megtelik.

Nagyobb kihívás, hogy a memória mindig aktív, mintha csak a beszélgetés elejére beírtuk volna (e miatt ugyan úgy foglalja a tokeneket is). Ezt viszont nem biztos, mindig szeretnénk.

Példa:
Az esti mesét a ChatGPT segítségével állítjuk össze. Beállítottuk a memóriába, hogy a gyerekek imádják az oroszlánokat, ezért minél többször szerepeljen a szövegben.
Másnap amikor a céges értékelőt írjuk, akkor ugyan ez a ChatGTP lesz velünk, ami lelkesen fog oroszlánokat írni az éves beszámoló közepére.

Egyenlőre (2024. év közepe) nincs olyan módszer, amivel direkt el lehetne választani a különböző memóriákat, hogy otthoni, céges, iskolai, hobbi, főzős, stb… Mert csak egy memória van.

Éppen ezért talán sokkal praktikusabb lehet egy CustomGPT-t készíteni. Több információt is adhatunk (akár 10 dokumentumot is feltölthetünk), és csak az adott feladattal foglalkozik.
De persze ez is a feladattól függ. Praktikusabb lehet a memória ha a ChatGPT-t sokszor tudományos munkára használjuk, és olyanokat kérünk, hogy °C helyett Kelvint használjon, vagy a növények és állatok neve után zárójelbe írja bele a latin nevét. Ez egyszerűbb, minden beszélgetésben ott van.

PixelRita

Loading

Látványos betűk a Photoshopban referenciakép alapján saját betűtípusunkkal

Becsült olvasási idő 6 perc.

Új lehetőségek

Az Adobe Photoshop programban 2024. áprilisában frissült a mesterséges intelligencia. Immár a rajzolásnál használhatunk referenciaképet is.

Ez így új lehetőségeket adott a kreatív és látványos betűk készítéséhez is!

Készítsünk betűket a referenciakép alapján

Itt egy kép, ami már az új Adobe Photoshop új verzióval (25.10) készült. A kicsi robotok ott állnak a tábla előtt. Már csak egy látványos felirat hiányzik.
Sajnos ebben még gyengélkedik az Adobe (ebben 2024. év elején az Ideogram a legjobb). De ez nem probléma! Az új referenciakép funkcióval be tudjuk hozni a más programban készült betűket.

Adobe Photoshop Generative robotok
Adobe Photoshop Generative robotok

Korábban készítettünk néhány igazán látványos betűt a Midjourney programban. Ebből az alábbi R betűt fogjuk használni minta képnek.

Fogaskerekes-robotos R betű - készült a Midjourney programmal
Fogaskerekes-robotos R betű – készült a Midjourney programmal
pronpt: type "O" made of robotic parts and gears and wires,

Most, hogy felkészültünk, nyissuk meg az Adobe Photoshop programot!

A program azon tulajdonságát fogjuk használni, hogy a mesterséges intelligencia minden esetben ki akarja tölteni a kijelölt területet. (Előfordulhat, hogy egy későbbi Photoshop verzióban ez változni fog.)
Mi pedig a saját s

Írjuk fel a szöveget a képre úgy, ahogyan szeretnénk. Ezután válasszuk ki a megfelelő betűtípust.
Mindenképpen figyeljünk arra, hogy olyan betűt válasszunk, amelyik legjobban illeszkedik a majdani rajzhoz.
A példánkban robot-szerű betűket készítünk, ezért vastag, talp nélküli, szögletes betűtípust használunk. De ha mondjuk vizet, tüzet vagy hasonló folyékony képet szeretnénk, akkor egy kézírásos típus sokkal látványosabb lehet.

Szerencsére az új Photoshop verzióban a betűtípusok stílusaik szerint csoportosulnak. Így sokkal könnyebb kedvünkre való betűket találni!

A Photoshop új betűtípus választó ablaka
A Photoshop új betűtípus választó ablaka

Amikor elkészültünk, akkor jelöljük ki a szöveget (Windows alatt pl. CTRL-al kattintsunk a rétegre). Majd kapcsoljuk ki a szöveg rétegét.

És most jön az újdonság!
A Generative Fill mező mellett megjelent egy kis kép ikon. Arra kattintva adhatjuk meg a referenciaképet. .

Referenciakép megadása
Referenciakép megadása

A mesterséges intelligencia megpróbálja a referenciaképet minél jobban értelmezni, majd ahhoz hasonlót rajzolni. Mi nagyon sokat segíthetünk a programnak, ha a referenciakép minél jobban hasonlít az elvárt eredményhez. E mellett az utasítás (prompt) is legyen minél részletesebb, hogy az MI jól azonosítja be, hogy mit szeretnénk.

Warning!

⚠️ Fontos! ⚠️ 
A referenciaképünk nagyon sokat segíthet abban, hogy elérjük a kívánt hatást.
De a mesterséges intelligencia csak azokat a dolgokat tudja megrajzolni, amiket a tréningezés során megtanult.
Így ha nem lett macska rajzolására felkészítve, csak kutyára, akkor hiába adunk neki egy macskát referenciaképnek. Az eredmény egy macskaszerű kutya lesz.

Ne felejtsük el, hogy a Photoshop speciális mesterséges intelligenciával rendelkezik. A program a teljes kép tartalmát figyeli, hogy az eredmény minél jobban illeszkedjen. Ezért nagyon csak nehezen tudunk eltérni az eredeti kép témájától.

Rövid számolás után megkaptuk az eredményt: a „Robot” immár robot részekből lett kirakva, és tökéletesen illeszkedik a környezetébe.

Egy robotos robot szó
Egy robotos robot szó

Kövek a parton

A következő példában egy tengerparton vagyunk. Ide szeretnék egy feliratot kövekből kirakni.

Az öreg halász és a tenger
Az öreg halász és a tenger

Hasonlóan járunk el, mint az előző példában.

Elkészítjük a feliratott a nekünk tetsző betűtípussal. De ezúttal azt szeretnénk, hogy a betűk a homokban legyenek. Ezért perspektivikusan megdöntöttük a feliratot. Utána kijelöltük, majd kikapcsoltuk a réteget.

Ebben az esetben referenciaképnek egy kavicsos textúrát választottunk, és ugyan ezt adtuk utasításnak is.

Referenciakép: kavicsos textúra
Referenciakép: kavicsos textúra

Rövid számolás után meg is kaptuk a homokba írt betűket. Az eredményt azzal tudjuk javítani, ha a forrás képünk is kövekből kirakott betűket tartalmaz (ilyet könnyedén tudunk az Ideogram programmal generáltatni)

Kövekből kirakott betűk a homokban
Kövekből kirakott betűk a homokban

A klasszikus Windows XP háttérkép

Következő példához leporoltuk a jólismert Windows XP háttérképet. Erre a zöld mezőre virágokból írjunk fel egy üzenetet!

A sokat látott Windows XP háttérkép
A sokat látott Windows XP háttérkép

Ismét elkészítettük a feliratot. Majd beállítottuk a perspektívát, kijelöltük, és kikapcsoltuk a szöveges réteget.
Referenciaképet ezúttal is a Midjourney programmal készítettünk.

Rövid számolás után ott is vannak a kamilla virágok a mezőn.

Házi feladat: a domb oldalára készítsünk szöveget békésen legelésző tehenekből!

Csípős paprika

Ha már ennyire belejöttünk, ne fogjuk vissza magunkat! Íme a csípős paprika!

Hungary felirat csípős paprikából
Hungary felirat csípős paprikából

Tüzes betű

Végezetül egy tüzes betűt készítettünk. Itt már kellett trükközni!

A Photoshop mindig a teljes képet figyeli. Ezért egy fekete képre nem fog nekünk tüzet rajzolni. Hiába adjuk meg a legjobb referenciaképet.
Ezt csak úgy sikerült elérni, hogy előbb e
Amikor újra generáltuk a tüzes betűket, immár szépek lettek, és tökéletesen illeszkedtek a fekete háttérhez

Tüzes betűk
Tüzes betűk

További lehetőségek

Nemcsak dekoratív betűket lehet így készíteni, hanem bármilyen alakzatot.

Magyarország piros paprika porból
Magyarország piros paprika porból

De akár egy céges logót is újra rajzolhatunk.

Itt az Adobe logót alakítottam át robotos formába, ami így egészen izgalmasra sikerült!
(Bár egy nap biztosan fenékbe rúgnak, amiért állandóan átrajzolom a logójukat)

Adobe logó robotos formában
Adobe logó robotos formában

PixelRita

Rita, te mit gondolsz?

Loading

Referenciaképek a Photoshopban az MI képgeneráláshoz

Becsült olvasási idő 6 perc.

Újdonság az Adobe Photoshop programban

2024. április végén egy új funkció jelent meg az Adobe Photoshop (béta) programban: immár referencia képet is mutathatunk a mesterséges intelligenciának.

Ez óriási segítséget hozott! Nem szükséges többet bonyolult formában leírni, hogy mondjuk miként néz ki egy fotel (mi a stílusa? mi az anyaga? a lába fából van vagy fémből? hogy írjam le neki azt, hogy milyen magas legyen? hogy mondjam, hogy a sarka legyen lekerekítve? stb…)
Elég csak mutatni egy képet, és azt mondani: ilyet szeretnék!

Referencia kép

A mesterséges intelligenciával szemkápráztató bútorokat tudunk rajzoltatni. Azonban sajnos azokat legtöbbször nem lehet megvásárolni. Sőt! Még ha talán tudunk is olyan helyet, ahol személyre szabott bútorokat készítenek, a program által generált bútor egyáltalán nem biztos, hogy megvalósítható. Vagy nem fog feldőlni, esetleg összetörni az első használatkor.
Sokkal jobb lenne, ha a mesterséges intelligencia olyan bútorokat mutatna, amelyek a valóságban is léteznek, megvásárolhatóak. Ezt most már a referenciakép használatával megtehetjük!
Mindezt az Adobe Photoshop programon belül.

Referencia képnek normál esetben egy bútor katalógust használunk. De mi most inkább a Midjourney programot kértük meg, készítsen néhány minta bútort.

Cseréljük le az asztalt!

Az alábbi képen egy nappali szoba látszik. Szeretnénk egy új asztalt vásárolni. De vajon, az hogy fog kinézni?
A mesterséges intelligencia megmutatja!

Eredeti kép a nappaliról
Eredeti kép a nappaliról.

Első kísérletben egy díszes asztalt próbálunk ki.
Oké, normál esetben talán nem ezt választanánk, de most csak kísérletezünk.

Midjourney prompt: Mediterran Design dining Table, white background
Midjourney prompt: Mediterran Design dining Table, white background

Miként működik?

Jelöljük ki azt a területet, ahol az új asztalunk lesz. Az ilyenkor feljövő új Contextual Task Bar-ban megjelent egy kis fotó ikon. Amikor erre kattintunk, akkor megadhatjuk a referencia képet.

Referencia kép hozzáadása
Referencia kép hozzáadása

Mi ezt a díszes asztalt választottuk.

Érdemes utasítást (prompt) adni. Ezzel segítjük a programot felismerni, hogy mi van a képen. Nem fogja az asztalra azt gondolni, hogy híd vagy fapapucs.

A Generate gomb megnyomása utána nem sokkal megkapjuk az eredményt.

A mediterrán stílusú díszes asztal, amit a mesterséges intelligencia generált
A mediterrán stílusú díszes asztal, amit a mesterséges intelligencia generált

Az eredmény nagyon látványos és tökéletesen illeszkedik a képhez! A fények és az árnyékok is olyanok, mintha az új bútor valóban a szobában lenne! A Photoshop pedig tényleg olyan asztalt rajzolt, ami hasonlít az referencia képen lévőre!

Természetesen kis eltérések vannak: az asztal lába más, az asztal alakja is kicsit más.

Ne feledjük, hogy a mesterséges intelligencia továbbra is abból tud rajzolni, amit a tréningezés során megtanult. A referencia kép irányt mutat, de ettől még a tudástára behatárolja, hogy milyen képet készítsen.

A kép generálása után a Properties ablakban tudunk a variációk között válogatni. Itt láthatjuk a referencia képünket is, és itt módosíthatjuk a promptot is.
Olyan beállítás egyelőre nincs (2024. április vége), ahol a referenciakép erősségét lehet állítani.

A Properties ablak
A Properties ablak

További variációk

A fenti módszerhez hasonlóan további asztalokat is kipróbáltunk.

Cseréljük az ülőhelyeket is!

Ha már ennyire belejöttünk, ne álljunk meg az asztalnál! Cseréljük le a foteleket és a kanapét is!

Referenciának ismét a Midjourney-t kértük meg. Egy sötétbarna modern és egyszerű ülő alkalmasságot rajzolt nekünk.

Sötétbarna modern és egyszerű kanapé. Prompt: modern dark brown sofa , white background
Sötétbarna modern és egyszerű kanapé. Prompt: modern dark brown sofa , white background

Az eredmény bár kevésbé hasonlít a referencia képre, egészen jó lett! És egészen jól illik a környezetébe.
Na jó, annyira talán mégsem. Ehhez az asztalhoz semmiképpen sem jó.

Modern kanapé
Modern kanapé

Ha ragaszkodunk az asztalhoz, akkor válasszunk inkább valami klasszikus kanapét. Legyen zöld, sok aranyozással!

Zöld kanapé sok aranyozással
Zöld kanapé sok aranyozással

Oké. Ha ebbe az irányba megyünk tovább, akkor a hátsó foteleket is érdemes lenne cserélni.

A fotel is zöld sok aranyozással
A fotel is zöld sok aranyozással

Nem. Ez annyira nem tetszik. Túlságosan klasszikus. Inkább valami fiatalos, modern berendezésünk legyen. A kanapé fehér, mellé pedig kör alakú fekete asztal, érdekes színes kövekkel.

Fehér kanapé, mellé kör alakú fekete asztal, érdekes színes kövekkel.
Fehér kanapé, mellé kör alakú fekete asztal, érdekes színes kövekkel.

Ez az irány határozottan jobb! Kipróbáltuk még a hagyományos japán teázó faasztalt. Majd pedig a háttérben lévő foteleket is lecseréltük. Remélhetőleg ezzel a zöld színnel nem vittük túlzásba!

Hagyományos japán teázó faasztal, zöld fotelekkel a háttérben.
Hagyományos japán teázó faasztal, zöld fotelekkel a háttérben.

Összegzés

Eltekintve attól, hogy végül mit sikerült összekotyvasztani, az Adobe Photoshop kellően jól használja a referencia képeket.
A kívánt bútorokat be tudjuk helyezni a megadott környezetbe, anélkül hogy a leírásukkal kellene foglalkoznunk és az időnket vesztegetni.

Viszont a program továbbra is a tréningezése során felépített adatbázis alapján rajzol. Az eredmény kisebb-nagyobb mértékben eltérhet a referencia képtől.
Ráadásul minden képgenerálás egyedi, és megismételetlen. Nem tudunk két egyforma bútort készíteni.

Tippek

A Photoshop nem feltétlenül érti meg, hogy mit is akarunk rajzolni. A program minden esetben próbálja a kijelölt területet teljesen kitölteni. Ezért az újonnan generált tárgyak mérete mindig akkora lesz, mint a kijelölt terület. Ettől pedig a tárgyak túlságosan nagyok lehetnek.

Ha egy asztal helyére egy széket szeretnénk tenni, akkor érdemes inkább két lépésben eljárni: Először tüntessük el az asztalt (legyen üres a szoba), majd generáljuk bele a széket. Ekkor a kijelölés legyen akkora, mint amekkora széket szeretnénk.

PixelRita

Rita, te mit gondolsz erről?

Loading

Teljes játékprogram magyarosítása a ChatGPT segítségével

MewnBase
Becsült olvasási idő 6 perc.
MewnBase üdvözlő képernyője immár magyarul
MewnBase üdvözlő képernyője immár magyarul

Egy kis játék

A MewnBase (Miaú-Bázis) egy kellemes kis játék, ahol egy macskával űrbázist építhetünk egy távoli bolygón. Szükség van élelemre, oxigénre és energiára. A túléléshez különböző épületmodellek szükségesek, amelyekhez a nyersanyagokat a közelből kell összegyűjteni.

A játék nem túl bonyolult, kellemes kikapcsolódás (a Steam oldalon itt található). Az egyszerűség része, hogy eredetileg csak angolul játszható. De egy lelkes közösségi csapat dolgozik a fordításokon, és mostanra már 13 nyelvre készült el a fordítás.

Magyar nyelvre viszont még nem készült fordítás. Itt az ideje, hogy megkérjük a mesterséges intelligenciát, hogy készítse el!

Fordítási nehézségek

A MewnBase program kicsi, és a nyelvi fájl is rövid. Összesen 800 sor található benne, de sok az üres, tehát valójában csak 650-700 sort kell lefordítani. Ezt akár bármelyik online fordító programba, például a Google Translate-be is beilleszthetnénk.

A feladatot azonban az nehezíti, hogy nem minden szót kell lefordítani! A fájl tele van utasításokkal. Pontosabban, a mi esetünkben ez egy szótár fájl, ahol azt találjuk, hogy melyik angol utasítás hogyan jelenjen meg a játékban. Csak a megjelenítendő szövegeket akarjuk magyarra fordítani. Az utasításokhoz nem szabad nyúlni, mert a legkisebb változtatás is a program hibás működéséhez vezethet!

Így tehát olyan technológiára van szükségünk, amely felismeri, hogy a fájl mely részei az utasítások, és ezeket ne módosítsa. Csak a felhasználó előtt megjelenő szöveget fordítsa le magyar nyelvre.

Itt jön segítségünkre a ChatGPT!

MewnBase nyelvi fájlja
MewnBase nyelvi fájlja

Fordítás a ChatGPT segítségével

A ChatGPT 4 előfizetős verziójával akár a teljes fájlt is feltölthetjük. De a ChatGPT a hosszabb fordítási feladatokat sokszor megpróbálja elkerülni, esetleg lerövidíti. Ezen kívül biztonsági okokból a feltöltött fájl kb. 30 perc múlva törlődik a szerverről, ugyanúgy a ChatGPT által készült fájl is. Ez nehezíti a fordítási munkát.

Ezért inkább azt választottuk, hogy logikai részekre bontva másoltuk be a dokumentumot. Végül 20 darabban történt a fordítás, de mivel ugyanazt a beszélgetést használtuk, így a tartalom következetesen lett fordítva.

Az utasítás:

Helló! Én egy játékot szeretnék magyarosítani. Neked részeket adok, azokat fordítsd le magyarra. De csak a feliratokat, az utasításokat ne. 

Csak apró módosítások kellettek, ahol leírtuk neki a játék környezetét (űrbázis-építő játék), hogy pl. a suit szót ne öltönynek, hanem űrruhának fordítsa.

MewnBase fordítása
MewnBase fordítása

Az eredmény

A fordítás tökéletesen sikerült! A ChatGPT nagyon jól megértette, mely részek az utasítások, és melyeket lehet fordítani. Ráadásul a játékban számos helyen a feliratok más színűek. Ezek rövid utasítások voltak a megjelenő szöveg közepén. A ChatGPT ezeket is meghagyta eredeti formájukban, és a zárójeleket sem keverte össze.

Miután a lefordított szöveget visszamásoltuk, a játékot teljes egészében magyarul tudjuk játszani.

A MewnBase játék immár magyarul
A MewnBase játék immár magyarul

Használat:

Ha valaki szeretné használni, akkor erről a linkről le tudja tölteni. Kicsomagolás után a \Steam\steamapps\common\MewnBase\data\locale\ könyvtárba tegyük be.
Mivel a program nincs felkészítve a magyar nyelvre, ezért valamelyik más nyelv helyére kell beraknunk. Pl. az olasz nyelv helyett, akkor nevét változtassuk át mewnbase_it.properties-re.

Más nyelvi modellek

Vajon a többi nyelvi mesterséges intelligencia programot is használhatjuk fordításra? Kipróbáltuk az Anthropic Claude 3 ingyenes és a Google Gemini ingyenes verzióját is.

Warning!

⚠️ Figyelmeztetés! ⚠️

Vegyük figyelembe, hogy a végeredmény szempontjából döntő fontosságú, hogy a nyelvi fájl milyen formában van, és hogy ezt a mesterséges intelligencia megfelelően tudja-e értelmezni. A különböző modelleket eltérő módon tréningezik, így nem tudjuk azt mondani, hogy egy bizonyos program minden esetben jól fog működni. Arra sincsen garancia, hogy lesz olyan modell, amelyik értelmezni tudja a nyelvi fájlt.

A tesztben használt program nyelvi fájlja kicsi (kevesebb, mint 1000 sor), és formája is nagyon egyszerű. Könnyű értelmezni és könnyű szerkeszteni. Egy komolyabb program vagy játék esetén ez a fájl sokkal bonyolultabb is lehet, és több tíz (vagy akár száz) oldalból is állhat.

Mind a két program nagyon jól teljesített. Bár mindkettő a # jelet értelmezni próbálta. De meg lehet kérni őket, hogy erre figyeljenek oda.

Felhasználás

Használjuk a ChatGPT-t, a Claude-ot, vagy a Google Gemini-t arra, hogy egy program kezelőfelületét magyarra tegyük!

A tesztben egy kicsi játékprogramot próbáltunk ki, aminek a nyelvi fájlja vegyesen volt a kóddal és a megjelenítendő szöveggel.

Ugyanezt meg lehet próbálni más játékoknál vagy akár programoknál is. Nemcsak szöveges formátumú fájloknál járhatunk sikerrel, hanem XML, JSON, de akár Excel esetében is. A nyelvi modellek fejlődésével egyre bonyolultabb programokat is sikeresen fordíthatunk magyar nyelvre.

Érdemes próbálkozni vele!
Gondoljunk bele, milyen kevés magyar nyelvű program és játék van. És milyen gyakran azért ódzkodunk valamelyiknek a használatától, mert nem értjük pontosan a menüket, feliratokat!

PixelRita

PixelRita te mit gondolsz erről?

Loading

Mesterséges Intelligencia az Adobe Premiere Pro programban

Becsült olvasási idő 7 perc.

Bevezetés

2024. áprilisában az Adobe bemutatta a következő generációs videó szerkesztő programját, ahol már a mesterséges intelligencia segít a komplex feladatok egyszerűvé tételében.

Az Adobe Premiere Pro új verziója tartalmazza szinte az összes MI lehetőséget, ami az elmúlt rövid időszakban megjelent: Képgenerálás, InPaint objektum generálás, Videógenerálás, Hanggenerálás, Szöveg alapján felírat készítése, stb… Mindezek beépítve a videó szerkesztésébe. Pl. új elemet vehetünk fel a filmbe, vagy az oda nemillő tárgyakat törölhetjük ki.

Az új mesterséges intelligencia funkciók egyik különlegessége, hogy nemcsak az Adobe Firefly videó-generáláló motort, hanem olyan külső fejlesztők programjait is használhatjuk, mint a Runway, Pika vagy az OpenAI Sora.

Adobe Premiere Pro mesterséges intelligencia funkciók

Objektum hozzáadása

2024-re már természetessé vált, hogy a mesterséges intelligenciát kérjük arra, hogy egy képre új objektumot rajzoljon (InPaint). Az Adobe Premiere Pro viszont videó szerkesztő program. Ezért az MI-generált részek is a videóhoz illeszkedő, azzal együtt mozgó elem lesz.

Ha azt szeretnénk, hogy pl. a szereplő kezében legyen egy banán, akkor azt ezentúl a mesterséges intelligencia rá tudja rajzolni minden egyes képkockára úgy, hogy a szereplővel együtt mozog.

Adobe Premiere Pro - Objektum hozzáadása
Adobe Premiere Pro – Objektum hozzáadása

Objektum eltávolítása

Ahogyan a mesterséges intelligencia új objektumot tud rajzolni ami a videóval együtt mozog, ugyan úgy el is tud tüntetni. Ha valami zavaró maradt a filmen, akkor azt egyszerűen ki lehet törölni.
Az eltávolítandó részeket pedig nem kell körberajzolni, a program intelligensen felismeri és kijelöli.

Adobe Premiere Pro - Objektum eltávolítása
Adobe Premiere Pro – Objektum eltávolítása

Objektum csere

A mesterséges intelligencia segítségével nemcsak új elemeket tehetünk a képre, vagy régieket távolíthatunk el. Hanem a már meglévőket is átalakíthatjuk.

Néhány kattintással megváltoztathatjuk a szereplő óráját, ruházatát, autóját, de akár azt is, hogy mi legyen a csomagjában.
Vagy magát a karaktert is!

Adobe Premiere Pro - Objektum csere
Adobe Premiere Pro – Objektum csere

Generatív kiterjesztés

Ha a videó hossza nem elegendő, a mesterséges intelligencia képes új képkockákat generálni. A program elemzi, és értelmezi a meglévő képkockákat, és ahhoz illeszkedő új képeket fog generálni. Így könnyebben tudjuk a klippeket egymáshoz illeszteni, szinkronizálni.

Adobe Premiere Pro - Generatív kiterjesztés
Adobe Premiere Pro – Generatív kiterjesztés

Generatív B-roll

Talán az egyik legidőigényesebb munka a megfelelő B-rollok megtalálása. Rengeteg perc, vagy akár óra mehet el arra, hogy a rövid felvételek között böngésszünk. És sokszor nem is lelünk olyat, ami valóban tetszik.

Mostantól egy egyszerű szöveges utasítással generálhatunk olyan videóklipeket, amelyek tökéletesen illeszkednek a történet hangulatába. Létrehozhatnak felvételeket, amelyek nehezen rögzíthetők vagy fantasztikus koncepciókat illusztrálnak.

Adobe Premiere Pro - Generatív B-roll
Adobe Premiere Pro – Generatív B-roll

Szövegalapú vágás

A szövegalapú vágás (Text-Based Editing) automatikus átiratot (Transcript) készít a videóról.
Ettől kezdve a videót úgy lehet szerkeszteni, mintha csak szöveg lenne. Finomíthatjuk, átrendezhetjük, kivághatjuk a kellemetlen szüneteket és töltelék szavakat.

Ez a funkció jelentősen egyszerűsíti és felgyorsítja a szerkesztési folyamatot, különösen a beszélgetős vagy interjú típusú videók esetén.

Adobe Premiere Pro - Szövegalapú vágás
Adobe Premiere Pro – Szövegalapú vágás

MI-alapú hang kategorizálás

A mesterséges intelligencia felismeri, hogy a hang anyag milyen típusú: zene, párbeszéd, hangeffekt, vagy háttérhang. Utána automatikusan kategorizálja őket.

Így sokkal könnyebben átlátjuk a hang anyagainkat, és sokkal gyorsabban tudunk dolgozni.

Adobe Premiere Pro - MI-alapú hang kategorizálás
Adobe Premiere Pro – MI-alapú hang kategorizálás

Beszédből szöveggé alakítás

A világ felgyorsult és globális lett. Fontos, hogy egy videó minél több embert érjen el. Ehhez pedig feliratozás szükséges. Csakhogy a szöveg elkészítése és időzítése rengeteg időt igényel.

Az Adobe Premiere Pro Speech to Text funkciója ezt automatikusan megcsinálja.
A program több, mint 18 nyelvet ért meg. E mellett felismeri, hogy melyik szereplő beszél a videóban. A létrehozott szöveg illeszkedik a videó ritmusához és beszédmintához.

Így a videó tartalma sokkal élvezhetőbb lesz, és a közönségi médiában is vonzóbb.

Adobe Premiere Pro - Beszédből szöveggé alakítás
Adobe Premiere Pro – Beszédből szöveggé alakítás

Feljavított beszéd

Az Enhance Speech funkcióval eltávolítható a háttérzaj és javítható a párbeszéd minősége, mintha egy profi stúdióban vették volna fel.

Adobe Premiere Pro - Feljavított beszéd
Adobe Premiere Pro – Feljavított beszéd

Jelenetszerkesztés észlelése

Amikor egy hosszabb videóból új szerkesztést kell készítenünk, az egyik első lépés az eredeti rövidebb klipek szétválasztása.
Viszont a jelenetátmenetek megtalálása és ezeknek a vágásoknak a manuális elhelyezése fárasztó lehet, de a Scene Edit Detection funkcióval az Adobe Premiere Pro automatikusan vágja a jeleneteket helyettünk.
Kattintsunk a jobb gombbal egy klipre az idővonalon, válasszuk a Scene Edit Detection (Jelenetszerkesztés-felismerés) lehetőséget, és válasszuk ki, hogy szeretnénk-e vágásokat hozzáadni, új al-klipekből álló tárolót létrehozni, vagy klipjelzőket elhelyezni az egyes vágási pontoknál.

Adobe Premiere Pro - Jelenetszerkesztés észlelése
Adobe Premiere Pro – Jelenetszerkesztés észlelése

Automatikus szín

A kreatív munkából rengeteg időt vesz el az, amikor a videók színkorrekcióit végezzük.

De ennek nem többé így lennie! Az Auto Color funkcióval minden eddiginél gyorsabban tudjuk az alap korrekciókat elvégezni, mint pl. az Expozíció , Kontraszt vagy a Fehér-egyensúly

Adobe Premiere Pro - Automatikus szín
Adobe Premiere Pro – Automatikus szín

Összekapcsolódás más MI videó generáló programokkal.

Az új mesterséges intelligencia funkciók egyik különlegessége, hogy nemcsak az Adobe Firefly videó-generáláló motort, hanem olyan külső fejlesztők programjait is használhatjuk, mint a Runway, Pika vagy az OpenAI Sora.

További mesterséges intelligencia funkciót az Adobe Premiere Pro programban

Morph Cut

  • Leírás: A Morph Cut segít a vizuális folytonosság fenntartásában, és sima átmeneteket biztosít a klippek között.
  • Előnyök: Javítja a videók vizuális minőségét, különösen interjúk és beszélgetős videók esetén.

Color Match

  • Leírás: A Color Match azonnal összehangolja a különböző videóklippek színeit, eltávolítva a különböző jelenetek közötti színbeli eltéréseket.
  • Előnyök: Egységes megjelenést biztosít a videóknak, figyelembe véve a bőrtónusokat és kifejezéseket.

Remix

  • Leírás: A Remix funkcióval összehangolhatja a zenét a videó ritmusával.
  • Előnyök: Megspórolja azokat az órákat, amelyeket a videó és az audio manuális szinkronizálásával töltenének.

Auto Ducking

  • Leírás: Az Auto Ducking automatikusan csökkenti a háttérzene hangerőt, amikor párbeszéd hallható, hogy a beszéd érthetőbb legyen.
  • Előnyök: Harmonikus hangzást biztosít anélkül, hogy manuálisan kellene állítgatni a hangerőt.

Auto Reframe

  • Leírás: Az Auto Reframe azonosítja a képkockák fókuszpontját, és megőrzi azt változó képarányok között.
  • Előnyök: Különösen hasznos, ha széles képarányú videót szeretne közösségi médiára szabott formátumban megosztani.

Future Vision

2023. áprilisában az Adobe egy videót mutatott be, ahol a tervezett funkciókat mutatták be. Remélhetőleg ezek is tényleg megvalósulnak, és hamarosan az Adobe Premiere Pro programban találkozhatunk velük.

Zene és hang effekt generálás

Ahogyan a videóra új objektumokat teszünk, a jövőben várhatóan zenét és hang effekteket is készíthet nekünk a mesterséges intelligencia.

Továbbfejlesztett színkorrekció

A mesterséges intelligencia segítségével talán elfelejthetjük végre a csúszkákat. Csak elég lesz azt beírni, hogy milyen színhangulata legyen a videónak, melyik elem legyen sötétebb vagy világosabb. A program pedig automatikusan kikeveri a legjobb színeket.

Látványos szöveg címkék generálása

Az Adobe Premiere Pro egy jövőbeli változata a videó szövegét felismerve szöveggé alakíthatja.
Igen, ezt már a 2024. áprilisban megjelent verzió tudja. Csakhogy a szövegből látványos címkéket tehet a videóra, amitől az érdekesebb vagy jobban érthető lehet.

Animált szöveg generálása

2024-ben még mindig az MI egyik legnagyobb kihívása, ha olvasható szöveget kell generálni. Az Adobe Firefly viszont a betűre rajzolja rá a kért képet. Így garantálja, hogy a szöveg tényleg szöveg legyen.

Várhatóan a jövőbeli Adobe Premiere Pro programban animációt is készíthetünk a feliratokra.

Automatikus B-roll

Az automatikus készített átiratot (Transcript) felhasználva a jövőben az Adobe Premiere Pro automatikusan generálhatja a B-roll-okat. Nem nekünk kell kitalálni, hogy milyen rövid filmrészletek lennének a legjobbak a videóhoz.

Storyboard generálás

A jövőbeli Adobe Premiere Pro programba várhatóan érkezik egy olyan funkció, ahol a film forgatóját lehet beolvasni. A program pedig ebből elkészíti a vizuális Storyboard-ot.

Videó:

Adobe Future Vision: Ezeket a funkciókat tervezte az Adobe 2023. áprilisában.

PixelRita

Loading

Kép és Stílus referencia az Adobe Firefly programban

Adobe logo másképpen
Becsült olvasási idő 11 perc.

Bevezetés

Az Adobe Firefly szoftverének legújabb frissítésével a mesterséges intelligencia képességét egy teljesen új szintre emelte, ahol a kreativitás határai kitolódtak.
2024 áprilisában két izgalmas új funkció jelent meg, amely radikálisan megkönnyíti a vizuális alkotók munkáját.

Korábban a legnagyobb kihívást az jelentette, hogyan adjuk át pontosan azt a látványt, amit elképzeltünk, egy szövegalapú képgeneráló szoftvernek. Egyszerű leírni, hogy egy képen szeretnénk egy házat látni, de amikor az ablakok méretére és elhelyezkedésére kerül a sor, a dolgok bonyolulttá válnak. Ezt a problémát megoldandó, a Firefly mostantól lehetővé teszi, hogy a felhasználók egy strukturális referenciaképet adjanak meg, ami alapján az MI a körvonalak és tartalmak szerint hozza létre a művét. Ezen felül, egy stílus referencia-kép megadásával az MI a kért stílusban alkotja meg az új képet.

Ez az újítás forradalmasítja a képgenerálás folyamatát, lehetővé téve, hogy az ötleteinket sokkal könnyebben és pontosabban valósítsuk meg. Nem kell többé feleslegesen bonyolult leírásokkal bajlódni; elég csupán a kívánt struktúrát és stílust bemutatni, és a Firefly gondoskodik a többiről.

Adobe FireFly struktúra és stílus referencia képek alapján rajzolja a végleges képet
Adobe Firefly struktúra és stílus referenciaképek alapján rajzolja a végleges képet
Warning!

⚠️Figyelmeztetés!⚠️
Az Adobe Firefly programban generált képek valahol ott lesznek a rendszerben. Nem biztos, hogy ezeket még egyszer megtaláljuk. A Kedvencek közé betett képek is csak a böngésző memóriájában lesznek (tehát másik gépen ha belépünk a fiókunkba, már nem látjuk).
Éppen ezért erősen ajánlott minden generált képen letölteni, ami tetszik!

Strukturális referencia

Adobe FireFly struktúra referencia
Adobe Firefly struktúra referencia

Az Adobe Firefly megújul menüjében a bal oldalon találjuk a Strukturális referencia ablakot. Itt van lehetőségünk saját képet feltölteni. Ez lesz az alapja annak a rajzunknak (A szolgáltatás használatához rendelkeznie kell a bármely harmadik fél képeinek használatára vonatkozó jogokkal, a feltöltési előzményeit pedig bélyegképekként tárolja a rendszer. A feltöltött képeknek a Felhasználói irányelveikben meghatározottak szerint tiszteletteljesnek és biztonságosnak kell lenniük.).

A mesterséges intelligencia megpróbálja a kép tartalmát értelmezni. A fotón egy ház, hegy, folyó, macska, stb… látható. Majd pedig ehhez hasonlít fog rajzolni.

Itt találunk egy Erősség csúszkát. Gyenge fokozatban csak a képen lévő dolgokat fogja rajzolni. Pl. ha a képen van egy ház, akkor a generált képen is lesz egy ház. Míg a legerősebb fokozatban az eredeti ház körvonalait, ablakait, ajtaját és további tulajdonságait is átviszi az új képre. Így az eredetihez nagyon hasonló képet kaphatunk.

Az alábbi képen láthatjuk, hogy a gyenge beállításnál az eredeti képhez csak nyomokban hasonlító faházat kaptunk. A közepes esetén már a háttérben lévő minaret is visszakerült a képre, de az oldalsó ablakokat nem rajzolta meg a program. Az erős esetében szinte ugyan azt a házat láthatjuk. Az előtérben lévő ház ablakai, és a háttérben lévő minaret erkélye is felkerült a képre.

Adobe Firefly strukturális referencia beállításai
Adobe Firefly strukturális referencia beállításai
Warning!

Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

Stílus referencia

Adobe FireFly stílus referencia
Adobe Firefly stílus referencia

A Strukturális referencia azt adja meg, hogy mi legyen a képen. A Stílus referencia pedig, hogy az miként legyen megrajzolni: fénykép, olajfestmény, ceruzarajz, zsírkréta, képregény, stb..

A szerzői jogok figyelembe vételével feltöltünk egy fájlt, és azt kérjük a mesterséges intelligenciától, hogy ilyennek rajzolja meg a képünket.

Itt is találunk egy Erősség csúszkát, amivel azt állíthatjuk be, hogy a program mennyire a referenciakép stílusát figyelje, vagy inkább az utasításban (prompt) leírtakat. Mellé kapunk egy Vizuális intenzitás csúszkát is, amin a referenciakép stílusának intenzitását állíthatjuk.

Warning!

Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

Példa 1 – Vektoros referenciakép

Ebben a példában egy fekete-fehér vektoros képet használunk Strukturális referenciának, maximális Erősséggel. Egy Magyarország vaktérképre felírtuk a „Hungary” feliratot. Ezt adjuk oda az Adobe Firefly programnak, hogy valami látványos rajzot készítsen.

Magyarország - Fekete-fehér vektor térkép
Magyarország – Fekete-fehér vektoros térkép

Stílus referenciát nem használva az utasítás (prompt) csak annyi volt, hogy „Hungary”. A Tartalom típusát művészire állítva az alábbi képet kaptuk:

Adobe FireFly - Művészi stílus
Adobe Firefly – Művészi stílus

A program a rajzolás során megtartotta Magyarország körvonalait, és azon belülre rajzolt néhány híres magyar épületet (vagy legalábbis hozzájuk nagyon hasonlót).

A következő képnél Fotó stílust kértem.
Ilyenkor nem minden esetben tudja követni az eredeti kép körvonalait. Nem tudunk olyan ismert épületet megadni, mint pl. a Parlament, mert annak alakját nem tudja Magyarország körvonalával összeilleszteni.
Érdemes valami olyasmit keresni, aminek kötetlen alakja van. Itt azt kértük, rajzoljon egy magyar zászlót.

Adobe FireFly - Fénykép stílus
Adobe Firefly – Fénykép stílus

Ez a technika nagyon jól használható arra is, hogy a meglévő céges logót izgalmas grafikával tegyük látványosság.

Adobe logo másképpen
Adobe logo másképpen

Példa 2 – Fénykép átalakítása

Ebben a példában egy valódi képet mutatunk meg az Adobe Firefly programnak. Azt mondjuk, hogy Ezt rajzold át, de maradjon meg az eredeti hát tulajdonsága!.

Strukturális referenciának egy utca sarkon álló faházat adtunk meg. Stílus referenciát most nem használtunk.

Az eredeti fénykép
Az eredeti fénykép

Az Adobe Firefly programot arra kértük, hogy alakítsa át ezt a házat tél verzióra. Legyen hó!

Az Adobe Firefly téli verziója
Az Adobe Firefly téli verziója

A program megtartotta a ház jellegzetességeit (bár a mellette lévő nem-faház is faház lett). A házat, utakat de még a fákat is beterítette hóval.

A következő kép esetében azt kértük, hogy a faház helyett legyen inkább téglaház.

A faházból tégla házat készítettünk
A faházból tégla házat készítettünk

Figyeljük meg, hogy a képen nem egyszerűen kicserélte a fát téglára. Nem olyan, mintha egy 3D programban textúrát cseréltünk volna. Megváltoztak az ablakok, az ajtók, és a környezetük is. Minden olyan, mintha ez a ház mindig is téglából épült volna.

Nézzük meg, miként néz ki a kép, ha ceruzarajzot kérünk.

A kész kép ezúttal is megtartotta az épület eredeti szerkezetét. Még a faház vonásai is látszanak!

A fenti példákban csak néhány rövid utasítást adtunk. Hosszabb utasításokkal megadhatunk olyat is, hogy milyen színű legyen a fal, az ablakok, milyen típusú téglát használjon, stb…

Példa 3 – Ceruzarajz átalakítása

Próbáljuk ki a fordítottját!

Ebben a példában egy mérnők egy képzeletbeli ház előnézeti rajzát készítette el. Ceruzával kb. 2 perc alatt rajzolta papírra. Tehát semmi digitális nem volt benne mielőtt lefotóztuk.

Egy képzeletbeli ház előnézeti képe - Ceruzarajz
Egy képzeletbeli ház előnézeti képe – Ceruzarajz

Elsőnek még csak a Strukturális referenciát használtuk. Utasításnak (prompt) pedig azt írtuk, hogy egy régi faház (old wooden house).

Adobe FIrefly generált kép - Régi faház
Adobe Firefly generált kép – Régi faház

A program megtartotta a vonalakat. A ház két emeletes lett, erkéllyel, ajtóval. És bár a középső hosszú üvegablak nem maradt meg, de valami nagyon hasonló lett. Még a középső ablakokat is kisebbre rajzolta, mint ahogy az eredeti rajzon is volt.

Kérjük meg a Firefly programot, hogy modern házat (modern house) rajzoljon.

Adobe FIrefly generált kép - Modern ház
Adobe Firefly generált kép – Modern ház

Mivel semmilyen más utasítást nem adtunk, így a program saját maga választott stílust. A színek kicsit érdekesek lettek. De az erkély, a középső nagy üveg ablak, a bejárat, de még a kis domb is a helyén van.

Stílus referencia

Most adjunk meg egy Stílus referenciát is!
Tehát azt mondjuk a programnak, hogy Ilyen házat szeretnénk.
A Midjourney szöveg-alapú MI rajzolót kértük meg, hogy rajzoljon egy referencia képet.

Midjourney generált kép amit referenciának használunk
Midjourney generált kép amit referenciának használunk

És itt is van az eredmény!

A struktúra referencia és a stílus referencia alapján készült kép
A struktúra referencia és a stílus referencia alapján készült kép

Ez a kép semmiben sem különbözik attól, mint amit egy építészeti programban rajzolnánk meg. Teljesen élethű, és nagyon látványos. Oda lehet adni a megrendelőnek, hogy ilyen házat tudunk készíteni.

Csakhogy mi nem dolgoztunk napokat a ház mérnöki rajzolásával, majd a renderelt kép elkészítésével. A ceruzarajz és a végleges kép között kb. 2 perc telt el.
Ráadásul nagyon könnyen tudjuk a stílust módosítani azzal, hogy egy másik képet mutatunk a mesterséges intelligenciának.

A stílus referenciaképek a Midjourney programban készültek. De ehhez is használhattuk volna az Adobe Firefly programot.

Belsőépítészet

A Strukturális és Stílus referenciák használatával nagyon gyorsan újragondolhatjuk a lakás belső kinézetét.

Mindehhez csak egy fénykép kell a szobáról (Ezt rendezd át!), és egy olyan, amit stílusnak lehet használni (Ilyen legyen!).

Warning!

Tipp!
Érdemes arra odafigyelni, hogy a mesterséges intelligencia esetleg nehezen ismeri fel a kép tartalmát. Az utasítás (prompt) megadásnál sokat tudunk segíteni a programnak a kép tartalmának értelmezésében is.

Pl. ha a referenciaképen egy hálószoba van ággyal, akkor az utasításba (prompt) mindenképpen írjuk bele az utasításba (prompt), hogy hálószoba (bedroom). Így a program tudja, hogy a kép közepén lévő nagy lapos valami ágy, nem pedig asztal.

Nappali újratervezése

Itt egy fénykép a nappali szoba egyik sarkáról

Nappali fénykép
Nappali fénykép

Referenciának egy elegáns modern nappali képét kértem a Midjourney programtól

Nappali referencia
Nappali referencia

Négy képet kaptunk eredménynek. Egyik jobb, mint a másik!

Firefly dolgozik
Firefly dolgozik

Végül ezt a képet választottuk.

Figyeljük meg, hogy a szoba fő vonalai nem változtak. Ennek oka, hogy a Struktúra Erősségét a maximumra állítottuk. Így a program nem cserélte le a foteleket, asztalokat. De még a párnákat sem! Csak a huzatot cserélte ki.
Kaptunk viszont egy új asztalt. Sütit is rajzolt nekünk a program!

Dolgozó szoba átrajzolása

Következőben a gyerekek dolgozószobáját rendezzük át. Itt MI legyen a talpán, ami kiismeri magát, hogy mi merre van!

Éppen ezért az utasításba pontosan megadjuk, hogy a képen egy dolgozó szoba van (working room), egy munka asztallal (working table), és egy könyvszekrény (bookshelf).

Dolgozó szoba fénykép
Dolgozó szoba fénykép

Stílus referenciának a Midjourney programban generáltam egy modern dolgozó szobát (modern working room).

c
Nappali átrajzolva

És itt is van az eredmény:

Dolgozó szoba újrarajzolva
Dolgozó szoba újrarajzolva

A mesterséges intelligencia megint szépen megtartotta a vonalakat. Nem változott a szekrény, csak át lett festve. Azzal, hogy megmondtuk, ott könyvespolc van, a program nem valami nagyon más dolgot akart odarajzolni.

Gyerekszoba átrajzolása

A következő példában a gyerekszobát adtuk meg Struktúra referenciaként. Mivel a gyerekszoba szó túlságosan szerteágazó jelentésű (azaz ott plüss elefánttól kezdve ottfelejtett zokniig bármi lehet), ezért utasításnak a hálószoba (bedroom) és a könyves szekrény (bookshelf) lett megadva.

Gyerekszoba fénykép
Gyerekszoba fénykép

Stílus referenciát ezúttal is a Midjourney programtól kértem. Az utasítást (prompt) a ChatGPT rakta össze arra a kérésre, hogy zöld, modern, technikai és cyber legyen.

Gyerekszoba referencia
Gyerekszoba referencia

Ebből a kettőből ezt a képet keverte ki az Adobe Firefly:

Gyerekszoba újrarajzolva
Gyerekszoba újrarajzolva

Összegzés

Az Adobe Firefly programmal egy meglévő képet (fotó, vagy rajz) referenciának használva könnyen és nagyon rövid alatt át tudunk rajzolni.

A Stílus referenciával pedig még az utasításokkal (prompt) sem kell sokat foglalkozni. Egyszerűen csak megmutatjuk a képet, hogy ilyet szeretnénk.

Használjuk bátran, kísérletezzünk vele. Időnként pedig nagyon jó ötletek kerülnek ki a mesterséges intelligencia képei közül.

PixelRita

PixelRita neked hogy tetszik?

Loading