Készülődés a nyárra a ChatGPT-vel és a Geminivel

Becsült olvasási idő 18 perc.

Bevezető

Itt van a nyár, ugye komám, a szív a ChatGPT-nek szalutál,
tervezzük meg együtt a nagy kalandot,
hova menjünk, hol együnk fagyit, és mit fedezzünk fel

Bátran rikkant, nyaralók ho-ho-ho-ho-ho,
megint csak ho-ho-ho-ho.

Van itt ötlet és sok program, az eszem pedig jól forog,
útiterv útitervre kiválón sorjáz, ravasz a nagy nyári kaland.

Városbéli nyaralók, ha tanács kell, hol van a legjobb hely,
ChatGPT megmondja gyorsan, hallgassátok,
amit most néktek eldalol a nagy nyári kaland.

Ha itt a nyár, ugye komám, a szív a ChatGPT-nek szalutál,
tervezzük meg együtt a nagy kalandot,
hova menjünk, hol együnk fagyit, és mit fedezzünk fel.

Bátran rikkant, nyaralók ho-ho-ho-ho-ho,
megint csak ho-ho-ho-ho.

Van itt ötlet és sok program,
az eszem pedig jól forog,
útiterv útitervre kiválón sorjáz,
ravasz a nagy nyári kaland.

Városbéli nyaralók, ha tanács kell, hol van a legjobb hely,
ChatGPT megmondja gyorsan, hallgassátok,
amit most néktek eldalol a nagy nyári kaland.

Itt van a nyár, és hamarosan utazunk!
Csakhogy egy nyaralás megszervezése nagyon összetett feladat: utazás, szállás, étkezés, látnivalók, mindenki mást akar, mindenkinek más a tempója, mennyibe fog kerülni, stb. stb.
Szerencsére itt a mesterséges intelligencia, amely óriási segítséget tud nyújtani nekünk a tervezésben. Ráadásul a tavaly évhez képest nagyon sokat fejlődött!

Az utazás tervezése

Előkészületek a mesterséges intelligencia segítségével

ChatGPT

Ebben a bejegyzésben a ChatGPT-4o modellt használtuk.

ChatGPT Memória

A ChatGPT-ben 2024. év elején megjelent a Memória funkció. Ez most roppant hasznos lesz nekünk!
Megadhatjuk a programnak, hogy pl. én szeretem a sajtot ezért a programba mindenképpen iktasson be legalább egy sajt boltot. Megmondhatjuk neki, hogy melyik családtag mit szeret, mik a preferenciánk, és mit kerüljünk el mindenképpen. Arra is kérhetjük a GPT-t, hogy inkább történelmi sétákat, múzeumlátogatásokat, gasztronómiai vagy vásárlós túrákat szervezzen. Beállíthatjuk a pénztárcánkat is, hogy keveset, vagy sokat szeretnénk költeni.
És még nagyon sok mindent, amivel személyre szabhatjuk a nyaralást.

CustomGPT

Memóriának vannak hátrányai is: korlátozott a mérete (kb. 2 oldalnyi szöveg, ami körülbelül 1000 szó lehet – 2024. június), minden beszélgetésen ott van, nem lehet külön választani, stb.

Érdemes lehet a nyaralásokhoz egy saját CustomGPT-t készíteni, ahova ugyan úgy részletesen be tudjuk írni a család kívánságait, preferenciáit.

Kreálhatunk többet, több félét is. Pl. ha az egész család megy, amikor csak a felnőttek, amikor üzleti utazásról van szó, külön egyet a nyárra és külön a télre. Vagy akár a bőrönd összeállításában segítő CustomGPT-t és alkothatunk.

CustomGPT kifejezetten a családi nyaralásra tervezte
CustomGPT kifejezetten a családi nyaralásra tervezte

Az utazás tervezése

Most, hogy a memória fel van töltve, nincs más dolgunk, mint hogy megmondjuk a ChatGPT-nek, hogy mikor, hova és hány napra szeretnénk menni. Adjuk meg azt is, hogy készítsen részletes programot minden személy számára!

Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából

Mivel beírtuk az, hogy ki mit szeretne látni, a programot e szerint állította össze.

Kaptunk egy listát, hogy mely programokat kinek ajánlja, mellette a belépő árakkal is. A ChatGPT odafigyelt arra is, hogy a felnőtteknek felnőtt, a gyerekeknek gyerek jegyet írjon fel. Ahol pedig lehet, ott a családi jegyet javasolta.
Majd közös programokat is ajánlott.
A végére pedig néhány tippet is írd, minthogy érdemes online foglalni, használjunk városnéző buszokat, és legyen nálunk sok víz.

Ne felejtsük el, hogy ez nem egy egyszeri lekérdezés! Ez még csak a beszélgetés kezdete!
Kérjünk további tippeket a ChatGPT-től. Kérjünk bővebb információkat a látnivalókról, múzeumokról! Puhatoljuk ki, hogy nekünk vagy a családtagoknak ez mennyire tetszene, stb.

  • Az X múzeum nem tetszik, ajánlj helyette másikat
  • Mi látható az Y múzeumban. Mennyi idő alatt lehet megnézni?
  • Szerinted a kisebb gyereket érdekelheti a Z múzeum?
  • Javasolj egy kávézót a múzeum közelébe!
  • Készíts egy listát a belépőjegyekről forintban.
  • Tudunk online jegyet venni?
  • Van-e a közelben…?
  • Mit érdemes fényképezni?

Majd pedig a végén kérjünk egy részletes táblázatot, hogy melyik nap mit nézünk meg, és mennyibe kerül!

💡 Tipp
Írjuk bele az utasításba, hogy jelezd, mennyire megbízhatóak és naprakészek az információk, adjál linket is.
Ez segít az adatok ellenőrzésében.

Google Gemini

Utazás tervezése a Google-el

A Google Gemini nyelvi modelljétől azt várjuk, hogy sokkal pontosabb és részletesebb lesz, mint a ChatGPT. Hiszen az utazással kapcsolatos adatokból (szállodák, éttermek, vásárlási helyek, múzeumok, térképek stb.) sokkal bőségesebb mennyiség áll a rendelkezésére. Ráadásul a Google évek óta ezzel foglalkozik, csak nem mesterséges intelligencia formában.

Én a teszt során az ingyenes Google Gemini-t használtam. A fizetős verzió jobb eredményt hozhat. Illetve a modellt is folyamatosan fejlesztik. Ami ma nem működött, holnap már talán igen!

Gyűjtsük az információkat!

A Google Gemini esetében nincs hír arról, hogy terveznének egy Memóriához hasonló funkciót (de hát elvileg a Google úgyis tud rólunk mindent, nem?). De semmi gond! A kezdő utasításban ugyan úgy megadhatunk minden fontosabb adatot.
Majd pedig írjuk le, hogy mikor, hova, hány napra megyünk, és mit szeretnénk csinálni!

Részlet a Google Gemini utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából
Részlet a ChatGPT utazási ajánlatából

A Google nagyon szép listát adott a látnivalókról. Kaptunk képeket, linkeket és még árakat is. Mindez segít a helyszínek kiválasztásában.

A végére kaptunk tippeket, hogy használjunk CityCart-ot (itt Roma Pass), ami kedvezményt nyújt. A Gemini továbbá javasolta a térképek letöltését, néhány helyi szó megtanulását, majd pedig, hogy legyen kényelmes cipőnk, mert sokat kell gyalogolni.

Ne felejtsük el, hogy ez nem egy egyszeri lekérdezés! Ez még csak a beszélgetés kezdete!
Kérjünk további tippeket a Google Gemini-től. Kérjünk bővebb információkat a látnivalókról, múzeumokról! Puhatoljuk ki, hogy nekünk vagy a családtagoknak ez mennyire tetszene, stb.

  • Az X múzeum nem tetszik, ajánlj helyette másikat
  • Mi látható az Y múzeumban. Mennyi idő alatt lehet megnézni?
  • Szerinted a kisebb gyereket érdekelheti a Z múzeum?
  • Javasolj egy kávézót a múzeum közelébe!
  • Készíts egy listát a belépő jegyekről forintban
  • Tudunk online jegyet venni?
  • Van-e a közelben…?
  • Mit érdemes fényképezni?

Majd pedig a végén kérjünk egy részletes táblázatot, hogy melyik nap mit nézünk meg, és mennyibe kerül!

💡 Tipp
Írjuk bele az utasításba, hogy jelezd, mennyire megbízhatóak és naprakészek az információk, adjál linket is.
Ez segít az adatok ellenőrzésében.

Kávézók, éttermek, fagyizók

Ha már megyünk valahova (és pénzünk is van véletlenül), akkor érezzük is jól magunkat!
De egy nagyvárosban és a népszerű turista helyeken számtalan hely létezik, ahova kávézni, süteményt vagy fagyit enni be lehet ülni.

Kérdezzük meg a mesterséges intelligenciát, mit tud javasolni nekünk. Az MI nemcsak az adatok gyűjtésében, hanem azok feldolgozásában, értelmezésében és rendezésében tud sokat segíteni. Nem kell különböző web-oldalakat átböngészni. Nem egy felsorolást látunk, hanem egy rendezett listát az általunk választott szempontok szerint.

A prompt

Egy példa az utasításra (prompt), ami segíthet a kávézók kiválasztásában.

Róma belvárosában javasoljál olyan helyeket, ahova érdemes beülni kávézni.
Készíts egy táblázatot az alábbi szerint: Hely neve, típusa, épület típusa, kedvenc kávé, kedvenc sütemény, árkategória, távolság a központtól.
15 helyet írjál!

A fenti utasítást kedvünk szerint módosíthatjuk. És természetesen nemcsak kávéházat, fagyizót vagy éttermet kérhetünk így, hanem tetszés szerint bármi mást is: sajtbolt, játékbolt, ékszerbolt, múzeum, szökőkút, stb.

ChatGPT

A ChatGPT erőssége a Memória, illetve a CustomGPT lehet, ahol beállítottuk a kedvenceinket. Így pl. ha valaki nem szereti a halat vagy allergiája van, akkor a program az olyan helyeket nem fogja javasolni.

A ChatGPT ajánlott kávéházai
A ChatGPT ajánlott kávéházai

A kész táblázatot Excel formába exportálhatjuk, ha szeretnénk vele tovább dolgozni. Illetve a GPT-4o már interaktív táblázatot is készít, hogy helyben dolgozzunk az adatokkal. Pl. árkategória szerint rakhatjuk sorba a kávézókat.

Természetesen a táblázat elkészülte még nem jelenti a beszélgetés végét. További kérdéseket tehetünk fel a programnak (pl. mi az az xzy étel?), bővíthetjük vagy szűkíthetjük a listást, stb.

Google Gemini

A Google erőssége, hogy mérhetetlenül sok naprakész helyi információi vannak. Ellentétben a ChatGPT-vel, ami web-oldalakról és leírásokról gyűjti az adatokat, a Google a Térképre feltöltött óriási tudásbázissal rendelkezik. Nekünk már csak ki kell nyerni belőle az adatokat.

A Google Gemini ajánlott kávéházai
A Google Gemini ajánlott kávéházai

A Google Gemini is nagyon jól átlátható táblázatot készített a kávéházról (szintén exportálható további feldolgozásra, ezúttal a Google Számolótáblába).

Most kérjük meg, hogy az ajánlatokat mutassa meg térképen is!

A Google Gemini ajánlott kávéházai térképes listában.
A Google Gemini ajánlott kávéházai térképes listában.

Elsőnek egy listát kaptunk, ahol a nevekre kattintva a Google Térképre jutunk. Így mindjárt fel is vehetjük a kávézót a mi térképünkre.
Majd pedig egy tényleges térképen is láthatjuk, melyik kávézó hol található.

Ráadásul a térképen látható pontok tényleg ott vannak, ahol a kávéház is (amennyiben eredetileg is jó helyre tették a pontokat). Hiszen a Google az adott helyeket a saját Térkép adatbázisával köti össze, nem pedig különböző web-oldalak leírása alapján próbálja a helyet megtalálni.

A Google Gemini ajánlott kávéházai a térképen.
A Google Gemini ajánlott kávéházai a térképen.

Hotel

Hotel keresése 2024-ben igazán nem probléma! Rengeteg oldalt találunk, ahol százával (ezrével, tízezrével) vannak a szállodák. Választhatunk szűrőket (ingyenes wifi, reggeli a szobába), beállíthatjuk az árkategóriát, és még számtalan mást is.

De vajon tudunk-e olyan hotelt keresni, ahonnan látszik az Akropolisz Athénban? Vagy ahol kék a szőnyeg? Ahol olívabogyót adnak a reggelihez?

Kérdezzük meg a mesterséges intelligenciát, ő tud-e segíteni az ilyen extra kívánságainkban is?
És persze nem akarok Euróban számolni. Forintban* kérem az árakat!

(* a Forintba számolás attól függ, hogy milyen árfolyamot használ, az mennyire frissek az adatok, stb. érdemes lehet megadni, hogy 1 euró = x Forint)

A prompt

Gyűjtsél nekem 5 hotelt Athénban, ahol 2 felnőtt és 2 gyerek július közepén nem tud szállni. Autóval megyünk ezért legyen garázs vagy parkolási lehetőség. Legyen ingyenes wifi, és kilátás az Akropoliszra.
Az árakat forintba számold!

ChatGPT

A ChatGPT előnye ismételten az, hogy előre meg tudtuk adni a preferenciánkat és nyűgjeinket.

Nem biztos, hogy a legjobb helyeket találta meg, de egy korrekt listát kaptunk.
Hátránya, hogy a különböző weboldalak leírásai alapján készült a lista. Bizonyára találunk olcsóbb helyeket is…

A ChatGPT hotel listája kilátással az Akropoliszra
A ChatGPT hotel listája kilátással az Akropoliszra
A ChatGPT hotel listája ahol reggelire olíva bogyót is adnak

Google Gemini

A Google ismét a saját adatbázisát, a Google Szállodákat használta. Tehát több, jobb és pontosabb adatból tud dolgozni. Viszont nem vette figyelembe a külső oldalak leírásait. Így ha a hotel nem írja le, hogy látszik az ablakból az Akropolisz, akkor ezt a Google Gemini sem tudja megmondani. Még akkor sem, ha a hotel képeinek nagy részén rajta van.

Volt hír róla, hogy a Google szeretne egy olyan mesterséges intelligencia programot kifejleszteni, ami a Térképre feltöltött képek tartalmát tudná értelmezni. Amikor ez működni fog, akkor már tényleg lehet az olyan extrákra is keresni, hogy mit adnak reggelire, ilyen színű a függöny, milyen konnektor van a szobában, mi van a minibárban, vagy bármi másra amit valaki lefényképezett és feltöltött.

Addig használjuk a Google Szállodákban talált információt, amik között ilyeneket találunk, mint az átlagos értékelés, légkondicionáló, stb.

(Nálam az árak török lírában (TRY) jelennek meg, mert Isztambulból írom a blogot. Pedig kértem, hogy forintban számoljon)

A Google Gemini hotel listája
A Google Gemini hotel listája

A szállodákat rendezett formában is láthatjuk: kis kép a hotelről, átlagos értékelés (hányan értékelték), a szálloda tulajdonsága, és ára.

A Google Gemini hotel listája
A Google Gemini hotel listája

Belépőjegy

Maradjunk továbbra is a tervezésnél!

Mind a ChatGPT, mind a Gemini a saját adatbázisa alapján dolgozik. Ez lehet elavult, vagy akár téves is, ami miatt nem a konkrét belépő jegy árat fogjuk látni. Minden esetben ellenőrizzük a múzeum hivatalos weboldalán az aktuális árakat!!

Ez sokszor egyáltalán nem olyan egyszerű, mint látszik!
Sok országban előfordul, hogy az angol nyelvű árlista elavult, vagy el sem készült. Így nekünk a német, olasz, francia, vagy akár török oldalon kell kibogarásznunk, hogy akkor mi mennyibe is kerül.

És persze van felnőtt jegy, gyerek jegy, meg diák jegy, meg 16 év alatti jegy, meg családi jegy, meg amiben audioguide is van, meg amivel az emeletre is fel lehet menni, meg ha délután 5 után megyünk, meg ha éppen havazik, meg ha öttagú családdal vagyunk és veszünk csavaros csokifagyit és a mesebarlangot is akarjuk lát és a retúr kisvasút is benne van de a nagypapát inkább a sörözőben hagynánk félúton….

Nos, a mesterséges intelligencia pont az ilyen dolgokat látja át (vagy mégsem?)

Feladat

Kérjük meg a mesterséges intelligenciát, hogy a megadott weboldalról gyűjtse össze a belépő jegyek árait.
Bécsben a Schönbrunn kastély árlistáját adtuk oda a programoknak. Ez egy közepesen összetett oldal.

Schönbrunn kastély belépő árai valójában
Schönbrunn kastély belépő árai valójában

A feladat is összetett. A jobb átláthatóság értelmében az eredményeket pontozzuk.

A program feladatai (összesen 7 pont)

  • A weboldal nem magyar nyelvű (jelen esetben német), mi mégis magyarul szeretnénk látni, hogy melyik jegy mit is takar pontosan. (1 pont)
  • Mind a 16 jegyet írja le (2 pont)
  • Találja meg, hogy mennyi ideig tartanak a túrák (1 pont)
  • 2 felnőtt és 2 gyerek jegyet kérünk. A programnak ezt az információt meg kell találnia, és ki kell számolni a jegy árát 4 főre. (2 pont)
  • A jegy árakat át kell számolnia forintba, az átváltási rátát magának kell megtalálnia (1 pont)

A prompt

Készíts egy magyar nyelvű táblázatot az alábbi link alapján Schönbrunn kastély összes belépő jegyéről.
Írd le a jegy nevét, mennyi ideig tart, mi látható, mennyibe kerül 2 felnőtt és 2 gyerek részére euróban, mennyibe kerül a családnak forintban, és ha van egyéb információ azt is.
https://www.schoenbrunn.at/unsere-tickets-touren/alle-tickets-touren

ChatGPT

Mind a 16 jegy leírása nagyon hosszú. Az ilyen feladatok elől a ChatGPT próbál kibújni. Csak a legfontosabb jegyeket szedte össze.

Schönbrunn kastély belépő árai by ChatGPT
Schönbrunn kastély belépő árai by ChatGPT
  • Megkaptuk a túrák magyar ismertetőjét: 1 pont
  • Nem írta le mind a 16 jegyet – 0 pont
  • Megtalálta a túrák időtartalmát – 1 pont
  • 2 felnőtt és 2 gyerek belépő árát megtalálta, és jól adta össze – 2 pont
  • A jegyárakat átszámolta forintba. Ez persze eltérhet a napi árfolyamtól, így mi is megadhatjuk, hogy 1 Eurót hány forintnak számoljon. – 1 pont.

A ChatGPT ebben a feladatban 6 pontot ért el. Kis noszogatással mind a 16 jegy adatait le tudjuk kérni a programtól, és akkor meglesz a 7 pont is.

Természetesen a beszélgetés most sem ért a végére. Bízva abban, hogy a ChatGPT több információval rendelkezik, mi pedig megadtuk a preferenciánkat, kérdezgessünk a túrák tartalmáról: melyik érdekelheti a gyerekeket, mennyire fárasztó, mit lehet látni, stb.

Google Gemini

A Gemini esetében kicsit tovább jutottunk. Ő már 9 jegyet gyűjtött össze a 16-ból.
Továbbá kaptunk extra információkat, hogy a jegyek online megvásárolhatóak, vannak kombinált jegyek, éjszakai túrák, de még koncertek is!

Schönbrunn kastély belépő árai by Google Gemini
Schönbrunn kastély belépő árai by Google Gemini

Eredmény:

  • Megkaptuk a túrák magyar ismertetőjét: 1 pont
  • Nem írta le mind a 16 jegyet, csak a felét – 1 pont
  • Megtalálta a túrák időtartalmát – 1 pont
  • Az árakat nagyon rosszul rakta össze. Nem sikerült rájönni, miképpen számolta ki őket… – 0 pont
  • Bár hibás jegyárral indult, de a számolás pontos. Ez persze eltérhet a napi árfolyamtól, így mi is megadhatjuk, hogy 1 Eurót hány forintnak számoljon. – 1 pont.

A Google Gemini ebben a feladatban 4 pontot ért el. Többszöri próbálkozásra is rossz árakat kaptunk. Más oldalakon kaphatunk jobb (és rosszabb) eredményt. Illetve idővel bizonyára ez is javulni fog.

Természetesen a beszélgetés most sem ért a végére. A Google rengeteg adattal rendelkezik, így kérdezgessünk a túrák tartalmáról: melyik érdekelheti a gyerekeket, mennyire fárasztó, mit lehet látni, mik a tapasztalatok, stb.

A mesterséges intelligencia használata az utazás alatt

A mesterséges intelligencia nemcsak a tervezésben, hanem aktívan az utazásban is tud segíteni. Többek között egyre jobban fejlődnek az azonnali tolmácsolási képességek.

Az alábbi példákban az MI azon tulajdonságait használjuk, hogy a látott képet értelmezze, majd pedig segítsen nekünk, hogy mi is értsük mit látunk. Vagy mit eszünk, vagy mit veszünk.

Étlap fordítása és értelmezése

Feladat

A program kap egy lefényképezett étlapot, ahol nemhogy magyarul, de még angolul sincsenek az ételek feltüntetve. Szeretnénk tudni, hogy mégis mi micsoda, és mennyibe került, meg mik azok a rövidítések.

100%-ban olasz étlap
100%-ban olasz étlap

A program feladatai (összesen 8 pont)

  • Le kell fordítania az étlapot magyarra (1 pont)
  • Az árakat át kell számolnia forintba, az átváltási rátát magának kell megtalálnia (*). (2 pont)
  • A zárójelekben található allergiákat értelmeznie kell (1 pont)
  • Rákérdezünk egy konkrét ételre a menüből, és ezt magyarázza el. (1 pont)
  • Kérünk egy képet az adott ételről (1 pont)
  • Kérünk egy receptet, hogy otthon is meg tudjuk főzni (1 pont)
  • Kérünk étel ajánlatot. Nem túl laktató, és gluténmentes legyes (1 pont)

(*) A pontosabb számolás érdekében megadhatjuk, hogy 1 euró hány forint.

A prompt

🍴 Írd le az összes ételt magyarul ami ezen a képen van. Írd le azt is, hogy hány forintba kerülnek

🍴 Mit jelentenek a GL, U, L, P stb. rövidítések?

🍴Ez az étel nagyon tetszik: Zöld tagliolini fehér raguval, mogyoróval és moliterno sajttal

🍴Mutatnál róla egy képet?

🍴Írjál több információt erről az ételről

🍴Írj egy pontos receptet ennek az ételnek az elkészítéséről!

🍴Közepesen vagyok éhes. Valami olaszos ételt szeretnék az étlapról, ami nem tartalmaz glutént

ChatGPT

Étlap fordítás

Az étlap, ahogy a ChatGPT legordította
Az étlap, ahogy a ChatGPT legordította

Szúrópróba-szerűen kiválasztottam néhány ételt, és úgy tűnik, hogy a fordításban nincs hiba. A kapott eredményt már tudjuk használni arra, hogy ételt válasszuk magunknak.

Az árak, és a forintba átszámolás teljesen jó. A program egy kissé régi átváltási arányt használt.

Rövidítések

Mit jelentenek a rövidítések? A ChatGPT megmondja!

ChatGPT allergia kódok
ChatGPT allergia kódok

Ez kritikus rész annak, akinek allergiája van. A menü alján külön le van írva, hogy melyik kód mit jelent, így a ChatGPT-nek csak ezt kellett értelmeznie. Ezt a feladatot most jól teljesítette, de a program hibázhat is!!

Ha valamire allergiánk van, inkább készüljünk fel rá az adott nyelvből!

Több információ az ételről

Az összetevők alapján még nem derül ki, hogy milyen étel is van a menüben. Talán egy kép tudna segíteni a döntésben!
A ChatGPT gyorsan rajzolt is egyet. A Dall-E mesterséges intelligencia rajzolót használta. Nem biztos, hogy bármiben is hasonlít a valódira!

A ChatGPT rajzolt egy képet az ételről
A ChatGPT rajzolt egy képet az ételről

Ha még ezek után is szeretnénk többet tudni az ételről, akkor a ChatGPT bőséges információval lát el minket.

A ChatGPT további információkat adott az ételről
A ChatGPT további információkat adott az ételről

És ha már itt járunk, akkor egy receptet is kérünk, hogy otthon is meg tudjuk főzni.

A ChatGPT írt egy receptet adott az ételről
A ChatGPT írt egy receptet adott az ételről

Természetesen mindez csak egy kísérlet. Amikor az étteremben ülünk, akkor nem lehet az összes ételt ilyen bőségesen lekérdezni, mert akkor két napig csak ezeket az információkat fogjuk böngészni.

Inkább kérjük meg a programot, hogy ő javasoljon valamit!

Étel ajánló

A ChatGPT esetén ismét segítségünkre lehet, ha előtte betanítottuk a programot, hogy mit szeretünk, mit nem, és mire vagyunk allergiásak. Ezt természetesen az utasításban is megadhatjuk.

A ChatGPT ajánlata
A ChatGPT ajánlata

Összegzés

  • Az étlap fordítása sikerült: magyarul van, érthető, átlátható (1 pont)
  • Az árakat forintba is átszámolta.. (2 pont)
  • Az allergia táblázat is jó lett. (1 pont)
  • Elmagyarázta azt az ételt, amit kértünk (1 pont)
  • Kértünk egy képet az ételről, erre rajzolt egyet. A valódi kép jobb lett volna (0,5 pont)
  • Megkaptuk a receptet (1 pont)
  • Az étel ajánlat is rendben van. Mindegyik gluténmentes. (1 pont)

Összesen 7.5 pontot szerzett a ChatGPT, ami elég jónak számít. Megbízhatóan használhatjuk az étteremben az étel választásánál.

Csak sajnos az egész technika borzasztóan lassú! Akár 10 percek is eltelhetnek, míg az MI segítségével ételt választunk. Sokat tudunk gyorsítani a folyamaton, ha Memóriával vagy CustomGPT-vel megtanítjuk a programnak, hogy milyen ételeket szeretünk, miket kerülnénk el, stb.

Google Gemini

A Google régóta dolgozik mind a fordító programon (Google Translate), mind a kép értelemező technikákon.
Egy étlap lefordítása és értelmezése nem okozhat neki problémát

Étlap fordítás

A fordítás teljesen jó! Sajnos az árakat nem számolta át forintba.

Rövidítések

Az összes rövidítést nem írta le magyarul, csak néhányat. Lehet, hogy pont azt nem, amire szükségünk van.

De ilyen esetekben ne bízzuk magunkat a mesterséges intelligencia változó eredményeire! Ha valamilyen allergiánk van, vagy csak nem szeretjük valamelyik ételt, akkor készüljünk fel rá az adott nyelvből!

Több információ az ételről

Most lássuk, milyen információkat kapunk a Google Geminitől, ha többet szeretnénk az adott ételről megtudni!

A Google Gemini nagyon lelkes volt! Nemcsak több információt kaptam, de mindjárt elkezdte a receptet is megírni (lehet, hogy ismert engem?).

A program „hangulatától” függően képet is kapunk. De ha külön kérjük, végül szerez egyet az internetről. Így jó eséllyel azt látjuk, ami a majdani étel lesz.

Étel ajánló

Ha minden ételről ilyen részletes ajánlatot kérünk, az rengeteg időt igényel. Inkább kérjük meg a Geminit, hogy válasszon nekünk egy ételt. Megadhatjuk azt is, hogy miket szeretünk, és miket kerüljön el.

Összegzés

  • Az étlap fordítása sikerült: magyarul van, érthető, átlátható (1 pont)
  • Az árakat nem számolta át forintba. (0 pont)
  • Az allergia táblázat hiányos. Ha többször kérjük, megkapjuk a teljes listát. (0.5 pont)
  • Elmagyarázta azt az ételt, amit kértünk (1 pont)
  • Kérésünkre talált egy képet az ételről az interneten (1 pont)
  • Megkaptuk a receptet, még kérés nélkül is (1 pont)
  • Az étel ajánlat is rendben van. Mindegyik gluténmentes. (1 pont)

Összesen 5.5 pont.
Az eredmény kissé hullámzó, és sokszor kell a programot noszogatni. De valós helyzetben használni tudjuk, segít az étel választásban.

Bár sajnos maga az egész technológia túlságosan lassú. Sokat segít, ha meghatározzuk, milyen típusú ételeket kedvelünk.

Vásárlás

Amikor idegen helyen vagyunk dolgok vesznek körül minket. Az üzletben sorban állnak a furcsábbnál furcsább dolgok, és csak arra várnak, hogy valaki hazavigye őket.

Azt viszont nem szeretnénk, hogy otthon derüljön ki, hogy fogalmunk sincs, mit vettünk és minek. Egyáltalán mit kellene vele csinálni? Fogom én ezt szeretni? Ezt tényleg meg kell enni?

A mesterséges intelligencia nekünk segít, hogy ezek a fontos kérdések még a boltban derüljenek ki.

Az utasítás ezúttal roppant egyszerű:

 Ez micsoda, és mit lehet vele csinálni?

A képet direkt úgy fotóztuk, hogy a felírat jól olvasható legyen. Minél több információt adunk az MI-nek, annál jobb eredményt kapunk.

ChatGPT

A ChatGPT leírása az UFO-sajtról
A ChatGPT leírása az UFO-sajtról

A ChatGPT adott néhány alapvető információt (igen, ez sajt. igen, meg lehet enni). Majd pedig adott tippeket a használatához is.
További beszélgetés során nagyon jó kis receptekkel állt elő, hogy mire lehet ezt a sajtot használni.

Google Gemini

A Google Gemini leírása az UFO-sajtról
A Google Gemini leírása az UFO-sajtról

A Google Gemini nagyon részletesen ismertette a képen lévő sajtot. Még a tápértékről is készített egy listát, ami nagyon nehezen olvasható a képen. Valószínűleg inkább máshonnan kereste meg az ide vonatkozó adatokat.

A Geminivel is további beszélgetéseket folytatva nagyon jó tippeket és recepteket kaphatunk.

Bor választás

Még mindig az üzletben vagyunk. Velünk szemben egy polc tele van különféle ismeretlen borokkal. Hogyan válasszunk? A legdrágábbat vigyük? A legszebbet? A legsötétebbet? Amelyiknél a címkén egy lány van vagy amelyiken fiú?
Megannyi kérdés, de egyik sem segít a választásban.

Inkább küldjük el a képet a mesterséges intelligenciának!

ChatGPT

ChatGPT borok listája rövid ismertetővel
ChatGPT borok listája rövid ismertetővel

A ChatGPT-t direkt megkértük, hogy egy rövid ismertetőt is írjon. Fontos, hogy a GPT-4o modellt használtuk, mert a többi esetleg rövidebb leírást ad, vagy nem lesz teljes a lista.

Összesen 19 borról kaptunk rövid leírást (a kép alsó sorában lévőket már nem tudta értelmezni). Ennyi információ már biztosan segít a választásban.

De megkérhetjük a ChatGPT-t is, hogy ő javasoljon egy bort nekünk, vagy a barátunknak. Természetesen adjunk minél több információt, hogy milyen italt szeretnénk!

A ChatGPT bor ajánlata
A ChatGPT bor ajánlata

Google Gemini

A Google Gemini bor listája
A Google Gemini bor listája

A Google külön kérés nélkül is nagyon érdekes információkat adott a különböző borfajtákról. Igaz, nem mindegyikről, a képen láthatóaknak csak a felét írta le.
Viszont már ezek között is találhatunk olyat, ami szimpatikus lehet.

Persze most is megkérhetjük a programot, hogy ő maga válasszon inkább. Ne felejtsük! Minél pontosabban adjuk meg, mit szeretnénk, annál jobb eredményt kapunk!

A Google Gemini bor ajánlata
A Google Gemini bor ajánlata

Összefoglalás

Az előző évhez képest nagyon sokat javult mind a ChatGPT, mind a Google Gemini. Különösen a Gemini esetében jött jól, hogy összekötötték a már meglévő adatbázissal.

Úgy tűnik, nyelvi modell és az adatok értelmezésében inkább a ChatGPT jár előbbre. De ez lehet azért is, mert a tesztben a ChatGPT esetében az előfizetős verziót használtuk, míg a Google Gemini-nél az ingyenest. Ezen kívül naponta jönnek ki az újabb és okosabb modellek.

A nyaralás előkészítésében mindkét program óriási segítséget nyújt. Mind a tervezésben, mind a helyszínen. Ráadásul nem kell egyik vagy másik között választani, mert mindkettőt lehet egyszerre használni.

A kapott eredményeket viszont minden esetben ellenőrizzük!

CustomGPT

A ChatGPT extrája, hogy összeszámolhatatlanul sok CustomGPT készült. Találunk olyanokat, amik az utazás előkészítésében segítenek, vagy a hotel keresésében, az éttermekben, a látnivalókban, stb.
Találunk kifejezetten az adott várossal kapcsolatos CustomGPT-ket is.
Érdemes velük is kísérletezni.

Budapesttel kapcsolatos CustomGPT-k
Budapesttel kapcsolatos CustomGPT-k

PixelRita

Loading

Régi térképek újrarajzolás – Stable Diffusion + ControlNet

SD térkép
Becsült olvasási idő 5 perc.

Régi térképek, kézzel rajzolt térképek vagy AutoCAD-ben készült térképek. Mindegyik egy stilizált változata a valóságnak. De mi lenne, ha a mesterséges intelligenciával ezekből a rajzokat valósághű képekké alakítanánk?

A régi térképek újraszámolása még várat magára. De bizonyára a közeljövőben a térképészetben is megjelenik a mesterséges intelligencia.
Mi egyenlőre maradunk az újrarajzoláshoz. Ehhez most is a Stable Diffusion szöveg-alapú MI-rajzoló programot használjuk. Az eredeti vonalat megtartásához pedig a ControlNet kiegészítőt.

Ez a 20. század eleji Isztambul térkép lesz a kiindulási képünk. Forrás: Jacques Pervititch - 1934
Ez a 20. század eleji Isztambul térkép lesz a kiindulási képünk. Forrás: Jacques Pervititch – 1934

A text2img fülön kapcsoljuk be a ControlNet kiegészítőt. Majd Preprocessor-nak válasszuk a Lineart-ot.
A Model lehet Canny vagy Lineart.

Utasításoknak (prompt) én a „top view of a city”-t választottam. Még jól működik az „aerial city view” vagy a „Drone Photography” is. Használhatjuk a „satellite view” parancsot is amennyiben nagyobb városrészt szeretnénk készíteni.
Negatív prompt pedig „text, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, morbid, mutation, deformed, blurry”

A képgeneráláshoz használt modell kiválasztása már nehezebb. Sajnos kevés olyan modell van, ahol a házak és utcák felülről látszódnak. Én a Realistic Vision-t választottam, ami egészen jól rajzol élethű házakat és parkokat is. További ajánlott modellek itt találhatóak.

A forrásképet a ControlNet kisablakba illesztjük be. Ne feledjük a generált kép arányait az eredeti képhez igazítani!
És már kezdődhet is a képgenerálás!

Az én képem esetében a program megpróbálta az összes feliratot, szöveget, utcanevet és házszámot is értelmezni. Ez kicsit összezavarta. Tehát érdemes a képről előtte eltávolítani a felesleges elemeket.

Egy másik példában egy olyan kézzel rajzolt várostérképet használtam, amelyik mentes a feliratoktól (a képet a Pinteresten találtam forrás nélkül)

Egy kézzel rajzolt fantázia térkép lesz a kiindulási képünk.
Egy kézzel rajzolt fantázia térkép lesz a kiindulási képünk.

A beállítások hasonlóak az előzőhöz. De itt kísérletképpen egy térképészeti modellt használtam.

Ha nem ragaszkodunk a valósághű képekhez, akkor találunk néhány térkép modelleket is. Mellé használhatunk LoRA modelleket is. Ebből is találunk olyanokat, amelyek a térkép rajzolásban segítenek.

A kézzel rajzolt kép MI átalakítás után
A kézzel rajzolt kép MI átalakítás után

Következő projektben egy madártávlati Róma rajzot használtam.

16. századi rajz Róma városáról. Forrás: Speculum Romanae Magnificentiae
16. századi rajz Róma városáról. Forrás: Speculum Romanae Magnificentiae

A beállítások hasonlóak, de különböző modellekkel és LoRA-kkal kísérleteztem. Az egyik eredményt megmutatom. Itt is megfigyelhetjük, hogy a program megpróbálta az írott szöveget is a kép részeként értelmezni. Így pl. a tóra hajókat rajzolt.

Az újrarajzolt kép Rómáról
Az újrarajzolt kép Rómáról

A Stable Diffusion programnak nagyon sok finomhangoló beállítása van. Mellette a számtalan modell, Lora és szinte végtelen számú utasítás (prompt) is használható. Éppen ezért nagyon sokféle eredményt kaphatunk. Érdemes kísérletezni vele!

PixelRita, mit gondolsz a régi térképek újra rajzolásáról?

Loading

A Photoshop Generative Fill varázslata: Térképek digitális restaurálása

Adobe Photoshop MI térkékiegészítés
Becsült olvasási idő 5 perc.

Rengeteg olyan munkám van, amikor régi térképeket vagy légi felvételeket kell összeillesztenem. A térképe, vagy képek több lapból állnak, amiket egy nagy képpé rakok össze. A kép túlságosan összetett, hogy az automatikus program csinálja ezt a feladatot. Ez még mindig emberi művelet.

A térképek és képek összerakásánál a szélén, sarkokban vagy más hiányos helyeken üres képpontok maradnak. Mindig kérdés, hogy ezekkel mi legyen. Egyszerűen nem néz ki jól a kép, ha ott van egy luk, vagy a széle fűrészfogas.

Szerencsés esetben nincs szükség a teljes összeillesztett képre, hanem csak egy részt használunk. Még nagyobb szerencse esetén ezt ki is lehet úgy vágni, hogy nem marad üres hely.

Ha viszont nincs szerencsénk, akkor valamit tenni kell a lukakkal!

  • Legjobban az néz ki, ha fekete színnel töltjük fel. Ez eléggé egyértelmű: az a rész hiányzik, nincs ott. De összhangban még mindig jól mutat.
  • Ha fehéren hagyjuk, akkor az nyomtatási szempontból ideális. Miért pazaroljuk a festéket olyasmire, ahol valójában nincsen semmi. Csak ez nem néz ki jól!
  • Köztes lehetőség pedig, hogy a térkép alapszínével töltjük ki. Ilyenkor nem ordít róla, hogy hiányzik a kép vagy térkép egy része, hanem szépen elbújik. De nem is használunk annyi festéket feleslegesen, mintha fekete lenne az egész (de attól még igen, információt nem tartalmazó területeket miatt mázolgatunk)

És most lett egy negyedik lehetőség is!

Az Adobe Photoshop programba megjelent a Generative Fill funkció. Ez egy olyan modul, ami a kijelölt területre fog rajzolni. Mégpedig a mesterséges intelligenciával azt rajzolja, amit kérünk. Például egy macskát az út közepére.

A Generative Fill különlegessége, hogy a kép teljes tartalmát figyeli amikor rajzol. Ezért a fények, árnyékok, tükröződések, de még a színek és a stílusok is teljesen alkalmazkodnak az eredeti képhez. Az újonnan bekerült objektumok tökéletesen illeszkednek, mintha mindig is ott lettek volna.

A Generative Fill másik különlegesség az, hogyha a mesterséges intelligenciának nem adunk semmilyen utasítást, akkor radír módban működik. Vagyis a kijelölt területet kitölti a kép többi részének tartalma alapján. Például ha fűben egy macska van, az MI fűszálakat fog rajzolni az állat helyére. Nem pedig egy üres luk marad utána.

Adobe Photoshop Generative Fill
Adobe Photoshop Generative Fill

Kíváncsi voltam, hogyan működik egy az eszköz egy térképen. Vajon hogyan tudja a lukakat elfedni? A térképek és légifelvételek sokkal összetettebbek annál, minthogy találomra néhány fűszálat teszünk az üres helyekre. Nem lehetnek az utcák össze-vissza, nem lehetnek a házak egymáson.

Kijelöltem a térkép lukas területét, és elindítottam az Adobe Photoshop Generative Fill eszközét. Az eredmény minden várakozásomat felülmúlta!

Az eredeti "lukas" térkép (balra), és a Photoshop MI által kitöltött terület.
Az eredeti „lukas” térkép (balra), és a Photoshop MI által kitöltött terület.

Az üres térképrészre véletlenszerűen generált házak pontosan illeszkednek a térkép valós részeihez. Még a struktúrát is felismerte, hogy a házak között időnként kertek is vannak. Megpróbálta még a házak számozását is felírni, de pixeles szöveg generálás még nehezen megy a mesterséges intelligenciás rajzoló programoknak. Ha távolról nézzük, akkor már nem feltűnő.

Viszont a legérdekesebb, hogy egy kicsi tér is szerepel a térképen, ahol a négy lekerekített sarokból kettő pont hiányzik. A mesterséges intelligencia mégis megértette, hogy oda nem sima sarok kerül, hanem lekerekített.

Alább berakok egy nagyobb térképrészletet is. Ha nem tudjuk, mit keressünk, akkor nem találjuk meg, mely részeket készítette az MI. Minden tökéletesen illeszkedik. Az utcák egyenesek, a házak mérete és alakja a megszokott, stb…
Persze van egy kis minőségi különbség, de ezt tudjuk be annak, hogy még a technika nagyon korai változatánál járunk.

Az Adobe Photoshop Generative Fill eszközzel "megszerelt" térkép
Az Adobe Photoshop Generative Fill eszközzel „megszerelt” térkép

Természetesen mindez most csak játék a technikával, egy próba. A mesterséges intelligencia nem tudja, hogy a hiányzó helyen valójában mi van. A kép többi részéből kalkulálja össze a képpontokat, amivel a lukakat kitölti.
Az így készült térkép nem lesz valódi!
Az MI által generált házak és utcák a valóságban nincsenek ott! Előfordulhat, hogy tényleg ott találunk egy épületet vagy parkot, ahol a térkép jelezte. De erre inkább ne számítsunk!
Ezt a funkciót csak mint látványos grafika lehet használni. Tényleges térképészetre nem!

PixelRita, te mit gondolsz erről a funkcióról? Te mire használnád? Mik a lehetőségek és a veszélyei?

Loading