Melyik dinnyét válasszuk?

Becsült olvasási idő 5 perc.

A városi dzsungelben

Városi emberként egyik gyakori gondunk lehet, hogy túlságosan eltávolodtunk a természettől. Ami nagyanyáinknak természetes és könnyű volt, az városiként akár megoldhatatlan akadályként tornyosulhat előttünk.
Ilyen lehet az, amikor friss zöldséget, vagy gyümölcsöt szeretnénk venni. A legjobbat szeretnénk kiválasztani. Na de ki tudja, hogy melyik a legjobb?

Talán a mesterséges intelligencia (MI) ebben segíteni tud!

Melyik a legjobb dinnye?

2024. nyarán a három legismertebb MI-Chat program (ChatGPT, Google Gemini, Anthropic Claude) már képes a feltöltött képet elemezni, és tippeket adni.

Persze mindez még csak egy kép! A dinnye vizuális megjelenését olyan apróságok is erősen befolyásolhatják, mint a megvilágítás vagy a telefon kamerájának állapota és tisztasága. Az MI nem fogja tudni a dinnyét megfogni, megforgatni, megkopogtatni stb.
Tehát csak abból az információból tud dolgozni, amit mi adunk neki. De így is óriási segítség lehet.

Csoportkép a dinnyékről

A kísérlethez bementünk a legközelebbi dinnye lelőhelyre, majd egy óvatlan pillanatban lefényképeztük, amint csoportosan egymáson tornyosulnak.

A képen senki sem mosolygott, de legalább senkinek sem állt égnek a haja!

Dinnyék csoportulása
Dinnyék csoportulása

A kérdés

A kérdésekkel nem akartunk mindenféle hosszú utakat bejárni kezdve Dinnye Ádámtól és Dinnye Évától. Direkt rákérdeztünk, melyiket érdemes megvenni.

Íme az utasítás (prompt):

A képen látható dinnyék közül melyiket válasszam? 

Claude 3.5 Sonnet

A Claude 3.5-ös modellje nagyon fejlett. Nagyon jó a képfelismerő programja. E mellett az Anthropic híres arról az elkötelezettségtől, hogy a válaszai semmiképpen se ártsanak az embereknek.

A Claude tanácsai a dinnye választásához
A Claude tanácsai a dinnye választásához

A Claude nagyon jól leírja, hogy milyen tulajdonságok alapján válasszunk dinnyét, de nem mondja meg, hogy a képen melyiket válasszuk. A többi nyelvi modellnél is előfordul, hogy első kérdésre inkább általános választ kapunk.
Ezért direkt megkérdezzük, hogy melyiket javasolja.

A Claude inkább elkerüli a választással járó felelősséget
A Claude inkább elkerüli a választással járó felelősséget

A Claude nyelvi modellel nincs könnyű dolgunk. Mindjárt 4 okot is felsorol, amiért nem javasol egy konkrét dinnye vásárlását egyetlen kép alapján:

  • Kép alapján nem lehet dinnyét választani. Azt meg kell fogni, tapintani, kopogtatni, stb…
  • A képen nem látszik a teljes dinnye.
  • A kép nem mutatja a dinnye súlyát, ami szintén fontos információt adna.
  • Ha az ő tanácsára választunk dinnyét, és a nem lenne jó, akkor esetleg szomorúak lennénk. Az pedig nem lenne jó.

Google Gemini (2024.07.15-ös verzió)

A Google a mesterséges intelligencia népszerű megjelenése előtt is régóta dolgozott azon, hogy a program minél jobban értelmezze a kép tartalmát (gondoljunk a képkeresőre). Így reménykedhetünk abban, hogy megfelelő elemzést kapunk.

A Google Gemini dinnye választása
A Google Gemini dinnye választása

A Google Gemini azt javasolja, hogy a bal oldalit válasszuk. Esetleg a középsőt, bár az nem tűnik annyira érettnek. Végül pedig a jobb oldalit nem javasolja, mert szerinte az éretlen.

Majd pedig kapunk néhány tippet, miképpen is válasszunk dinnyét.

ChatGPT 4o

2024. májusában jelent meg a GPT-4o. Az O az omni rövidítése, ami a modell multimodális képességére utal. A GPT-4o képes különböző típusú adatokat kezelni, beleértve a szöveget, audio-, kép– és videó tartalmakat is.
Ráadásul a GPT-4o verziót azok is használhatják, akiknek nincs ChatGPT előfizetésük. Igaz, a lehetőségek korlátozottabbak, de dinnye szakértőnek használhatjuk.

A ChatGPT dinnye választása
A ChatGPT dinnye választása

A ChatGPT először tippeketad, miképpen érdemes dinnyét választani. Utalva ezzel arra, hogy inkább a fejünket használjuk, ne egy programot.
Majd pedig azt javasolja, hogy a bal oldalon a középső, vagy a jobb oldalon a középső feletti dinnye a megfelelő választás.

CustomGPT

Természetesen az internet népe mindenre készített CustomGPT-t. Így találunk néhány dinnye választó programot is. Én egy angol (link) és egy török (link) nyelvűt találtam. Bármikor jelenhetnek meg újak, a nyár még nem ért véget!
Kérjük meg a GPT-t, hogy a választ magyarul írja!

A Karpuz CustomGPT választása
A Karpuz CustomGPT választása

A Karpuz GPT a jobb felső sarokhoz közeli dinnyét javasolja. Megjegyzi, hogy több fénykép pontosabb analízist eredményezne. Mellette pedig kapunk tippeket a dinnye vásárlásához.

Összegzés

Az elmúlt másfél évben – mióta a nyelvi modellek kiléptek a rivaldafénybe – rengeteget fejlődött a képek értelmezése és analizálása. Várhatóan rövid időn belül még pontosabb eredményeket kaphatunk.

A fenti példa inkább egy bemutató, egy játék, hogy a nyelvi modellek a mindennapi kihívásokban segíthetnek, ha fényképet mutatunk a problémáról.
Legyen az akár egy könyv keresése a polcon, egy árú keresése a boltban, termékösszetevők elemzése, árak összehasonlítása, növény azonosítása, segítség alkatrészekhez, probléma megoldása fénykép alapján, földrajzi tájékozódás, stb…
Gondoljunk rá úgy, mint egy társra, akihez kérdésekkel fordulhatunk!

Természetesen, mint a hasonló esetekben, a nyelvi modellek nem tévedhetetlenek. Sőt! Előfordulhat, hogy a képet rosszul értelmezi, így hibás alapokról indul, rossz következtetésekre jut.
A válaszokat mindig mérlegeljük, és inkább a saját belátásunk szerint döntsünk.

PixelRita

Te mit gondolsz erről?

Loading