Google Gemini

Becsült olvasási idő 7 perc.

A Google Mesterséges Intelligencia Alapú Asszisztense

A Google Bard egy mesterséges intelligencia által vezérelt chatbot, ami a Google LaMDA (Language Model for Dialogue Applications) technológiáját használja.

2024. februárjában megjelent a Google Gemini, ami a Bard továbbfejlesztett változata.

A Google MI fejlesztése

Kedves Bard! Írj egy rövid történelmi áttekintést a Google mesterséges intelligencia fejlődéséről!

A Google Bard és Gemini egy nyelvi modell. Értelmezi a feltett szöveges kérdéseket, és válaszolni tud rájuk. Nyelveket fordít és különböző kreatív tartalmakat is tud írni. Megadhatjuk, hogy milyen stílusban és mit írjon. Ez lehet akár egy üzleti levél, egy vers, egy mese gyerekeknek, és még sok más.

A Google Bard és Gemini éppen ezért rengeteg feladatban lehet a segítségünkre. Olyan, mint egy virtuális asszisztens.

De vegyük figyelembe, hogy még a technológia elején járunk. Előfordulhat, hogy a program hibás választ fog adni, de azt nagyon meggyőzően!

A bal oldalon a Wikipédia látható, jobb oldalon a Google Bard válasza
A bal oldalon a Wikipédia látható, jobb oldalon a Google Bard válasza (2023 év vége)

Ezen a területen a Google Gemini sokat fejlődött. Folyamatosan frissítik az adatbázisát az internetről, és pontosabb válaszokat ad.

Google Gemini
A Google Gemini válasza (2024. február)

Ingyenes

A Google Bard talán legnagyobb előnye a többi nyelvi modellel szemben, hogy a használata teljesen ingyenes. Elegendő egy Google fiók, és https://bard.google.com címen máris elkezdhetjük használni.

A Google Gemini is ingyenes. De előfizetve megkapjuk a Google Gemini Advanced-et, ami nagyobb kapacitású és több funkcióval rendelkezik.

Kint van az interneten

A nyelvi modellek – mint amilyen a Google Bard is – egy nagy adathalmazból tanulnak, amely nem egy egyszerű adatbázis, hanem bonyolult és összetett szöveges információk gyűjteménye. Ne képzeljük el ezeket mint egyszerű Excel táblázatokat; a modellek ‘beszélgetési képességei’ ezen adathalmazokban található tudásból épülnek fel. A modell ‘tréningje’, vagyis a tanulási folyamata hosszú időt vesz igénybe, és jelentős számítási erőforrást igényel, nem olyasmi, amit gyakran és könnyedén megismételnénk. Emiatt a modellek tudása nem mindig teljesen naprakész, mert nem frissülnek folyamatosan a legújabb információkkal.

A Google Bard és Gemini azonban kiemelkedik ezen a téren, mert képes a Google keresőrendszeréhez csatlakozni, így hozzáfér a legfrissebb információkhoz és adatokhoz. Ez azt jelenti, hogy képes tájékozott válaszokat adni akár a legújabb hírekkel vagy trendekkel kapcsolatban is. Tehát, míg a hagyományos nyelvi modellek korlátozottak a tanulási adathalmazukban, a Bard és a Gemini frissített információkat tud felhasználni, így dinamikusabb és naprakészebb válaszokat tud adni.

Google Bard, Gemini és Gemini Ultra

A Google nyelvi modelljei közül 2024 februárjában három darabot érhetünk el: Bard, Gemini és az előfizetős Gemini Ultra. A programok közötti különbséget az alábbi táblázat mutatja (A táblázatot a Google Gemini készítette)

FunkcióGoogle BardGeminiGemini Ultra
Kiadási dátum2022. január2023. november2024. február
Modell típusaGeneratív nyelvi modell (LLM)Generatív nyelvi modell (LLM)Generatív nyelvi modell (LLM)
Paraméterek száma137B540B1.5T
AdatkészletSzöveg és kódSzöveg, kód, képek, hangSzöveg, kód, képek, hang, videó
Főbb képességekSzöveg generálás, fordítás, írás, kódolásSzöveg generálás, fordítás, írás, kódolás, kreatív tartalom írásSzöveg generálás, fordítás, írás, kódolás, kreatív tartalom írás, komplex feladatok elvégzése
ElőnyökJól használható egyszerűbb feladatokhozSokoldalúbb, mint a BardA legfejlettebb modell, komplex feladatok elvégzésére is alkalmas
HátrányokKorlátozott képességek komplex feladatok elvégzésébenKevésbé fejlett, mint a Gemini UltraKorai fejlesztési fázisban van, nem minden funkciója tökéletes
ElérhetőségIngyenesIngyenesElőfizetéses
A Google Bard, Gemini és Gemini Ultra összehasonlító táblázata. Forrás: Google Gemini

Funkciók

A Google Bard és Gemini elsősorban a kérdéseinkre válaszol. De e mellett számtalan más feladatot is adhatunk neki. (Sok funkció még kísérleti fázisban van, az eredményeket ellenőrizni kell! – 2023. vége)

A Google Bard, Gemini és Gemini Ultra funkciói

Szöveg generálás, kreatív írás

A Bard és Gemin képes különböző kreatív szövegformátumokat generálni, például verseket, kódot, forgatókönyveket, zenei darabokat, e-maileket, leveleket stb.

Nyelvi fordítás

A Bard és Gemin képes szöveget fordítani több mint 100 nyelv között.

Tények összefoglalása

A Bard képes összefoglalni a különböző témákhoz kapcsolódó tényeket.

Tanulás és Oktatás Támogatása

Segíthet a tanulmányokban, magyarázatokat és részletes válaszokat adhat különböző tudományos, matematikai, vagy akár irodalmi kérdésekre.

Matematikai feladatok megoldása

Komplexebb számítások és problémamegoldások is a repertoárjába tartozhatnak, segítve azokat, akik matematikai vagy logikai feladatokkal küzdenek.

Képelemzés

A Google több programmal is rendelkezik, amelyik valamilyen formában értelmezni tudja a képek tartalmát. Ezek bekerültek a Bardba is. Így a feltöltött képekkel kapcsolatban is kérdezhetünk:

  • Elmondja a kép tartalmát
  • Megoldja a matematikai feladatot (egyelőre változó eredménnyel)
  • Lefordítja a képen található szöveget. Ebben egészen jó!
A Google Bard sikeresen értelmezett és fordított le egy 19. századi oszmán térképet
A Google Bard sikeresen értelmezett és fordított le egy 19. századi oszmán térképet

A Google Gemini és Gemini Ultra funkciói

Kreatív tartalom írás:

  • A Gemini képes forgatókönyveket, zeneszámokat, verseket, e-maileket, leveleket, blogbejegyzéseket és marketinganyagokat írni.
  • Képes különböző stílusokban írni, és a tartalmat a célközönséghez igazítani.

Képalkotás:

  • A Gemini képes szövegből képeket generálni.

Kódolás:

  • A Gemini képes kódot írni és hibakeresést végezni.
  • Különböző programozási nyelveket ismer, mint a Python, Java és C++.

Kérdések megválaszolása:

  • A Gemini képes nyílt végű, összetett és kihívást jelentő kérdésekre is válaszolni.
  • A válaszokat a forrásokkal együtt adja meg.

Fordítás:

  • A Gemini több nyelvet is tud fordítani, mint a Bard.
  • A fordítást a kontextushoz igazítja.

A Google Gemini Ultra speciális funkciói

Komplex feladatok elvégzése:

  • A Gemini Ultra képes komplexebb feladatokat elvégezni, mint a Gemini.
  • Például képes üzleti terveket írni, kutatási anyagokat összegyűjteni, és marketingkampányokat kidolgozni.

Videó tartalom generálás:

  • A Gemini Ultra képes szövegből videókat generálni.

Továbbfejlesztett képalkotás:

  • A Gemini Ultra képes realisztikusabb és részletesebb képeket generálni, mint a Gemini.

Nagyobb paraméterszám:

  • A Gemini Ultrának nagyobb paraméterszáma van, mint a Gemininek, ami lehetővé teszi számára a komplexebb feladatok elvégzését.

Együttműködés a többi Google programokkal

A Google Gemini összekapcsolható a többi Google szolgáltatással is (2023. év végén csak akkor, ha a fiókunk nyelve angolra van állítva). Ez nagyon izgalmas lehetőséget nyújt, hiszen a Gmail 2004, a Google Docs & Spreadsheets pedig 2006-óta velünk és, és sokaknak renget adata gyűjt ott össze. De nemcsak kereshetünk a régi levelekben, hanem azok tartalmát összegezhetjük, vagy akár megkérhetjük az MI-t, hogy válaszoljon rájuk.

Kereshetünk repülőjegyeket is a Google Flights-on keresztül. Nem kell átnézni több uticélt, kipróbálni több foglalást, mert az MI megkeresi a legjobbat.
És ha megtaláltuk, akkor tovább kérhetjük az MI-t, hogy egy nekünk tetsző hotelt is keressen.

A Google Maps kapcsolattal nemcsak azt kérdezhetjük, hogy hol van fagylajtozó a közelben, hanem konkrétan pisztáciás fagyit melyik helyen árulnak. Vagy még ennél is összetettebb kérdést is kérdezhetünk.

Kereshetünk a Youtube-on is a Google Gemini-vel. Kérhetünk olyan videót, ami egy konkrét problémát segít megoldani. Vagy recepteket, vagy ötleteket, film előzetesek, zenéket, ami csak eszünkbe jut!

A Google Gemini és Ultra további összekapcsolódásai várhatóak, pl. levelet ír, dokumentumot készít, stb…

A Gemini beszélgető felületén a @-ot beírva megjelenik egy menü, ahol kiválaszthatjuk, melyik Google szolgáltatással szeretnénk beszélgetni.

További Google MI fejlesztések

Hé Bard! Milyen mesterséges intelligencia fejlesztések zajlanak a Google házában?

A Google AI számos más mesterséges intelligencia fejlesztésén dolgozik, amelyek különböző területeken alkalmazhatók. Ezek közé tartoznak a következők:

Mesterséges látás:
A mesterséges látás olyan technológiák gyűjteménye, amelyek lehetővé teszik a számítógépek számára, hogy a vizuális információkat értelmezzék. A Google AI számos mesterséges látás alkalmazást fejleszt, beleértve a következőket:
A Google Lens, amely lehetővé teszi a felhasználók számára, hogy információkat gyűjtsenek a környezetükről a telefonjuk kamerájával.
A Google Street View, amely lehetővé teszi a felhasználók számára, hogy virtuálisan bejárják a világ különböző helyeit.
A Google AI fordítója, amely képes szöveget fordítani több nyelv között.

Mesterséges beszéd:
A mesterséges beszéd olyan technológiák gyűjteménye, amelyek lehetővé teszik a számítógépek számára, hogy a beszédet értelmezzék és generálják. A Google AI számos mesterséges beszéd alkalmazást fejleszt, beleértve a következőket:
A Google Asszisztens, amely lehetővé teszi a felhasználók számára, hogy hangutasításokkal irányítsák a telefonjukat és más eszközeiket.
A Google Translate, amely lehetővé teszi a felhasználók számára, hogy hangon keresztül beszéljenek egymással különböző nyelveken.
A Google AI hangalapú szöveggenerátora, amely képes emberi minőségű szöveget generálni hangon keresztül.

Mesterséges intelligencia a játékokban:
A Google AI számos mesterséges intelligencia játékot fejleszt, amelyek kihívást jelentenek és szórakoztatóak a felhasználók számára. Ezek közé tartoznak a következők:
A DeepMind AlphaGo, amely 2016-ban legyőzte a világbajnokot a go játékban.
A DeepMind AlphaStar, amely 2018-ban legyőzte a világbajnokot a StarCraft II játékban.
A Google AI által fejlesztett több játék, például a Pokémon Go és a Wordle.

Mesterséges intelligencia az egészségügyben:
A Google AI számos mesterséges intelligencia alkalmazást fejleszt az egészségügy területén. Ezek közé tartoznak a következők:
A Google AI által fejlesztett orvosi képalkotó algoritmusok, amelyek képesek a betegségeket korábban felismerni, mint a hagyományos módszerek.
A Google AI által fejlesztett gyógyszerkutatási algoritmusok, amelyek segítenek a hatékonyabb gyógyszerek kifejlesztésében.
A Google AI által fejlesztett egészségügyi asszisztensek, amelyek segítenek az embereknek az egészségügyi problémák kezelésében.

Mesterséges intelligencia az oktatásban:
A Google AI számos mesterséges intelligencia alkalmazást fejleszt az oktatás területén. Ezek közé tartoznak a következők:
A Google AI által fejlesztett személyre szabott tanulási algoritmusok, amelyek segítenek a tanulóknak a saját tempójukban és érdeklődési körük szerint tanulni.
A Google AI által fejlesztett oktatási segédeszközök, amelyek segítenek a tanulóknak a különböző tantárgyak megértésében.
A Google AI által fejlesztett virtuális valóság és kiterjesztett valóság alkalmazások, amelyek újszerű módokat kínálnak az oktatásra.

A Google AI számos más mesterséges intelligencia fejlesztésén is dolgozik, amelyek még nem nyilvánosak. A Google AI célja, hogy a mesterséges intelligenciát olyan módon használja, amely előnyös az emberek számára.

PixelRita

PixelRita, mit gondolsz? Barátkoznál a Google Barddal?


Google Geminivel kapcsolatos bejegyzések

  • Zene a Suno AI-val

    Zene a Suno AI-val

    Becsült olvasási idő 16 perc. A Suno AI néhány beírt parancs alapján készíti a zenét. Most pedig már magyar nyelvű dalszöveget is adhatunk a programnak! Vegyük elő a nyelvi modelleket, a ChatGPT-t, a Geminit és a Claude-t, hogy írják meg dalszöveget!


  • Melyik dinnyét válasszuk?

    Melyik dinnyét válasszuk?

    Becsült olvasási idő 5 perc. A nyelvi modellek rengeteget fejlődtek. A feltöltött képeket nagyon jól tudják elemezni. Így a mindennapokban sok helyen segíthetnek nekünk. Akár még egy dinnye választásában is.


  • Készülődés a nyárra a ChatGPT-vel és a Geminivel

    Készülődés a nyárra a ChatGPT-vel és a Geminivel

    Becsült olvasási idő 18 perc. Az OpenAI ChatGPT és a Google Gemini rengeteg segítséget nyújt egy utazás előkészítésében. Segíthet a múzeumok keresésében, a belépőjegyek útvesztőjében, de még egy ajándék bor kiválasztásában is.


Loading

No votes yet.
Please wait...

“Google Gemini” bejegyzéshez 4 hozzászólás

  1. Már egy ideje rendszeresen használom a Bardot és most a Geminit, de nem kutattam utána a történetének és a fejlódésének. Jó volt olvasni, köszi!

    No votes yet.
    Please wait...
    Válasz
    • Köszi, és üdv a blogon! 🙂

      No votes yet.
      Please wait...
      Válasz
  2. És a cikk alapján kipróbáltam, a képalkotási funkcióját. Ezt írta ki:
    „Még nem tudok képeket létrehozni, ezért ebben nem tudok segíteni.”
    Csak szólok 🙂

    No votes yet.
    Please wait...
    Válasz
    • Köszi a visszajelzést! 🙂
      Sajnos a Google táján nagyon ingadozóak az újdonságok. Ez a leírás a Google hivatalos oldala alapján készült. És mivel a funkciók bármelyik pillanatban aktiválódhatnak (talán éppen most!), nem tudom leírni, mi az, ami éppen működik, és mi nem. Sajnos ennek a fordítottja is sokszor előfordult: egy funkciót bejelentettek, aktiváltak, majd csendesen eltűnt.
      Ez most egy kísérleti terep, és sajnos el kell fogadnunk, hogy ilyen.

      No votes yet.
      Please wait...
      Válasz

Szólj hozzá!