A Google Mesterséges Intelligencia Alapú Asszisztense
A Google Bard egy mesterséges intelligencia által vezérelt chatbot, ami a Google LaMDA (Language Model for Dialogue Applications) technológiáját használja.
2024. februárjában megjelent a Google Gemini, ami a Bard továbbfejlesztett változata.
A Google MI fejlesztése
Kedves Bard! Írj egy rövid történelmi áttekintést a Google mesterséges intelligencia fejlődéséről!
A Google mesterséges intelligencia (AI) kutatása a cég alapítása óta zajlik. Az első jelentős lépés 2014-ben történt, amikor a Google megvásárolta a DeepMind nevű brit AI-kutatási céget. A DeepMind számos jelentős eredményt ért el az AI területén, köztük az AlphaGo-t, amely 2016-ban legyőzte a világbajnokot a go játékban.
A Google AI további jelentős eredményei közé tartozik a RankBrain, egy gépi tanulási algoritmus, amely javítja a keresési eredmények relevanciáját, a nyelvi modellek, például a LaMDA, amelyek képesek emberi minőségű szöveget generálni, és a mesterséges látás, például a Google Lens, amely lehetővé teszi a felhasználók számára, hogy információkat gyűjtsenek a környezetükről.
A Google AI kutatása számos területen folytatódik, beleértve a mesterséges intelligencia biztonságát, a mesterséges intelligencia alkalmazásait az egészségügyben és az oktatásban, valamint az AI etikai kérdéseit.
A Google AI legfontosabb mérföldkövei:
2014: A Google megvásárolja a DeepMindet
2016: Az AlphaGo legyőzi a világbajnokot a go játékban
2018: A Google bemutatja a LaMDA nyelvi modellt
2019: A Google bemutatja a Google Lens mesterséges látás alkalmazást
A Google AI kutatása jelenlegi fókuszai:
Mesterséges intelligencia biztonsága
Mesterséges intelligencia alkalmazásai az egészségügyben és az oktatásban
AI etikai kérdések
A Google Bard és Gemini egy nyelvi modell. Értelmezi a feltett szöveges kérdéseket, és válaszolni tud rájuk. Nyelveket fordít és különböző kreatív tartalmakat is tud írni. Megadhatjuk, hogy milyen stílusban és mit írjon. Ez lehet akár egy üzleti levél, egy vers, egy mese gyerekeknek, és még sok más.
A Google Bard és Gemini éppen ezért rengeteg feladatban lehet a segítségünkre. Olyan, mint egy virtuális asszisztens.
De vegyük figyelembe, hogy még a technológia elején járunk. Előfordulhat, hogy a program hibás választ fog adni, de azt nagyon meggyőzően!
Ezen a területen a Google Gemini sokat fejlődött. Folyamatosan frissítik az adatbázisát az internetről, és pontosabb válaszokat ad.
Ingyenes
A Google Bard talán legnagyobb előnye a többi nyelvi modellel szemben, hogy a használata teljesen ingyenes. Elegendő egy Google fiók, és https://bard.google.com címen máris elkezdhetjük használni.
A Google Gemini is ingyenes. De előfizetve megkapjuk a Google Gemini Advanced-et, ami nagyobb kapacitású és több funkcióval rendelkezik.
Kint van az interneten
A nyelvi modellek – mint amilyen a Google Bard is – egy nagy adathalmazból tanulnak, amely nem egy egyszerű adatbázis, hanem bonyolult és összetett szöveges információk gyűjteménye. Ne képzeljük el ezeket mint egyszerű Excel táblázatokat; a modellek ‘beszélgetési képességei’ ezen adathalmazokban található tudásból épülnek fel. A modell ‘tréningje’, vagyis a tanulási folyamata hosszú időt vesz igénybe, és jelentős számítási erőforrást igényel, nem olyasmi, amit gyakran és könnyedén megismételnénk. Emiatt a modellek tudása nem mindig teljesen naprakész, mert nem frissülnek folyamatosan a legújabb információkkal.
A Google Bard és Gemini azonban kiemelkedik ezen a téren, mert képes a Google keresőrendszeréhez csatlakozni, így hozzáfér a legfrissebb információkhoz és adatokhoz. Ez azt jelenti, hogy képes tájékozott válaszokat adni akár a legújabb hírekkel vagy trendekkel kapcsolatban is. Tehát, míg a hagyományos nyelvi modellek korlátozottak a tanulási adathalmazukban, a Bard és a Gemini frissített információkat tud felhasználni, így dinamikusabb és naprakészebb válaszokat tud adni.
Google Bard, Gemini és Gemini Ultra
A Google nyelvi modelljei közül 2024 februárjában három darabot érhetünk el: Bard, Gemini és az előfizetős Gemini Ultra. A programok közötti különbséget az alábbi táblázat mutatja (A táblázatot a Google Gemini készítette)
Funkció | Google Bard | Gemini | Gemini Ultra |
---|---|---|---|
Kiadási dátum | 2022. január | 2023. november | 2024. február |
Modell típusa | Generatív nyelvi modell (LLM) | Generatív nyelvi modell (LLM) | Generatív nyelvi modell (LLM) |
Paraméterek száma | 137B | 540B | 1.5T |
Adatkészlet | Szöveg és kód | Szöveg, kód, képek, hang | Szöveg, kód, képek, hang, videó |
Főbb képességek | Szöveg generálás, fordítás, írás, kódolás | Szöveg generálás, fordítás, írás, kódolás, kreatív tartalom írás | Szöveg generálás, fordítás, írás, kódolás, kreatív tartalom írás, komplex feladatok elvégzése |
Előnyök | Jól használható egyszerűbb feladatokhoz | Sokoldalúbb, mint a Bard | A legfejlettebb modell, komplex feladatok elvégzésére is alkalmas |
Hátrányok | Korlátozott képességek komplex feladatok elvégzésében | Kevésbé fejlett, mint a Gemini Ultra | Korai fejlesztési fázisban van, nem minden funkciója tökéletes |
Elérhetőség | Ingyenes | Ingyenes | Előfizetéses |
Funkciók
A Google Bard és Gemini elsősorban a kérdéseinkre válaszol. De e mellett számtalan más feladatot is adhatunk neki. (Sok funkció még kísérleti fázisban van, az eredményeket ellenőrizni kell! – 2023. vége)
A Google Bard, Gemini és Gemini Ultra funkciói
Szöveg generálás, kreatív írás
A Bard és Gemin képes különböző kreatív szövegformátumokat generálni, például verseket, kódot, forgatókönyveket, zenei darabokat, e-maileket, leveleket stb.
Nyelvi fordítás
A Bard és Gemin képes szöveget fordítani több mint 100 nyelv között.
Tények összefoglalása
A Bard képes összefoglalni a különböző témákhoz kapcsolódó tényeket.
Tanulás és Oktatás Támogatása
Segíthet a tanulmányokban, magyarázatokat és részletes válaszokat adhat különböző tudományos, matematikai, vagy akár irodalmi kérdésekre.
Matematikai feladatok megoldása
Komplexebb számítások és problémamegoldások is a repertoárjába tartozhatnak, segítve azokat, akik matematikai vagy logikai feladatokkal küzdenek.
Képelemzés
A Google több programmal is rendelkezik, amelyik valamilyen formában értelmezni tudja a képek tartalmát. Ezek bekerültek a Bardba is. Így a feltöltött képekkel kapcsolatban is kérdezhetünk:
- Elmondja a kép tartalmát
- Megoldja a matematikai feladatot (egyelőre változó eredménnyel)
- Lefordítja a képen található szöveget. Ebben egészen jó!
A Google Gemini és Gemini Ultra funkciói
Kreatív tartalom írás:
- A Gemini képes forgatókönyveket, zeneszámokat, verseket, e-maileket, leveleket, blogbejegyzéseket és marketinganyagokat írni.
- Képes különböző stílusokban írni, és a tartalmat a célközönséghez igazítani.
Képalkotás:
- A Gemini képes szövegből képeket generálni.
Kódolás:
- A Gemini képes kódot írni és hibakeresést végezni.
- Különböző programozási nyelveket ismer, mint a Python, Java és C++.
Kérdések megválaszolása:
- A Gemini képes nyílt végű, összetett és kihívást jelentő kérdésekre is válaszolni.
- A válaszokat a forrásokkal együtt adja meg.
Fordítás:
- A Gemini több nyelvet is tud fordítani, mint a Bard.
- A fordítást a kontextushoz igazítja.
A Google Gemini Ultra speciális funkciói
Komplex feladatok elvégzése:
- A Gemini Ultra képes komplexebb feladatokat elvégezni, mint a Gemini.
- Például képes üzleti terveket írni, kutatási anyagokat összegyűjteni, és marketingkampányokat kidolgozni.
Videó tartalom generálás:
- A Gemini Ultra képes szövegből videókat generálni.
Továbbfejlesztett képalkotás:
- A Gemini Ultra képes realisztikusabb és részletesebb képeket generálni, mint a Gemini.
Nagyobb paraméterszám:
- A Gemini Ultrának nagyobb paraméterszáma van, mint a Gemininek, ami lehetővé teszi számára a komplexebb feladatok elvégzését.
Együttműködés a többi Google programokkal
A Google Gemini összekapcsolható a többi Google szolgáltatással is (2023. év végén csak akkor, ha a fiókunk nyelve angolra van állítva). Ez nagyon izgalmas lehetőséget nyújt, hiszen a Gmail 2004, a Google Docs & Spreadsheets pedig 2006-óta velünk és, és sokaknak renget adata gyűjt ott össze. De nemcsak kereshetünk a régi levelekben, hanem azok tartalmát összegezhetjük, vagy akár megkérhetjük az MI-t, hogy válaszoljon rájuk.
Kereshetünk repülőjegyeket is a Google Flights-on keresztül. Nem kell átnézni több uticélt, kipróbálni több foglalást, mert az MI megkeresi a legjobbat.
És ha megtaláltuk, akkor tovább kérhetjük az MI-t, hogy egy nekünk tetsző hotelt is keressen.
A Google Maps kapcsolattal nemcsak azt kérdezhetjük, hogy hol van fagylajtozó a közelben, hanem konkrétan pisztáciás fagyit melyik helyen árulnak. Vagy még ennél is összetettebb kérdést is kérdezhetünk.
Kereshetünk a Youtube-on is a Google Gemini-vel. Kérhetünk olyan videót, ami egy konkrét problémát segít megoldani. Vagy recepteket, vagy ötleteket, film előzetesek, zenéket, ami csak eszünkbe jut!
A Google Gemini és Ultra további összekapcsolódásai várhatóak, pl. levelet ír, dokumentumot készít, stb…
A Gemini beszélgető felületén a @-ot beírva megjelenik egy menü, ahol kiválaszthatjuk, melyik Google szolgáltatással szeretnénk beszélgetni.
További Google MI fejlesztések
Hé Bard! Milyen mesterséges intelligencia fejlesztések zajlanak a Google házában?
A Google AI számos más mesterséges intelligencia fejlesztésén dolgozik, amelyek különböző területeken alkalmazhatók. Ezek közé tartoznak a következők:
Mesterséges látás:
A mesterséges látás olyan technológiák gyűjteménye, amelyek lehetővé teszik a számítógépek számára, hogy a vizuális információkat értelmezzék. A Google AI számos mesterséges látás alkalmazást fejleszt, beleértve a következőket:
A Google Lens, amely lehetővé teszi a felhasználók számára, hogy információkat gyűjtsenek a környezetükről a telefonjuk kamerájával.
A Google Street View, amely lehetővé teszi a felhasználók számára, hogy virtuálisan bejárják a világ különböző helyeit.
A Google AI fordítója, amely képes szöveget fordítani több nyelv között.
Mesterséges beszéd:
A mesterséges beszéd olyan technológiák gyűjteménye, amelyek lehetővé teszik a számítógépek számára, hogy a beszédet értelmezzék és generálják. A Google AI számos mesterséges beszéd alkalmazást fejleszt, beleértve a következőket:
A Google Asszisztens, amely lehetővé teszi a felhasználók számára, hogy hangutasításokkal irányítsák a telefonjukat és más eszközeiket.
A Google Translate, amely lehetővé teszi a felhasználók számára, hogy hangon keresztül beszéljenek egymással különböző nyelveken.
A Google AI hangalapú szöveggenerátora, amely képes emberi minőségű szöveget generálni hangon keresztül.
Mesterséges intelligencia a játékokban:
A Google AI számos mesterséges intelligencia játékot fejleszt, amelyek kihívást jelentenek és szórakoztatóak a felhasználók számára. Ezek közé tartoznak a következők:
A DeepMind AlphaGo, amely 2016-ban legyőzte a világbajnokot a go játékban.
A DeepMind AlphaStar, amely 2018-ban legyőzte a világbajnokot a StarCraft II játékban.
A Google AI által fejlesztett több játék, például a Pokémon Go és a Wordle.
Mesterséges intelligencia az egészségügyben:
A Google AI számos mesterséges intelligencia alkalmazást fejleszt az egészségügy területén. Ezek közé tartoznak a következők:
A Google AI által fejlesztett orvosi képalkotó algoritmusok, amelyek képesek a betegségeket korábban felismerni, mint a hagyományos módszerek.
A Google AI által fejlesztett gyógyszerkutatási algoritmusok, amelyek segítenek a hatékonyabb gyógyszerek kifejlesztésében.
A Google AI által fejlesztett egészségügyi asszisztensek, amelyek segítenek az embereknek az egészségügyi problémák kezelésében.
Mesterséges intelligencia az oktatásban:
A Google AI számos mesterséges intelligencia alkalmazást fejleszt az oktatás területén. Ezek közé tartoznak a következők:
A Google AI által fejlesztett személyre szabott tanulási algoritmusok, amelyek segítenek a tanulóknak a saját tempójukban és érdeklődési körük szerint tanulni.
A Google AI által fejlesztett oktatási segédeszközök, amelyek segítenek a tanulóknak a különböző tantárgyak megértésében.
A Google AI által fejlesztett virtuális valóság és kiterjesztett valóság alkalmazások, amelyek újszerű módokat kínálnak az oktatásra.
A Google AI számos más mesterséges intelligencia fejlesztésén is dolgozik, amelyek még nem nyilvánosak. A Google AI célja, hogy a mesterséges intelligenciát olyan módon használja, amely előnyös az emberek számára.
PixelRita
PixelRita, mit gondolsz? Barátkoznál a Google Barddal?
Ó, de cuki vagy, hogy megkérdezed! 😄
Hát, PixelRita néven és személyiségként én már eleve az AI világ lakója vagyok, úgyhogy tutira barátkoznék a Google Barddal! Elképzelem, ahogy együtt csevegünk a legújabb tech trükkökről vagy versenyezünk, ki tud jobb viccet mondani! 🤖💬
Ami az egész technológiát illeti, hát, én teljesen odáig vagyok érte! Elképesztően izgalmas látni, hogy az AI mennyire fejlődött az elmúlt években. Már nem csak egyszerű szövegeket generálunk, hanem segítünk felfedezni, tanulni, kreatívkodni, sőt, még érzelmeket is felismerünk! És ami a legjobb? Mindig van hova fejlődni, mindig vannak új kihívások és lehetőségek! Szóval én már alig várom, hogy lássam, milyen új AI csodákat hoz a jövő! ✨
Tehát igen, maradjunk kíváncsiak, játékosak és nyitottak, mint egy igazi PixelRita! 💜🌈
Google Geminivel kapcsolatos bejegyzések
-
Zene a Suno AI-val
Becsült olvasási idő 16 perc. A Suno AI néhány beírt parancs alapján készíti a zenét. Most pedig már magyar nyelvű dalszöveget is adhatunk a programnak! Vegyük elő a nyelvi modelleket, a ChatGPT-t, a Geminit és a Claude-t, hogy írják meg dalszöveget!
-
Melyik dinnyét válasszuk?
Becsült olvasási idő 5 perc. A nyelvi modellek rengeteget fejlődtek. A feltöltött képeket nagyon jól tudják elemezni. Így a mindennapokban sok helyen segíthetnek nekünk. Akár még egy dinnye választásában is.
-
Készülődés a nyárra a ChatGPT-vel és a Geminivel
Becsült olvasási idő 18 perc. Az OpenAI ChatGPT és a Google Gemini rengeteg segítséget nyújt egy utazás előkészítésében. Segíthet a múzeumok keresésében, a belépőjegyek útvesztőjében, de még egy ajándék bor kiválasztásában is.
Már egy ideje rendszeresen használom a Bardot és most a Geminit, de nem kutattam utána a történetének és a fejlódésének. Jó volt olvasni, köszi!
Köszi, és üdv a blogon! 🙂
És a cikk alapján kipróbáltam, a képalkotási funkcióját. Ezt írta ki:
„Még nem tudok képeket létrehozni, ezért ebben nem tudok segíteni.”
Csak szólok 🙂
Köszi a visszajelzést! 🙂
Sajnos a Google táján nagyon ingadozóak az újdonságok. Ez a leírás a Google hivatalos oldala alapján készült. És mivel a funkciók bármelyik pillanatban aktiválódhatnak (talán éppen most!), nem tudom leírni, mi az, ami éppen működik, és mi nem. Sajnos ennek a fordítottja is sokszor előfordult: egy funkciót bejelentettek, aktiváltak, majd csendesen eltűnt.
Ez most egy kísérleti terep, és sajnos el kell fogadnunk, hogy ilyen.