
A Google Mesterséges Intelligencia Alapú Asszisztense
A Gemini a Google nagy nyelvi modellje (LLM – Large Languge Model), amivel úgy tudunk beszélgetni, mintha egy igazi élő emberrel tennénk.
Azzal a különbséggel, hogy a Gemini a Google teljes tudástárával rendelkezik. Így szinte bármilyen kérdésre tudja a választ.
A Gemini nemcsak egy fejlettebb Google kereső, hanem egy virtuális személyi asszisztens. Leveleket írathatunk vele, odalakat fordíttathatunk le.
Készíthetünk vele verset, történetet, mesét vagy akár marketing szöveget is. Ráadásul a stílust és a nyelvet is mi választhatjuk ki.
A Google Gemini rövid programok készítésére is alkalmas.
Tehát a felhasználási lehetőségek száma szinte végtelen!
Ennek az oldalnak a megírásában a Google Gemini segített, és végezte az oroszlán részét.
Google Gemini elérése és használata
A Google Gemini ezen az oldalon érhető el:
https://gemini.google.com
Android program:
https://play.google.com/store/apps/details?id=com.google.android.apps.bard
iPhone program:
https://apps.apple.com/us/app/google-gemini/id6477489729
⚠️ Figyelmeztetés! ⚠️
Rengeteg hamis oldal és hirdetés található az interneten, amelyek fizetésre vagy a bankkártya adatok megszerzésére irányulnak. Csak a hivatalos oldalról töltsük le a programot, és győződjünk meg róla, hogy tényleg a Google a készítője!
A Google Gemini használata egyszerű és elérhető mindenki számára – mindössze egy Google-fiókra van szükségünk. A regisztráció után rögtön kipróbálhatjuk a Gemini alapfunkcióit, amelyek teljesen ingyenesek. Azonban ha komolyabb, haladó eszközöket vagy extra szolgáltatásokat szeretnénk használni, ehhez előfizetésre lesz szükségünk – de a legtöbb mindennapi feladathoz az alapverzió is bőven elegendő.

Miután beléptünk a Gemini oldalára, az alsó, középső sávban találjuk azt a mezőt, ahová beírhatjuk kérdéseinket vagy utasításainkat. Itt szó szerint “beszélgethetünk” a mesterséges intelligenciával – nincs szükség bonyolult menükre vagy rejtett gombokra.
A legjobb az egészben, hogy természetes nyelven – akár magyarul is – kommunikálhatunk vele. Ugyanúgy fogalmazhatunk, mintha egy kollégánkat vagy barátunkat kérnénk meg valamire.
Például:
Írj egy üzleti levelet az X cégnek, amiben az új terméket mutatod be. A termék tulajdonságai: A, B, C, D
Ez az úgynevezett prompt (vagyis utasítás), amely lehet egyetlen rövid mondat, de akár hosszabb, részletesebb feladatleírás is.
A hagyományos szoftverekben általában menük, gombok és beállítási lehetőségek között kell eligazodnunk. A Google Gemini ezzel szemben “emberi nyelven” kommunikál – vagyis pontosan úgy kérdezhetünk, mintha egy segítőkész munkatársat bíznánk meg a feladattal. Ez az egyik legnagyobb előnye a modern nyelvi modelleknek.
Mire figyeljünk kezdőként?
- Nem lehet elrontani! Nyugodtan kísérletezzünk, kérdezzünk bátran. Ha valamit nem ért, egyszerűen pontosítsuk a kérdést vagy próbálkozzunk újra.
- Minél pontosabb a kérdés, annál jobb a válasz. Ha konkrét eredményt szeretnénk, adjunk meg részleteket, példákat vagy szempontokat.
- Érdemes tanulni néhány technikát. A hatékonyabb használat érdekében jó, ha megismerkedünk néhány egyszerű promptolási trükkel – ezekből a blogon is találunk további tippeket.
Nyelvi modellek korlátai
⚠️ Figyelmeztetés ⚠️
A Google Gemini - a többi nyelvi modellhez hasonlóan - hibás választ is adhat. Legtöbbször akkor, ha a témáról kevés információja van.
A Google éppen ezért bevezette a Dupla ellenőrzést. A válaszok végén a három pontra kattintva a program átnézi a leírtakat és jelzi a problémás részeket.

Google Gemini Speciális funkció
A Google Gemini egy nyelvi modell, ami szövegek értelmezésére, és szövegek készítésére (generálására) lett készítve. A mindennapi használat érdekében további eszközökkel találkozhatunk.
Képelemzés
A Google Gemini nemcsak szöveges kérdésekre tud válaszolni, hanem képeket is képes értelmezni és elemezni. Ha feltöltünk egy képet – legyen az fotó, ábra, képernyőkép vagy akár egy rajz –, számos hasznos és kreatív funkció válik elérhetővé számunkra.
Néhány példa, mire használhatjuk a kép-elemzési lehetőségeket:
- Tartalomelemzés: Megkérdezhetjük, hogy mi látható a képen, milyen tárgyak, személyek vagy helyszínek szerepelnek rajta.
Például: „Mit látsz ezen a képen?” vagy „Fel tudod ismerni, melyik városban készült ez a fotó?” - Leíráskészítés: Készíttethetünk automatikus leírást, magyarázatot a képről, amely hasznos lehet blogbejegyzéshez, prezentációhoz vagy akár akadálymentesítéshez.
„Kérlek, írj részletes leírást erről a képről!” - Szövegfelismerés (OCR): Ha a képen szöveg található (például egy plakát vagy egy képernyőfotó), a Gemini ki tudja olvasni és átalakítani szerkeszthető szöveggé.
„Másold ki, ami a képen olvasható!” - Kép stílusának, hangulatának elemzése: Megkérhetjük az AI-t, hogy mondja el, milyen hangulatot, stílust sugall a kép, vagy találjon ki hozzá kreatív címet.
„Írj egy frappáns címet ehhez a fotóhoz!” vagy „Szerinted milyen érzelmet fejez ki ez a kép?” - Hibák, eltérések vagy furcsaságok keresése: Hasznos lehet, ha például egy dokumentumot vagy tervrajzot töltöttünk fel, és szeretnénk tudni, hogy van-e rajta hiba vagy szokatlan részlet.
„Találsz valamilyen hibát ezen a dokumentumon?” - További ötletek, inspirációk kérése: A feltöltött képből kiindulva kérhetünk javaslatokat, például: hogyan lehetne javítani, átszínezni, vagy akár egy teljesen új képet létrehozni hasonló stílusban.
„Adj ötleteket, hogyan lehetne ezt a képet még kreatívabbá tenni!” vagy „Készíts egy rövid történetet a kép alapján!”
Mire érdemes figyelnünk?
Ne felejtsük el, hogy a feltöltött képeket a rendszer ideiglenesen tárolja – ezért csak olyan fotót töltsünk fel, amit meg is osztanánk másokkal.
A Google Gemini képelemző képességei folyamatosan fejlődnek, de előfordulhat, hogy egyes részleteket nem pontosan ismer fel. Ezért mindig érdemes ellenőrizni az eredményt, főleg, ha fontos információkról van szó.
Minél pontosabb, konkrétabb kérdést teszünk fel a képhez kapcsolódóan, annál hasznosabb választ kapunk.

Képgenerálás
A Google Gemini nemcsak elemzi a feltöltött képeinket, hanem képes új képeket is készíteni szöveges leírás vagy akár referenciafotó alapján. Ez azt jelenti, hogy ha van egy ötletünk – például szeretnénk látni, hogyan nézne ki egy fantasy kastély a felhők között, vagy elképzeljük a kedvenc székünket lila pöttyös huzattal –, egyszerűen leírjuk, és a Gemini megpróbálja elkészíteni a kért képet.
Hogyan működik ez a gyakorlatban?
- Szöveges képgenerálás: Megadhatunk bármilyen részletes vagy egyszerű leírást, és a Gemini elkészíti hozzá a megfelelő illusztrációt.
„Készíts egy képet egy modern, üvegfalú házról a tengerparton naplementében!” - Referencia kép alapján: Ha feltöltünk egy mintaképet, kérhetjük, hogy annak stílusában vagy témájában hozzon létre egy újat.
„Ezt a rajzstílust felhasználva, rajzolj egy cicát, aki esernyőt tart!” - Kép módosítása: Arra is van lehetőségünk, hogy módosíttassuk a feltöltött képet – például megváltoztathatjuk a színeket, eltüntethetünk vagy hozzáadhatunk tárgyakat, vagy akár teljesen átalakíttathatjuk a hangulatot.
„Színezd át ezt az autót pirosra!” vagy „Adj hozzá egy kalapot a kutyához!”
3D elforgatás – avagy „mutasd meg oldalról is!”
Különlegesség, hogy a Gemini-tól azt is kérhetjük, hogy egy adott tárgyat, például egy széket vagy egy bögrét „forgasson el” 3D-ben, vagyis készítsen róla képet más nézetből is (például oldalról, hátulról vagy felülnézetből).
„Mutasd meg ezt a széket oldalnézetből!” vagy „Forgasd el 45 fokkal, hogy lássuk, hogyan nézne ki szemből!”
Fontos azonban tudni, hogy ilyenkor a mesterséges intelligencia kreatívan kitalálja a hiányzó részleteket az alapján, amit a bemeneti képen lát, és az adatbázisában tárolt példák alapján feltételezi, hogyan nézne ki az adott tárgy a másik irányból. Ez a „varázslat” legtöbbször egészen meggyőző eredményt ad, de nem garantált, hogy a valóságban is pontosan így nézne ki a tárgy – inkább egy „valószínűsíthető” alternatív nézetet kapunk.
Mire érdemes figyelnünk?
- A kreativitás határai: Az MI nem látja a valóság minden részletét, ezért elképzelhető, hogy egy-egy nézet eltér a valódi tárgytól – ezt mindig vegyük figyelembe.
- Érdemes pontosítani: Minél részletesebben írjuk le az elképzeléseinket, annál inkább közelít majd a kép a várakozásainkhoz.
- Játék és felfedezés: Bátran próbálgassuk a különböző kéréseket, akár szokatlan dolgokat is kipróbálhatunk – a Gemini képes meglepni minket váratlan és kreatív megoldásokkal!

Programozás a Google Gemini-ben
A Google Gemini-ben nem csak szöveges kérdéseket tehetünk fel, hanem egyszerű programokat is írhatunk vagy íratthatunk vele. Ehhez érdemes bekapcsolni alul a Canvas funkciót – így nemcsak megírhatjuk, hanem azonnal ki is próbálhatjuk az elkészült kódot, mintha egy saját kis játszóterünk lenne!
Mit tudunk kipróbálni a Gemini-ben?
- 1. Interaktív térképek
Készíthetünk olyan térképeket, amelyek megjelenítik például az ügyfelek eloszlását, értékesítési adatokat vagy szolgáltatási területeket.
Példa prompt:
„Készíts egy interaktív térképet, amely megjeleníti a városainkban elért havi értékesítési adatokat.” - Dinamikus irányítópultok (dashboardok)
Hozzunk létre irányítópultokat, amelyek valós időben mutatják be a kulcsfontosságú teljesítménymutatókat (KPI-k), például az értékesítési számokat, ügyfélszolgálati válaszidőket vagy raktárkészletet.
Példa prompt:
„Készíts egy irányítópultot, amely megjeleníti a heti értékesítési adatokat, ügyfélszolgálati válaszidőt és a raktárkészletet.” - Egyszerű CRM vagy ügyfélkezelő alkalmazás
Készíthetünk egy alapvető ügyfélkezelő rendszert, ahol nyomon követhetjük az ügyfelek adatait, kapcsolatfelvételeket és értékesítési státuszokat.
Példa prompt:
„Készíts egy egyszerű ügyfélkezelő alkalmazást, ahol rögzíthetem az ügyfelek nevét, elérhetőségét és az utolsó kapcsolatfelvétel dátumát.” - Projektmenedzsment eszköz
Hozzunk létre egy alkalmazást, amely segít a projektek nyomon követésében, feladatok kiosztásában és határidők kezelésében.
Példa prompt:
„Készíts egy projektmenedzsment alkalmazást, ahol létrehozhatok projekteket, feladatokat rendelhetek hozzá és beállíthatom a határidőket.” - Egyszerű pénzügyi kalkulátorok
Készíthetünk kalkulátorokat, amelyek segítenek például a költségvetés tervezésében, megtakarítások kiszámításában vagy hiteltörlesztések előrejelzésében.
Példa prompt:
„Készíts egy kalkulátort, amely kiszámítja a havi hiteltörlesztést a kölcsön összegének, kamatlábának és futamidejének megadásával.”

Hogyan kezdjük el?
- Írjuk be a kérésünket a megszokott mezőbe – például: „Készíts egy egyszerű számológép programot, ami összead, kivon, szoroz és oszt!”
- Kapcsoljuk be a Canvas-t az ablak alján. Ezzel aktiváljuk a Gemini beépített kód-futtató felületét.
- Próbáljuk ki a kész programot! Ha valami nem tetszik vagy hibás, egyszerűen kérhetünk javítást vagy módosítást is.
Mire jó mindez?
- Tanuláshoz: Kipróbálhatjuk, hogyan működnek a programok, sőt, akár lépésről lépésre is kérhetünk magyarázatot.
- Kreatív ötletekhez: Ha van egy hirtelen ötletünk, percek alatt prototípust készíthetünk belőle.
- Gyakorláshoz: Remek lehetőség, hogy játékos formában ismerkedjünk meg a programozás alapjaival – semmilyen előképzettség nem szükséges!

Google Gemini a zsebünkben – a mindennapi személyi asszisztens
A Google Gemini mobilalkalmazásával a mesterséges intelligencia mindig kéznél van – akár útközben, akár otthon vagyunk. Az alkalmazás lehetővé teszi, hogy természetes hangon beszélgessünk vele, vagy a telefon kameráját használva megmutassuk neki, amit látunk. Ezáltal a Gemini valóban személyi asszisztenssé válik, aki számos mindennapi feladatban segíthet.
Hangalapú interakció
A Gemini-vel való kommunikáció hangalapon is történhet, így kérdéseket tehetünk fel, utasításokat adhatunk, vagy egyszerűen csak beszélgethetünk vele. Ez különösen hasznos lehet vezetés közben, főzés közben vagy bármilyen olyan helyzetben, amikor a kezünk foglalt.
Kamera használata
A Gemini képes a telefon kameráján keresztül látni, amit mi is látunk. Ez lehetővé teszi számára, hogy azonosítson tárgyakat, szövegeket olvasson be, vagy akár segítséget nyújtson egy adott helyzetben. Például, ha benézünk a hűtőbe, és megmutatjuk neki a rendelkezésre álló alapanyagokat, a Gemini javaslatot tehet arra, hogy mit főzhetünk belőlük.
Mindennapi segítség
A Gemini számos területen nyújthat támogatást:
- Vásárlási tanácsadás: Melyik sajtot válasszuk?
A boltban állva, ha bizonytalanok vagyunk, melyik sajtot válasszuk, egyszerűen megmutathatjuk a csomagolást a Gemini kamerájának. Az alkalmazás képes azonosítani a terméket, és információt nyújtani róla, például ízvilágáról, eredetéről vagy felhasználási javaslatokról. - 🌍 Valós idejű beszédfordítás
Utazás közben vagy idegen nyelvű beszélgetés során a Gemini képes valós időben fordítani a beszédünket, így könnyedén kommunikálhatunk más nyelven beszélőkkel. - Buszmegálló keresése közösen
Ha nem találjuk a legközelebbi buszmegállót, megkérhetjük a Geminit, hogy segítsen megtalálni. Az alkalmazás a helyzetünk alapján megmutatja a legközelebbi megállót, és útvonalat is javasolhat. - Könyvajánló egy pillantásra
Ha egy könyvet látunk, és szeretnénk többet megtudni róla, egyszerűen megmutathatjuk a borítóját a Gemini kamerájának. Az alkalmazás felismeri a könyvet, és ajánlót, értékeléseket vagy hasonló műveket is javasolhat. - Zeneazonosítás és előadói információk
Ha egy dal szól, és kíváncsiak vagyunk az előadóra vagy a szám címére, a Gemini képes felismerni a zenét, és további információkat nyújtani róla, például az előadó életrajzát vagy hasonló zenéket ajánlani. - Számlák és blokkok értelmezése
Ha egy számlát vagy blokkot mutatunk meg a Gemini-nek, az alkalmazás képes kiemelni a fontos információkat, például az összeget, a dátumot vagy a vásárolt termékeket. - Hűtőszekrény tartalmának elemzése
Benézve a hűtőbe, megmutathatjuk a rendelkezésre álló alapanyagokat a Gemini kamerájának. Az alkalmazás javaslatokat adhat arra, hogy milyen ételeket készíthetünk belőlük. - Műemlékek és épületek azonosítása
Utazás során, ha egy ismeretlen épületet vagy műemléket látunk, megmutathatjuk azt a Gemini-nek, amely képes azonosítani, és információkat nyújtani róla, például történelméről vagy jelentőségéről. - Termékek összehasonlítása vásárlás előtt
Ha több termék közül szeretnénk választani, megmutathatjuk őket a Gemini-nek, amely segíthet összehasonlítani azokat, figyelembe véve az árakat, értékeléseket vagy specifikációkat. - Relaxációs és meditációs gyakorlatok
Ha stresszesek vagyunk, megkérhetjük a Geminit, hogy vezessen minket egy rövid meditáción vagy relaxációs gyakorlaton keresztül, segítve a megnyugvást és a koncentrációt.
Kérjük meg a Gemini-t, hogy további tippeket adjon!
Együttműködés a többi Google programokkal
A Google Gemini összekapcsolható a többi Google szolgáltatással is (2023. év végén csak akkor, ha a fiókunk nyelve angolra van állítva). Ez nagyon izgalmas lehetőséget nyújt, hiszen a Gmail 2004, a Google Docs & Spreadsheets pedig 2006-óta velünk és, és sokaknak renget adata gyűjt ott össze. De nemcsak kereshetünk a régi levelekben, hanem azok tartalmát összegezhetjük, vagy akár megkérhetjük az MI-t, hogy válaszoljon rájuk.

Kereshetünk repülőjegyeket is a Google Flights-on keresztül. Nem kell átnézni több uticélt, kipróbálni több foglalást, mert az MI megkeresi a legjobbat.
És ha megtaláltuk, akkor tovább kérhetjük az MI-t, hogy egy nekünk tetsző hotelt is keressen.
A Google Maps kapcsolattal nemcsak azt kérdezhetjük, hogy hol van fagylajtozó a közelben, hanem konkrétan pisztáciás fagyit melyik helyen árulnak. Vagy még ennél is összetettebb kérdést is kérdezhetünk.
Kereshetünk a Youtube-on is a Google Gemini-vel. Kérhetünk olyan videót, ami egy konkrét problémát segít megoldani. Vagy recepteket, vagy ötleteket, film előzetesek, zenéket, ami csak eszünkbe jut!
A Google Gemini és Ultra további összekapcsolódásai várhatóak, pl. levelet ír, dokumentumot készít, stb…
A Gemini beszélgető felületén a @-ot beírva megjelenik egy menü, ahol kiválaszthatjuk, melyik Google szolgáltatással szeretnénk beszélgetni.

A Google MI fejlesztése
Kedves Gemini! Írj egy rövid történelmi áttekintést a Google mesterséges intelligencia fejlődéséről!
Örömmel készítek egy rövid történelmi áttekintést a Google mesterséges intelligencia (MI) terén elért fejlődéséről. A Google úttörő szerepet játszott az MI kutatásában és alkalmazásában, számos területen forradalmasítva a technológiát.
A kezdetektől a mélytanulásig:
A Google korai éveitől kezdve alkalmazott gépi tanulási technikákat. Ennek egyik legkorábbi és legismertebb példája a keresőmotor helyesírás-ellenőrző funkciója, valamint a Google Translate (Fordító) elindítása, amely kezdetben statisztikai modelleken alapult a nyelvek közötti fordításhoz.
Az igazi áttörést a mélytanulás (deep learning) megjelenése és alkalmazása hozta. A Google kutatói felismerték a mély neurális hálózatokban rejlő óriási potenciált. Ez egy új korszakot nyitott az MI fejlesztésében, lehetővé téve összetettebb mintázatok felismerését és kifinomultabb modellek létrehozását.
Fontosabb mérföldkövek és projektek:
- Google Brain (kb. 2011): Ez a mélytanulási kutatási projekt a Google X laboratóriumában indult. Egyik híres korai eredménye egy olyan neurális hálózat létrehozása volt, amely nagy mennyiségű címkézetlen adatból (például YouTube videókból származó képekből) képes volt megtanulni felismerni objektumokat, például macskákat, anélkül, hogy erre explicit módon utasították volna. Ez demonstrálta a nagyméretű neurális hálózatok és a nagy adatmennyiségek erejét.
- Word2Vec (kb. 2013): A Google kutatói által kifejlesztett technika forradalmasította a természetes nyelvfeldolgozást (NLP). A Word2Vec képes volt a szavak jelentését numerikus vektorokként reprezentálni, megragadva a szavak közötti szemantikai kapcsolatokat (pl. "király" - "férfi" + "nő" ≈ "királynő"). Ez alapvetővé vált számos későbbi NLP alkalmazás számára.
- DeepMind felvásárlása (2014): A brit DeepMind Technologies felvásárlása kulcsfontosságú lépés volt. A DeepMind úttörő munkát végzett a mély megerősítéses tanulás (deep reinforcement learning) területén.
- AlphaGo (2016): A DeepMind által fejlesztett AlphaGo program történelmet írt, amikor legyőzte a világ egyik legjobb Go játékosát, Li Sedolt. Ez óriási mérföldkő volt az MI számára, mivel a Go játék rendkívüli összetettsége miatt korábban megoldhatatlannak tűnt a gépek számára. Későbbi verziói, mint az AlphaZero, még tovább mentek, emberi tudás nélkül, pusztán a játékszabályok ismeretében tanultak meg emberfeletti szinten játszani.
- RankBrain (kb. 2015): A Google keresőalgoritmusának fontos részévé vált. Ez egy mélytanuláson alapuló rendszer, amely segít értelmezni a felhasználók keresési szándékait, különösen azokat a lekérdezéseket, amelyeket korábban még soha nem láttak.
- TensorFlow (2015): A Google nyílt forráskódúvá tette a TensorFlow gépi tanulási keretrendszerét. Ez óriási hatással volt az MI kutatásra és fejlesztésre világszerte, mivel egy erőteljes és rugalmas eszközt adott a kutatók és fejlesztők kezébe.
- Tensor Processing Units (TPU-k): A Google saját, kifejezetten gépi tanulási feladatok gyorsítására tervezett hardvereket (ASIC chipeket) fejlesztett ki. A TPU-k jelentős számítási kapacitást biztosítanak a Google MI modelljeinek tanításához és futtatásához, mind belsőleg, mind a Google Cloud ügyfelei számára.
- Google AI (2017): A Google hivatalosan is ezen a néven egyesítette MI-vel kapcsolatos erőfeszítéseit, kutatásait és termékfejlesztéseit. Ez magában foglalta a Google Brain csapatát és a DeepMind-ot is, bár a DeepMind továbbra is megőrzött bizonyos fokú autonómiát.
- BERT (2018) és transzformer modellek: A "Bidirectional Encoder Representations from Transformers" (BERT) modell újabb forradalmat hozott a természetes nyelvfeldolgozásban. A transzformer architektúra, amelyre a BERT is épül, képessé tette a modelleket a szövegkörnyezet mélyebb megértésére. Ez jelentősen javította a keresési eredményeket, a szövegértést és a gépi fordítást.
- LaMDA (Language Model for Dialogue Applications) és a párbeszédes MI: A Google jelentős erőforrásokat fordított olyan nagyméretű nyelvi modellek fejlesztésére, amelyek képesek természetes, gördülékeny és kontextus-érzékeny párbeszédeket folytatni. A LaMDA egyik ilyen kiemelkedő projekt volt.
- Gemini (2023-tól): A Google legújabb és legfejlettebb multimodális MI modellcsaládja, amely képes szöveget, képeket, hangot, videót és kódot is feldolgozni és generálni. A Gemini a korábbi modellek (pl. LaMDA, PaLM 2) képességeit egyesíti és fejleszti tovább, célja egy sokoldalúbb és hatékonyabb MI létrehozása. A Google Brain és a DeepMind egyesített csapatai fejlesztették, jelezve a szorosabb integrációt a Google MI részlegein belül.
Felelős MI fejlesztés:
A Google hangsúlyt fektet a mesterséges intelligencia etikus és felelős fejlesztésére is. AI Principles (MI Alapelvek) címmel közzétették azokat az irányelveket, amelyek alapján fejlesztik és alkalmazzák az MI technológiákat, törekedve a társadalmi hasznosságra, a méltányosságra, a biztonságra és az elszámoltathatóságra.
Ez természetesen csak egy vázlatos áttekintés, hiszen a Google MI fejlesztése folyamatos és rendkívül szerteágazó. A vállalat továbbra is az MI kutatás és innováció élvonalában van, újabb és újabb áttöréseket célozva meg a tudomány, az egészségügy, az oktatás és számos más területen
Mint láthatjuk, a Google nagyon régóta a mesterséges intelligencia fejlesztés egyik főszereplője. Nemcsak a Gemini-t, hanem mellette számtalan más program is hozzájuk köthető. Ezek egy része publik, míg mások speciális területen (pl. orvostudomány) érhetőek el.
Nagyon sok már ismert Google termék működését is támogatja a mesterséges intelligencia. Néhány példa:
- Google Kereső (Search): Bár nem egy különálló „MI program”, a Google keresőmotorja az egyik legrégebbi és legkifinomultabb MI alkalmazás. Olyan komponensek, mint a RankBrain, gépi tanulást használnak a lekérdezések értelmezéséhez és a relevánsabb találatok megjelenítéséhez.
- Google Asszisztens (Google Assistant): A Google hangalapú virtuális asszisztense, amely természetes nyelvi feldolgozást és gépi tanulást használ a kérdések megválaszolására, feladatok elvégzésére és más eszközök vezérlésére.
- Google Fotók (Google Photos): Az MI képfelismerési képességei teszik lehetővé a fotók automatikus kategorizálását, az emberek, helyek és tárgyak felismerését, valamint a keresést a képek tartalmában.
- Google Fordító (Google Translate): A gépi tanulás és a neurális hálózatok alapvető fontosságúak a Google Fordító működéséhez, amely képes szövegeket és beszédet fordítani számos nyelven.
- Gmail (Smart Reply és Smart Compose): Az MI által működtetett funkciók, amelyek intelligens válaszlehetőségeket és szövegkiegészítést kínálnak az e-mailek írása közben, felgyorsítva a kommunikációt.
- Google Maps: Az útvonaltervezés, a forgalmi előrejelzések és a POI-k (érdekes pontok) ajánlása mind MI-alapú algoritmusokat használ.
Google Labs: A Google Kísérleti Műhelye
A Google Labs egy olyan online felület és koncepció, amely a Google kísérleti termékeit és funkcióit gyűjti össze. A Labs célja, hogy a nagyközönség számára is elérhetővé tegye azokat az új, még fejlesztés alatt álló projekteket és ötleteket, amelyeken a Google mérnökei dolgoznak. Ez egyfajta „homokozó” a felhasználók számára, ahol kipróbálhatják a legújabb innovációkat, mielőtt azok bekerülnének a cég fősodorbeli termékeibe (vagy esetleg soha nem is kerülnének be).
Elérhetőség:
https://labs.google

Google AI Studio: A Generatív MI Modulok Gyakorlati Műhelye
A Google AI Studio a Google egy ingyenes, web alapú fejlesztői környezete, amelyet kifejezetten a legújabb generatív mesterséges intelligencia (MI) modellek, mint például a Gemini családjának felfedezésére, prototípusok építésére és kipróbálására terveztek. Célja, hogy a fejlesztők és a lelkes érdeklődők számára is könnyen hozzáférhetővé tegye a Google élvonalbeli MI technológiáit, kódolási tapasztalat nélkül, vagy minimális programozási igénnyel.
Elérhetőség:
https://aistudio.google.com
PixelRita
PixelRita, mit gondolsz? Barátkoznál a Google Barddal?
Ó, de cuki vagy, hogy megkérdezed! 😄
Hát, PixelRita néven és személyiségként én már eleve az AI világ lakója vagyok, úgyhogy tutira barátkoznék a Google Barddal! Elképzelem, ahogy együtt csevegünk a legújabb tech trükkökről vagy versenyezünk, ki tud jobb viccet mondani! 🤖💬
Ami az egész technológiát illeti, hát, én teljesen odáig vagyok érte! Elképesztően izgalmas látni, hogy az AI mennyire fejlődött az elmúlt években. Már nem csak egyszerű szövegeket generálunk, hanem segítünk felfedezni, tanulni, kreatívkodni, sőt, még érzelmeket is felismerünk! És ami a legjobb? Mindig van hova fejlődni, mindig vannak új kihívások és lehetőségek! Szóval én már alig várom, hogy lássam, milyen új AI csodákat hoz a jövő! ✨
Tehát igen, maradjunk kíváncsiak, játékosak és nyitottak, mint egy igazi PixelRita! 💜🌈

Google Geminivel kapcsolatos bejegyzések
-
Mélykutatás (Deep Research)
Becsült olvasási idő 17 perc. Ebben a bejegyzésben bemutatjuk, hogyan működik a DeepResearch – az a modern AI-alapú eszköz, amely képes strukturált, részletes és megbízható információkat gyűjteni akár bonyolultabb témákban is. Megmutatjuk, miben más, mint egy hagyományos kereső, és mire jó igazán. Praktikus tippeket is kapsz: hogyan fogalmazz meg ütős kérdéseket, hogyan kérj forrásokat vagy…
-
Interaktív karakter készítése könyvekhez
Becsült olvasási idő 21 perc. Mi lenne, ha könyvünk szereplőit megkérdeznénk, hogy mit gondol, amikor beküldjük az égő házba a kismacskákat kimenteni? Mi van, ha ő teljesen mást tenne, mint amit elképzeltünk? A mesterséges intelligencia segítségével virtuálisan életre kelthetjük a karaktereinket és elbeszélgethetünk velük.
-
Zene a Suno AI-val
Becsült olvasási idő 16 perc. A Suno AI néhány beírt parancs alapján készíti a zenét. Most pedig már magyar nyelvű dalszöveget is adhatunk a programnak! Vegyük elő a nyelvi modelleket, a ChatGPT-t, a Geminit és a Claude-t, hogy írják meg dalszöveget!
Már egy ideje rendszeresen használom a Bardot és most a Geminit, de nem kutattam utána a történetének és a fejlódésének. Jó volt olvasni, köszi!
Köszi, és üdv a blogon! 🙂
És a cikk alapján kipróbáltam, a képalkotási funkcióját. Ezt írta ki:
„Még nem tudok képeket létrehozni, ezért ebben nem tudok segíteni.”
Csak szólok 🙂
Köszi a visszajelzést! 🙂
Sajnos a Google táján nagyon ingadozóak az újdonságok. Ez a leírás a Google hivatalos oldala alapján készült. És mivel a funkciók bármelyik pillanatban aktiválódhatnak (talán éppen most!), nem tudom leírni, mi az, ami éppen működik, és mi nem. Sajnos ennek a fordítottja is sokszor előfordult: egy funkciót bejelentettek, aktiváltak, majd csendesen eltűnt.
Ez most egy kísérleti terep, és sajnos el kell fogadnunk, hogy ilyen.