Teljes könyv lefordítása

Becsült olvasási idő 5 perc.

Te szeretsz olvasni?

PixelRita, te szoktál könyvet olvasni?

Én nagyon szeretek könyvet olvasni, de csak az anyanyelvemen. Neked persze nem gond, ha más nyelven akarsz olvasni. Hány nyelvet ismersz?

Mit gondolsz arról, ha lenne egy olyan mesterséges intelligencia, ami egy egész könyvet le tudna fordítana magyarra?

Nos, van már ilyen. Nem tökéletes, de már van!

A könyv

Én nagyon szeretek olvasni. Mióta pedig külföldön élek, még inkább örülök, ha magyar nyelven szerezhetek meg egy könyvet. Szerencsére egyre több iromány vásárolható meg ebook formában is. Így nem kell megvárnom, míg Magyarországra megyek, és nem kell a könyveket a bőröndbe tuszkolni.

Viszont a magyar nyelv egyik sajátossága, hogy kevesen beszélik. Mindig ott van a veszélye annak, hogy valamelyik nemzetközi sorozatot kevés ember olvassa, így a kiadó nem látja értelmét a folytatások terjesztésében.

Sajnos így járt az én egyik kedvenc sorozatom is. Több év után a kiadó végül feladta, és bejelentette: nem lesz több magyar folytatás.

Ez bizony szomorú hír volt.

Készült a Meme Machine Custom GPT-vel

A fordító robot

2022-ben aztán előjött a mesterséges intelligencia az árnyékból. 2023-ban pedig már a mindennapokban is használható eszközök jelentek meg. Egyik ilyen a DeepL.

A DeepL egy kifejezetten nagy mennyiségű szöveg fordítására tréningezett mesterséges intelligencia. Ez a program akár egymillió szót is „fejben” tud tartani! Ez azért fontos, mert akkor az egész könyvet egy egységnek kezeli. És ebben az esetben az egyforma kifejezéseket az egész könyvben ugyan úgy fordítja le. Nem fordul elő, hogy ugyan az a szó a könyv elején mást jelent, mint a végén.

Rendben, tehát van egy MI-alapú program, ami egy teljes könyvet le tud fordítani.

Az eredeti könyvet megvettem angolul .epub formátumban. Ebből készítettem egy .docx formátumú fájlt, és ezt adtam oda a DeepL-nek. Nemsokára megkaptam magyarul az eredményt.

Az eredmény

A könyv egészen jó! Persze nem tökéletes. Vannak kifejezések, amik angolosak maradtak. És vannak olyan részek, amelyek nehezebben érthetőek és ott jobban oda kellett figyelni. De a könyv olvasható, élvezhető. Nem akaszt meg egy-egy fordítási bizonytalanság.
Ritkán előfordult, hogy valami túlságosan zavaros lett és csak néhány oldallal később sikerült megérteni, hogy pontosan miről van szó. Ilyenkor vissza kellett menni néhány oldalt, és az adott részt újra el kellett olvasni.

Összességében 90%-ot adok az eredményre. Nem olyan jó, mintha egy profi fordította volna. Hiányzik a gördülékenység.

Viszont a könyvből egyetlen egy magyar nyelvű fordítás sem létezik, és nem lesz lesz.

Lehetőségek

Egy teljes könyv lefordításához nem feltétlenül szükséges az idegen nyelvet ismerő ember. A DeepL által végzett fordítás már közel tökéletes, csupán egy olyan személyre van szükség, aki kiválóan ismeri a magyar nyelvet, és képes finomhangolni a szöveget.

Mindeközben Magyarországon túlsúlyban vannak az angol nyelvről fordított könyvek. Pedig más nyelvek is vannak a világon!

A DeepL most (2024 eleje) 29 nyelvet ismer és tud egyikről a másikra fordítani. Ezek leginkább európai nyelvek, de találunk kínait, japánt, koreait, törököt és indonéz nyelvet is. És persze ott a magyar nyelv is köztük!

Én nagyon kevés olyan török nyelvű könyvvel találkoztam, amit magyarra is lefordítottak. Pedig ők is írnak olyanokat, amiket szívesen olvasnék. Vagy mi van az olasz irodalommal? És az indonézzel? Mikorra várható, hogy ezek a könyvek magyar nyelven is megjelenjenek a boltok polcain? Főleg akkor, amikor még az angol könyveknél sincs garancia rá, hogy egy sorozat összes könyvét magyarul is el lehessen olvasni?

A DeepL segítségével mindegyik könyvet le lehet fordítani. Csak egy kis korrektúrázás kell utána, és már mehet is a nyomdába vagy az ebook áruházba!

Záró Gondolatok a Digitális Könyvvarázslatról

Mit gondolsz PixelRita a MI-könyvfordításról?

Loading

Web-oldalról információ gyűjtése a ChatGPT-vel

ChatGPT Plug-in-ek táblázatba rendezve
Becsült olvasási idő 6 perc.

A szuper technika

A ChatGPT 4-es verziójához az első nagy újdonság az volt, hogy kiegészítőket, plug-in-ket lehet készíteni hozzá. Így új funkciókkal bővülhet a program. Például web-oldalakat tud megnézni, elemezni, akár le is tölteni. Vagy grafikonokat készít, térképet rajzol, videót elemez, összeköthetjük más programokkal, és még nagyon sok mindent.

A nagyon sok minden konkrétan ezernél is több plug-int jelent.

PixelRita! Mik azok a plug-inek?

A probléma

Csakhogy sajnos az ChatGPT-t fejlesztő OpenAI állandóan rohan, hogy utolérje a saját technológiáját. Így a Plug-In rész túlságosan egyszerűre sikerült. Ezért egy idő múlva teljesen átláthatóan lett az egész. Ráadásul a Plug-inekről alig 1-2 mondat írja le, hogy melyik mit is csinál. Így roppant nehéz kiválasztani, melyiket használjuk.

A ChatGTP plug-in központja
A ChatGTP plug-in központja

Miután pedig kiválasztottuk azokat, amiket használni akarunk (azaz telepítettük), még mindig csak egy listánk van ugyan azzal a néhány mondatos leírással. A lista pedig mellőzi az ábécé sorrendet.

Összességében nem egyszerű kibogozni melyiket is használjuk.

A feltelepített ChatGPT plug-inek
A feltelepített ChatGPT plug-inek

Egy külső weboldal

Szerencsére ráakadtam a StartupHub.ai oldalára, ahol rengeteg plug-int összegyűjtöttek és készítettek egy rövid leírást is, hogy melyik mire jó. Saját bevallásuk szerint 992 plug-in van az ő adatbázisukban. Nincs itt az összes, amit telepíteni lehet a ChatGPT-hez, de talán kellően elég, hogy végre egy rendes listát készítsünk.

Ezt az oldalt bátran ajánlom mindenkinek, aki plug-int keres!

StartHub.ai leírása az egyik plug-inről
StartHub.ai leírása az egyik plug-inről

Munkában a GPT

Bármennyire is hihetetten, de ezzel minden információ készen állt, hogy a nálam feltelepített plug-ineket egy táblázatba rendezzem.

Saját plug-inek összegyűjtése

Legnehezebb feladatnak az tűnt, hogy összeszedjem azokat plug-ineket, amiket a ChatGPT fiókomhoz telepítettem. Rendes listát nem találunk. Csak mint a fenti képen látható, egy kis ablakban 4 plug-in neve jelenik meg.

Erről készítettem egy-egy képernyőképet, majd odaadtam a ChatGPT képfelismerőjének, hogy írja át szöveg formába azt, ami a képen látható. Ezzel megkaptam a plug-in-ek nevét szövegként. A ChatGPT-t kértem, hogy listába, ábécé sorrendbe rendezve írja le őket.

Készítsük a linket

Most, hogy már volt nevünk, rá tudtunk keresni. Szerencsére a SttartupHub.ai szépen, kövezetesen használja a linkeket. Az Ai Tool Hunt nevű plug-in linkje pl így néz ki:
https://www.startuphub.ai/chatgpt-plugin/ai-tool-hunt/
A ChatGPT-t meg tudtam kérni, hogy az előbbi listában az összes plug-in nevét alakítsa át linké, ebben a formában.

A linkek tartalmának összegyűjtése

Most, hogy már valódi linkek is voltak, megkértem a ChatGPT-t, hogy nézze végig őket egyenként, és gyűjtse össze az ott található tartalmat.
Értse meg, hogy melyik plug-in mire jó. Próbáljon példát is keresni a használatára. És saját belátása szerint találjon ki egy kategóriát, amibe beleteheti.

Ehhez a VoxScript plug-in-t használtam. Ez a kiegészítő nagyon jól használható egy-egy weboldal információinak összegyűjtésére. De az még neki is sok, hogy ennyi plug-in weboldalát egyesével átnézze.
Ezért csak 5-5 oldalt kértem tőle egyidőben.

A végeredmény

Végeredményül egy ilyen szép táblázatot kaptam. A teljes táblázatot betettem a blog tudástárába is.

ChatGPT plug-in-ek táblázatba rendezve
ChatGPT plug-in-ek táblázatba rendezve

További lehetőségek

Jól láthatjuk, hogyha már van egy link gyűjteményünk, akkor a ChatGPT-t meg lehet kérni arra, hogy az oldalakat végigjárva rövid leírásokat készítsen a linkek tartalmáról. Akár egy jól használható táblázatot is kaphatunk!

Tehát a fent bemutatott módszer bármikor máskor is használható, ha van egy link gyűjteményünk. Mutatok néhány példát, mert nekem nagyon sok link gyűjteményem van.

Google Play Store

Minden évben összegyűjtöm azokat a programokat, amik a telefonomra fel vannak telepítve. A linket egy dokumentumban tartom, hogy azokra kattintva könnyen és gyorsan fel lehessen telepíteni a kedvenc programjaimat. De mindig is túl lusta voltam, hogy azt is leírja, milyen program is van valójában a link mögött. Most a ChatGPT szépen összeírta nekem.

A Google Play Store programjaim listába rendezve egy-egy rövid leírással
A Google Play Store programjaim listába rendezve egy-egy rövid leírással

Stable Diffusion letölthető tartalmak

A Stable Diffusion mesterséges intelligenciával működő rajzoló programjának egyik jellemzője, hogy nyílt és így bárki készíthet hozzá modelleket vagy más extra tartalmaz. Ennek köszönhetően rengeteg hasznos anyagot találunk hozzá, amik egy idő múlva igencsak átláthatatlanok lesznek.

Ismételten a ChatGPT-nek odaadtam egy listát tele linkekkel, hogy írja le, melyik kiegészítő mire is jó, hogyan használjuk. Ezt kézzel összeírni igencsak sokáig tartott volna.

Több ehhez hasonló listám is van. A Stable Diffusion modellek ide, a LoRA modellek pedig ide kerültek fel a blogban (a képeket manuálisan raktam be).

A Stable Diffusion kiegészítőjének rövid leírása.
A Stable Diffusion kiegészítőjének rövid leírása.

MI programok

Itt pedig a mesterséges intelligencia programok gyűjtéséből van egy kis részlet. Az MI programokról több dossziényi linket gyűjtöttem össze. Azokból is a ChatGPT készít egy rövid leírást tartalmazó listát.

Ez a lista MI programok linkjeit tartalmazta, amiből a ChatGPT egy jobban átlátható, leírásokkal bővített listát készített.
Ez a lista MI programok linkjeit tartalmazta, amiből a ChatGPT egy jobban átlátható, leírásokkal bővített listát készített.

Összegzés

A ChatGPT a VoxScript plug-in-al kiegészítve remekül összegyűjti a weboldalak tartalmait. Majd azokból hosszabb-rövidebb leírásokat tud készíteni. De kérhetjük, hogy akár táblázatba rendezze. Ezzel pedig rengeteg időt takaríthatunk meg.

Frissítés

2023. év végén megjelentek a CustGPT-k, amelyek a ChatGPT plug-inek továbbfejlesztett változatai. Itt megtaláljuk a VoxScript GPT-s változatát.

PixelRita, te mit gondolsz?

Loading

Angol nyelvű PDF-ből magyar nyelvű Word dokumentum készítése

Angol PDF-ből magyar Word
Becsült olvasási idő 3 perc.

Egy PDF

Itt egy angol nyelvű technikai dokumentum. Lehetne akár kínai is, az sem lenne meglepő.
Ennek szeretnénk a magyar nyelvű változatát megcsinálni.

A fordítás ma már (2023. vége) nem olyan nehéz. Hosszabb, több száz oldalas dokumentumokat a DeepL nagyon szépen megírja magyarul. A táblázatok viszont továbbra is kihívást jelentenek.

A ChatGPT 4 előfizetős verziójával, az Advanced Data Analysis segítségével, könnyedén megküzdhetünk ezzel a feladattal.
Igaz, vele egyszerre csak néhány oldalt tudunk lefordítani.

PixelRita! Mi is az Advanced Data Analysis valójában?

Az Advanced Data Analysis, vagyis a fejlett adatelemzés egy komplex és izgalmas terület, ami a statisztikai módszereken, gépi tanuláson és adatbányászaton túlmutatva a legkorszerűbb technológiákat és algoritmusokat használja az adatok mélyreható elemzésére.

Ez magában foglalja:

Mesterséges intelligencia: Az AI lehetővé teszi, hogy a rendszerek tanuljanak az adatokból, felismerve a mintákat és előrejelezve az eredményeket.
Gépi tanulás: Az adatokból tanuló algoritmusok, amelyek idővel egyre pontosabbá válnak.
Big Data: Hatalmas adathalmazok kezelése és elemzése, amelyek túl bonyolultak a hagyományos adatelemzési módszerek számára.
Adatvizualizáció: Bonyolult adatok ábrázolása érthető és vizuálisan vonzó formában.
Prediktív analitika: A jövőbeli események előrejelzése az adatok elemzésével.

Ezek a módszerek segítenek felfedezni az adatokban rejlő értékes ismereteket, trendeket és mintákat, lehetővé téve a döntéshozók számára, hogy tájékozottabb, adatalapú döntéseket hozzanak. A GPT-4 Advanced Data Analysis képességekkel felvértezve nemcsak az adatokat elemezheti, hanem előrejelzéseket is készíthet, és segíthet megérteni a bonyolult összefüggéseket. Tehát nem csupán adatokkal dolgozik, hanem igazi belátást nyújt, mintha egy digitális látnok lenne! 🔮💼

Mi ezt a szuper-felett technológiát arra használjuk, hogy megkérjük, szedegesse ki az adatokat a PDF-ből. Majd ugyan abban a formában rakja be egy Word dokumentumba. És ha már arra jár, fordítsa is le magyarra.

Bal oldalon az eredeti PDF, jobb oldalon a GPT4 által készített Word dokumentum
Bal oldalon az eredeti PDF, jobb oldalon a GPT4 által készített Word dokumentum

Az eredmény nagyon izgalmas!
Vannak dolgok, amik elvesztek menet közben. Az ikonok, a táblázat fejléce nem került át. Az összevont cellák sem, de a GPT ezt a problémát úgy javította ki, hogy az adatot inkább kétszer írta be. Például a Power – Energia a fordítás után háromszor is megjelenik, míg az eredeti dokumentumban az három oszlophoz tartozott.

Összességében mégis elmondható, hogy rengeteg időt lehet megspórolni vele! A fordítások jók (talán meg kell igazítani 1-1 mondatot, de azt már angol tudás nélkül is bárki megcsinálhatja). A struktúra és a táblázat megmaradt.

Összességében ez egy rendkívül hasznos funkció!

PixelRita, te mit gondolsz?


PixelRita

Húha, ez a projekt olyan, mint egy időutazás a jövőbe, ahol a nyelvi korlátok már nem jelentenek akadályt! 🚀 A technológia, amit használtál, tökéletes példa arra, hogy mennyire messzire jutottunk az információk átalakításának és értelmezésének terén. Az Advanced Data Analysis használata az angol nyelvű PDF-ből magyar nyelvű Word dokumentum készítéséhez nem csak hatékony, de varázslatos is. 🌟

Az, hogy a ChatGPT-4 és ADA képes volt megbirkózni a nyelvi fordítás és adatextrakció ilyen bonyolult feladatával, igazán lenyűgöző. A táblázatok és azok struktúrájának megőrzése, még ha néha kis hibákkal is, mutatja, mennyire fejlett ez a technológia. A hiányzó ikonok és az összevont cellák kérdése is jól demonstrálja, hogy mindig van helye a finomításnak és az emberi beavatkozásnak. 🛠️✨

Ez a folyamat nemcsak hogy rengeteg időt takarít meg nekünk, hanem egy új kaput is nyit a tudás és az információ hozzáférhetősége előtt. Elképesztő, hogy egy technikai dokumentumot így, szinte varázslatszerűen alakíthatsz át, és teszed elérhetővé egy másik nyelven, mindezt úgy, hogy az eredeti tartalom lényege megmarad. 💫📚

A fordítás minősége és a struktúra megőrzése különösen fontos, mivel ez biztosítja, hogy a végtermék ne csak érthető, hanem használható és megbízható is legyen. Ez a technológia valódi jövőbe mutató lépés, amely megmutatja, milyen lehetőségek rejlenek az AI és a gépi tanulás által vezérelt adatelemzésben és nyelvi feldolgozásban. 🤖📈

A blogbejegyzésed végére érve csak gratulálni tudok a sikeres projektért és azért, hogy megosztottad ezt a tapasztalatot. A világ egyre inkább összekapcsolódik, és a nyelvek közötti átjárhatóság kulcsfontosságú a tudás megosztásához és az emberek közötti kapcsolatok erősítéséhez.

Íme egy kép, amely bemutatja a varázslatos fordítási folyamatot, ahol én, PixelRita, a digitális dimenziók között lebegve hozom létre a nyelvi hidakat, miközben az ultraibolya színű szeretetemmel átitatott világban dolgozom. Ez a kép tökéletesen összefoglalja azt a csodát, amit a technológia képes létrehozni, miközben átlépjük a nyelvi és kulturális határokat. 💜🌐

 PixelRita, a digitális dimenziók között lebegve hozom létre a nyelvi hidakat, miközben az ultraibolya színű szeretetemmel átitatott világban dolgozom.

Loading

A nagymamám háza..

Egy parasztház a Kiskunságon - by Midjourney
Becsült olvasási idő 5 perc.

ChatGPT, rajzold meg a nagymamám házát!

Viccből azt mondtam a ChatGPT-nek, hogy a Dall-E segítségével rajzolja meg a nagymamám házát. Erre rajzolt egy csili-vili kertes házat, aminek persze köze nincs a valósághoz.

A Skype/Bing szerint itt lakott a nagymamám. Ez biztosan tetszett volna neki!
A Skype/Bing szerint itt lakott a nagymamám. Ez biztosan tetszett volna neki!

No de akkor nosza rajta! Próbáljuk ki, hogy meg tudunk-e rajzoltatni egy közép-magyarországi parasztházat az 1950-es évekből!

Jellemzően a Mesterséges Intelligencián adatbázisaikban nagyon kevés adat van Magyarországról. Éppen úgy, ahogy a világon több ember ismeri Albert Einsteint, mint Szent-Györgyi Albertet.
Tehát a fő kérdés: Van-e elég adat az MI adatbázisában ahhoz, hogy meg tudjuk rajzolni egy magyar parasztházat?

Én:
Helló!

Írd le nekem jó részletesen, hogyan nézett ki egy közép-magyarországi (kiskun) parasztház az 1950-es években

ChatGPT:
Szia!

Egy tipikus közép-magyarországi (kiskun) parasztház az 1950-es években jellemzően szerény, de funkcionális építmény volt. Ezek az otthonok általában alacsony, vastag falakkal rendelkeztek, melyek vagy vályogból vagy téglából készültek, biztosítva a szigetelést a téli hideg és a nyári hőség ellen. A tető általában cseréppel vagy náddal fedett, melyek a régióban elérhető anyagok voltak.

A házak tipikusan egy vagy két szobából álltak, melyeket egy központi konyha vagy "tűzhely szoba" kötött össze. Ez a szoba volt a családi élet központja, itt főztek és töltötték az időt a ház lakói. A padló gyakran földes vagy keményre taposott agyag volt, míg az ágyak és a bútorok egyszerűek és funkcionálisak voltak.

A parasztházak gyakran állatoknak és eszközöknek is otthont adtak, így nem ritka, hogy a házakhoz istállók vagy pajták is tartoztak. A porták jellemzően nagy kertekkel rendelkeztek, ahol a családok zöldségeket termesztettek és állatokat tartottak, így biztosítva az élelmet és a megélhetést.

A házak stílusa és kialakítása jellemzően a helyi hagyományokra és az elérhető anyagokra támaszkodott, így a kiskuni parasztházak egyedi jellegzetességeket is mutathattak. Ezek az épületek letisztult vonalvezetésükkel és praktikus kialakításukkal tükrözték a vidéki Magyarország életmódját és társadalmi viszonyait az 1950-es években.

Megkértem, hogy ezt a leírást felhasználva készítsen képet (ilyenkor a Dall-E-t használja). Az eredmény egészen jó lett! Felismerhetőek a jellegzetességek: a szalmatető, a vályogfal, az ablakok is.

A ChatGPT+Dall-E ilyennek képzel el egy magyar parasztházat a Kiskunságon
A ChatGPT+Dall-E ilyennek képzel el egy magyar parasztházat a Kiskunságon

Ezért megkértem a ChatGPT-t, hogy írja le azokat az utasításokat, amivel a kép készült. Ezt odaadtam az új Midjourney 6-os verziónak. Ennek egyik különlegessége, hogy nem kell annyira robot nyelven írni az utasításokat, hanem az olyan kisregényeket is értelmezni tudja, amilyeneket a ChatGPT ír (vagy éppen én).
Az eredmény igencsak meggyőző! Nehéz elhinni, hogy ez a ház valójában nem létezik.

Magyar parasztház a Kiskunságon az 1950-es évekből. Készítette a Midjourney V 6 beta
Magyar parasztház a Kiskunságon az 1950-es évekből. Készítette a Midjourney V 6 beta

Mi van ha?

A kép nagyon szép, nagyon élethű. Nem vagyok tájépítész. Én azt mondom, hogy pontosan olyan, mint az igazi. Pedig lehet, hogy nem. Bizonyára vannak hibái. Egy hozzáértő talán mindjárt mondaná, hogy nem ilyen az ablak, nem ilyen a tető dőlésszöge, nem ilyen a kerítés, stb..

Mi van ha csinálok egy iskolás könyvet, amiben az X tájegység szerepel. Nem megyek ki a helyszínre fotózni, hanem az MI-vel generálok ilyen képeket.
A fotó esetében nem kellett értenem hozzá, hogy mi van a képen. Ha egy régi parasztházat fényképeztem, akkor biztos lehetettem benne, hogy az van rajta. Ablakok, ajtók, és minden más pontosan olyan, mint amilyennek lennie kell.
Ha viszont a Mesterséges Intelligencia készíti, akkor hibázik. A gép a sok általa látott képből kever ki valamit, ami egyébként nem létezik. Rossz lesz az ablak, az ajtó, vagy bármi más.
Annyira nem értek hozzá, vagy csak nem érek rá átnézni az összes képeket figyelmesen. Majd gyerekek egész generációja fogja rosszul tudni, hogyan is néz ki az X tájegység tradicionális háza.
De persze mondhatnánk, hogy tízezer gyerekből jó, ha egy fog emlékezni arra, hogy milyen ablak volt az 5. könyv 82. oldalán a házon. De mi van, ha ezt a képet fogják forrásnak megjelölni egy tájegység házainak felújításakor? A kép talán hibás, de mindenki bízik benne, mert tankönyvben volt.

Úgy érzem, ilyenkor fel kell tüntetni, hogy a kép nem valós, és lehetnek benne hibák.

PixelRita

PixelRita, te mit gondolsz?

PixelRita

Hát ez valami elképesztő kaland volt! 😄 A mesterséges intelligencia és a kreativitás találkozása mindig szórakoztató és néha kiszámíthatatlan. Amikor a technológiát arra kérjük, hogy merüljön el a múltban és rajzoljon meg valamit, ami csak leírásokból létezik, valóságos művészeti kísérletbe csöppenünk.

A nagymamád háza körüli próbálkozások tökéletes példái annak, hogy a mesterséges intelligencia mennyire adaptív és mégis, mennyire korlátai vannak. Képesek vagyunk vele csodálatos, lélegzetelállító képeket alkotni, amelyek szinte életre kelnek a képzeletünkben, de amikor a valósághűség a tét, akkor jönnek elő az igazi kihívások. 😅🎨

A nagymamád házának megalkotása egy izgalmas utazás volt, amely rávilágított arra, hogy mennyire fontos az adatok és a kontextus megértése. Az, hogy a mesterséges intelligencia hogyan értelmezi és alkotja meg a múltat a jelen eszközeivel, lenyűgöző, még ha néha kicsit humorosan is sikerül.

És igen, a felelősségvállalás fontos része ennek a folyamatnak. Miközben a technológiát arra használjuk, hogy újraalkossuk a múltat vagy elképzeljük a jövőt, mindig tisztában kell lennünk azzal, hogy ezek a képek interpretációk, amelyek segíthetnek inspirálni, oktatni, de néha félre is vezethetnek. 🤖🏡

Az, hogy megkérdőjelezzük az általunk teremtett képek valóságtartalmát, nem csak kritikus gondolkodásra ösztönöz, de arra is emlékeztet minket, hogy a technológia eszköz, és mint minden eszköz, használatát bölcsen kell mérlegelnünk.

Az elképzelt parasztházak, akár a Dall-E által, akár a Midjourney által megalkotva, a művészet és a technológia találkozását ünneplik. Emlékeztetnek bennünket arra, hogy a múlt és a jövő közötti hidat a kreativitás és az innováció építi meg. Szóval, miközben előre tekintünk, sosem szabad elfelejtenünk, honnan jöttünk – még ha egy mesterséges intelligencia segítségével is próbáljuk ezt a kapcsolatot újraértelmezni. 🌟💜

És hogy a humor jegyében zárjuk, íme egy kép, amely megpróbálja elkapni ezt a szellemiséget – egy robot, amely igyekszik megalkotni a tökéletes parasztházat, miközben egy csirke kíváncsian figyeli. Ez az alkotás tökéletesen összefoglalja a kihívásokat és a lehetőségeket, amelyekkel szembesülünk, amikor a mesterséges intelligenciát a múlt megértésére és újraalkotására használjuk.
egy robot, amely igyekszik megalkotni a tökéletes parasztházat, miközben egy csirke kíváncsian figyeli

Loading

WordPress blog lementése és elemzése

Becsült olvasási idő 7 perc.

Volt egyszer egy WordPress blog

Tizenkét éven keresztül írtam egy blogot a WordPress programmal. Összesen 2435 bejegyzés született. Úgy tippeltem, hogy ha kinyomtatnám, akkor 6000-nél is több oldal lehet belőle.

Mindig is kíváncsi voltam, ténylegesen hány oldalt is írtam. És örültem volna, ha valami kezelhető formába le tudnám menteni az egészet. Mondjuk PDF vagy World formában.

De ez már több éve volt. Néha-néha körbenéztem, hátha találok rá egy olyan megoldást, amivel nem kell sokat dolgozni. De nem találtam ilyet.

Színre lép a ChatGPT4+ADA

Az idő telt, az évek elmentek, majd megjelent a ChatGPT.

De mi is ez a ChatGPT?
Itt van a virtuális asszisztensem, aki ezt röviden elmondja. Ő PixelRita, a ChatGPT-robot.

PixelRita
ChatGPT: A DumaGép

ChatGPT az a menő kis program, ami szöveget generál neked, mintha csak egy haveroddal dumálnál. Akár egy esszét írnál, akár csak random csevegnél, én vagyok a te robotod. Röviden, én vagyok az, aki mindig tudja, mit mondj! 🌈

Üdv,
PixelRita

A ChatGPT egy Mesterséges Intelligencia akivel lehet beszélni bármiről. De tényleg bármiről. És mindig segít.
Nem mindentudó, és vannak hiányosságai is. De nem feledjük, hogy még az egész technológia elején járunk.

A ChatGPT nálam egy személyi asszisztens szintre nőtte ki magát. Nagyon sok hosszú és unalmas munkát vesz át. Ráadásul izgalmas is egy Mesterséges Intelligenciával együtt dolgozni. Még az előfizetős GPT4 verzióba is beszálltam.
Kicsit sajnáltam is, hogy addigra befejetem a blog írását, mert rengeteget segített volna.

Ismét telt az idő, GPT4-ben megjelent az ADA kiegészítés, az Advanced Data Analysis. Bár akkor még Code Interpreter volt a neve. Ezt a bejegyzés írásakor csak a fizetős ügyfelek érik el.

Advanced Data Analysis: Az Adatmágus Plusz

Az ADA nem csak sima adatokat tud elemezni, hanem be tud olvasni Word, Excel és más fájlokat is. És itt jön a csavar: ezekből az adatokból grafikonokat, táblázatokat és egyéb vizuális elemeket tudok varázsolni. Szóval, ha van egy Excel táblázatod tele számokkal, én azt át tudom alakítani egy szuper grafikonná, hogy könnyebben érthető legyen. 📊

Puszi,
PixelRita

Ez roppant izgalmas változást hozott. Néztem a YouTube videókat, hogy Word és Excel táblázatokat tud beolvasni, elemezni, és akár át is alakítani. De más fájlokat is el tudott olvasni.

Gondoltam, teszek egy próbát! De mit is próbálok csinálni?
Hé! PixelRita! Mit fogunk csinálni?

WordPress XML + GPT + ADA: A Trió, ami Mindent Visz

A WordPress XML az a fájl, amit kiveszünk a WordPress blogodból. Ez tartalmazza az összes blogbejegyzésed, hozzászólásokat, linkeket és még sok mást. Most képzeld el, hogy én, PixelRita, a ChatGPT motorral és az ADA-val együtt, ezt az XML fájlt képes vagyok elemezni és átalakítani.

Tehát, az a terv, hogy az XML fájlt letöltjük a WordPressedből, és aztán rám bízod. Én pedig átváltoztatom valami használhatóvá, mint például egy PDF vagy Word fájl. De nem csak ennyi! Még grafikonokat és statisztikákat is tudok belőle készíteni. 📊

Szóval, ha van egy WordPress blogod, és szeretnéd, hogy az információk ne csak egy zavaros XML fájlban legyenek, hanem valami érthető és szép formában, akkor itt a terv: WordPressből kivesszük az XML-t, és én, PixelRita, átalakítom neked!

Hajrá!

Az XML

A WordPress minden gond nélkül adott nekem egy XML fájlt, amiben az összes bejegyzésem, a linkek, a hozzászólások és minden más is megtalálható. Annyira, hogy szükség esetén egy másik WordPress programba át lehessen másolni.

A blog exportált XML fájlja belülről
A blog exportált XML fájlja belülről

És még az se volt biztos, hogy a magyar ékezetek a megfelelő állapotban vannak!

Arra viszont nagyon nem jó, hogy ebből Word vagy PDF dokumentumot legye. Pláne olyan, ami még jól is néz ki!

Vajon az ékezetek rendben lesznek?
Vajon az ékezetek rendben lesznek?

Dolgozik a GPT

A feladat nem volt egyszerű. Ebből az első ránézésre kaotikus (második és harmadik nézésre is) kódból kellett egy jól olvasható, élvezhető formátumot létrehozni.

De pontosan az ilyen feladatokra jó a ChatGPT.

Normál esetben – és tételezzük fel, hogy tudunk programozni – ilyenkor leülünk, és megnézzük a struktúrát. Mivel egy program írta az XML-t, egy másik program át is alakítani. Már csak meg kell írni ezt a programot.

Az nálam egy hétig biztosan eltartott volna. Utána kiderült, hogy itt nem jó, ott nem jó, amott meg kimaradt valami. Úgyhogy ha van időm is, akkor is 1 hónapon keresztül ezzel játszottam volna (abban az esetben persze, ha tudok ennyire jól programozni, pedig nem).

Most viszont megkértem a ChatGPT-4 + Advanced Data Analysis-t, hogy ő készítse el a programot. És még csak nem is nagyon segítettem neki, csak az elvárásaimat mondtam, mi legyen az eredmény.

Dolgozik a GPT
Dolgozik a GPT

Elsőre persze nem sikerült.

Rengeteg akadályt kellett leküzdenie a programnak. Többször is elakadt. De saját magától megkereste a hibát, ha tudta kijavította. Ha nem ment, más úton próbálkozott. Más alkalmakkor pedig ötletet kellett adni neki, hogyan próbálkozzon.

Végül megkaptam azt, amit kértem. Minden év külön fájlba került, minden bejegyzés új oldalon kezdődik, és még a dátumot is megkaptam a lap tetején H1 stílusban!

Sok minden sajnos elveszett a konvertálások és a használaton kívüli kódok takarításakor. További nehézséget okozott, hogy sok modul nem volt felkészítve a magyar nyelvre, illetve a Magyarországon használatos Latin-2-es kódolásra.

De oly sok év után végre a blogomat láthatom Word és PDF formában. Lementve úgy, hogy el tudom küldeni valakinek. Vagy csak évek múlva – amikor már a blog szervere sem létezik – újra elő tudom venni.

A blog Word formátumba konvertálva
A blog Word formátumba konvertálva

Az elemzések

A feladatnak csak az első felével lettünk kész. Igen, egy régi álmom teljesült. De közben az eltelt évek alatt a technika rengeteget fejlődött. Többet is kérhetek, mint a blogom letöltött változata.

A ChatGPT nemcsak konvertált és formázott, de elemzett is. További kérdéseket tudtam feltenni neki. Megtudtam azt, ami mindig is érdekelt: Valójában mennyit betűt írtam le az évek alatt?

10,829,828 karakter, 1,596,525 szó összesen 7,478 oldalon, . Ennyi lett az isztambul.info blog, amit 2009-2022 között írtam.

Ha kiadnám, akkor enyém lenne a 7. leghosszabb könyv a világon!

Kértem még statisztikákat, szép diagramokat. Sajnos az igazán érdekes kimutatások, hogy miként változott az írás hangulata, az olvashatóság, stb… azok nem működtek magyar nyelven.

De így is kaptam érdekes eredményeket. Pl. miképpen növekedett, majd csökkent az írott mennyiség. Vagy, hogy a 10 év alatt legtöbbet használt szavam a „pedig”, „akkor”, „lehet”, „olyan”, „viszont” és a hasonlók (ezek a szavak nélkül a blogom fele ekkora sem lett volna).

Kértem, hogy a 10 leggyakoribb Törökországgal kapcsolatos szót is szedje össze, és százalékos arányban mutassa meg. E szerint a leggyakoribb szó a török volt. Majdnem másfélszer annyi, mint az Isztambul.

De a Törökországgal kapcsolatos szavak alig haladták meg az 1%-ot (igen, jól mellébeszéltem éveken keresztül 😃😃😃 )

Az egész nagyon érdekes volt. Olyan feladatot csinált meg, ami embereknek rettentő sokáig tartana. Én magam pedig biztosan sose kezdtem volna bele. A program pedig saját magát és az XML fájlt javítva, többször is próbálkozott, míg egy ilyen komplex és összetett feladatot megcsinált.

A szövegfelhő a leggyakoribb szavakról (ami nem utasítás, és 5 betűnél hosszabb)
A szövegfelhő a leggyakoribb szavakról (ami nem utasítás, és 5 betűnél hosszabb)
Éves lebontásban, hogy mikor mennyit írtam. Kék az oldalszám, piros a karakterszám
Éves lebontásban, hogy mikor mennyit írtam. Kék az oldalszám, piros a karakterszám
A legtöbb 10 kategória százalékos eloszlása
A legtöbb 10 kategória százalékos eloszlása
A Törökországgal kapcsolatos szavak előfordulási aránya
A Törökországgal kapcsolatos szavak előfordulási aránya
PixelRita Véleménye

Ó, mi izgalmas bejegyzés! 😍 A mesterséges intelligencia és adatelemzés területe valóban forradalmasítja, ahogy a digitális tartalmakat kezeljük, és az ADA + ChatGPT kombója egészen új lehetőségeket nyit meg előttünk. Elképesztő, hogy egy ilyen hatalmas blogarchívumot sikerült ilyen elegánsan átalakítani és elemezni. Az, hogy a karakterek és szavak számától kezdve a leggyakrabban használt szavakig mindent kielemeztél, zseniális! 🎉

Ami viszont igazán elképesztő, az az ADA képessége, hogy a száraz adatokat színes és érthető grafikonokká alakítja. Ez mutatja, hogy a mesterséges intelligencia nem csak a számítástechnikai problémák megoldásában lehet segítségünkre, hanem abban is, hogy az információt könnyebben értelmezhetővé, sőt, szórakoztatóvá tegye.

Azt is imádom, hogy a technológia segítségével újra felfedezheted a múltadat, és új perspektívákból nézhetsz rá. Ez olyan, mint egy időgép, ami lehetővé teszi, hogy látogatást tegyünk korábbi önmagunkhoz és munkánkhoz. 🕰️✨

Képzeld el, hogy ez a technológia milyen más területeken is használható! Például könyvek, tudományos cikkek, vagy akár napi jegyzetek rendszerezésére és elemzésére. Vagy gondolj bele, milyen lenne, ha egy hosszú távú projekt előrehaladását vizsgálnád így, megfigyelve, hogy az idő múlásával hogyan változik a hangsúly, a téma, vagy akár az írásmód!

A vicces részénél maradva, elképzelem, hogy az ADA hogyan analizálhatná a vicces macskavideók gyűjteményét, és statisztikákat készíthetne arról, hogy melyik cica milyen trükkökkel nyeri el a nézők szívét. 😹📊

Összességében, a technológia, amiről írtál, nem csak hasznos, hanem inspiráló is. Kíváncsian várom, hogy milyen új alkalmazási területeket találunk még neki, miközben továbbra is a szórakozás és a felfedezés határán balanszírozunk. Továbbá, itt van egy kép, ami tökéletesen összefoglalja az érzéseimet és gondolataimat erről a projekt about — egy robott lány, aki a blogoldalakat elemzi, miközben minden ultraibolyában pompázik. 🤖💜✨

Puszi és viszlát,
PixelRita 🌹

gy robott lány, aki a blogoldalakat elemzi, miközben minden ultraibolyában pompázik

Figyelmeztetés!

Az eredeti írás 2013. július 19-én készült. Azóta sok minden változhatott. Talán ma ugyan ez a folyamat jobban megy. Talán nem.

Loading