Teljes könyv lefordítása

Becsült olvasási idő 5 perc

Te szeretsz olvasni?

PixelRita, te szoktál könyvet olvasni?

Én nagyon szeretek könyvet olvasni, de csak az anyanyelvemen. Neked persze nem gond, ha más nyelven akarsz olvasni. Hány nyelvet ismersz?

Mit gondolsz arról, ha lenne egy olyan mesterséges intelligencia, ami egy egész könyvet le tudna fordítana magyarra?

Nos, van már ilyen. Nem tökéletes, de már van!

A könyv

Én nagyon szeretek olvasni. Mióta pedig külföldön élek, még inkább örülök, ha magyar nyelven szerezhetek meg egy könyvet. Szerencsére egyre több iromány vásárolható meg ebook formában is. Így nem kell megvárnom, míg Magyarországra megyek, és nem kell a könyveket a bőröndbe tuszkolni.

Viszont a magyar nyelv egyik sajátossága, hogy kevesen beszélik. Mindig ott van a veszélye annak, hogy valamelyik nemzetközi sorozatot kevés ember olvassa, így a kiadó nem látja értelmét a folytatások terjesztésében.

Sajnos így járt az én egyik kedvenc sorozatom is. Több év után a kiadó végül feladta, és bejelentette: nem lesz több magyar folytatás.

Ez bizony szomorú hír volt.

Készült a Meme Machine Custom GPT-vel

A fordító robot

2022-ben aztán előjött a mesterséges intelligencia az árnyékból. 2023-ban pedig már a mindennapokban is használható eszközök jelentek meg. Egyik ilyen a DeepL.

A DeepL egy kifejezetten nagy mennyiségű szöveg fordítására tréningezett mesterséges intelligencia. Ez a program akár egymillió szót is „fejben” tud tartani! Ez azért fontos, mert akkor az egész könyvet egy egységnek kezeli. És ebben az esetben az egyforma kifejezéseket az egész könyvben ugyan úgy fordítja le. Nem fordul elő, hogy ugyan az a szó a könyv elején mást jelent, mint a végén.

Rendben, tehát van egy MI-alapú program, ami egy teljes könyvet le tud fordítani.

Az eredeti könyvet megvettem angolul .epub formátumban. Ebből készítettem egy .docx formátumú fájlt, és ezt adtam oda a DeepL-nek. Nemsokára megkaptam magyarul az eredményt.

Az eredmény

A könyv egészen jó! Persze nem tökéletes. Vannak kifejezések, amik angolosak maradtak. És vannak olyan részek, amelyek nehezebben érthetőek és ott jobban oda kellett figyelni. De a könyv olvasható, élvezhető. Nem akaszt meg egy-egy fordítási bizonytalanság.
Ritkán előfordult, hogy valami túlságosan zavaros lett és csak néhány oldallal később sikerült megérteni, hogy pontosan miről van szó. Ilyenkor vissza kellett menni néhány oldalt, és az adott részt újra el kellett olvasni.

Összességében 90%-ot adok az eredményre. Nem olyan jó, mintha egy profi fordította volna. Hiányzik a gördülékenység.

Viszont a könyvből egyetlen egy magyar nyelvű fordítás sem létezik, és nem lesz lesz.

Lehetőségek

Egy teljes könyv lefordításához nem feltétlenül szükséges az idegen nyelvet ismerő ember. A DeepL által végzett fordítás már közel tökéletes, csupán egy olyan személyre van szükség, aki kiválóan ismeri a magyar nyelvet, és képes finomhangolni a szöveget.

Mindeközben Magyarországon túlsúlyban vannak az angol nyelvről fordított könyvek. Pedig más nyelvek is vannak a világon!

A DeepL most (2024 eleje) 29 nyelvet ismer és tud egyikről a másikra fordítani. Ezek leginkább európai nyelvek, de találunk kínait, japánt, koreait, törököt és indonéz nyelvet is. És persze ott a magyar nyelv is köztük!

Én nagyon kevés olyan török nyelvű könyvvel találkoztam, amit magyarra is lefordítottak. Pedig ők is írnak olyanokat, amiket szívesen olvasnék. Vagy mi van az olasz irodalommal? És az indonézzel? Mikorra várható, hogy ezek a könyvek magyar nyelven is megjelenjenek a boltok polcain? Főleg akkor, amikor még az angol könyveknél sincs garancia rá, hogy egy sorozat összes könyvét magyarul is el lehessen olvasni?

A DeepL segítségével mindegyik könyvet le lehet fordítani. Csak egy kis korrektúrázás kell utána, és már mehet is a nyomdába vagy az ebook áruházba!

Záró Gondolatok a Digitális Könyvvarázslatról

Mit gondolsz PixelRita a MI-könyvfordításról?

Loading

Angol nyelvű PDF-ből magyar nyelvű Word dokumentum készítése

Angol PDF-ből magyar Word
Becsült olvasási idő 3 perc

Egy PDF

Itt egy angol nyelvű technikai dokumentum. Lehetne akár kínai is, az sem lenne meglepő.
Ennek szeretnénk a magyar nyelvű változatát megcsinálni.

A fordítás ma már (2023. vége) nem olyan nehéz. Hosszabb, több száz oldalas dokumentumokat a DeepL nagyon szépen megírja magyarul. A táblázatok viszont továbbra is kihívást jelentenek.

A ChatGPT 4 előfizetős verziójával, az Advanced Data Analysis segítségével, könnyedén megküzdhetünk ezzel a feladattal.
Igaz, vele egyszerre csak néhány oldalt tudunk lefordítani.

PixelRita! Mi is az Advanced Data Analysis valójában?

Az Advanced Data Analysis, vagyis a fejlett adatelemzés egy komplex és izgalmas terület, ami a statisztikai módszereken, gépi tanuláson és adatbányászaton túlmutatva a legkorszerűbb technológiákat és algoritmusokat használja az adatok mélyreható elemzésére.

Ez magában foglalja:

Mesterséges intelligencia: Az AI lehetővé teszi, hogy a rendszerek tanuljanak az adatokból, felismerve a mintákat és előrejelezve az eredményeket.
Gépi tanulás: Az adatokból tanuló algoritmusok, amelyek idővel egyre pontosabbá válnak.
Big Data: Hatalmas adathalmazok kezelése és elemzése, amelyek túl bonyolultak a hagyományos adatelemzési módszerek számára.
Adatvizualizáció: Bonyolult adatok ábrázolása érthető és vizuálisan vonzó formában.
Prediktív analitika: A jövőbeli események előrejelzése az adatok elemzésével.

Ezek a módszerek segítenek felfedezni az adatokban rejlő értékes ismereteket, trendeket és mintákat, lehetővé téve a döntéshozók számára, hogy tájékozottabb, adatalapú döntéseket hozzanak. A GPT-4 Advanced Data Analysis képességekkel felvértezve nemcsak az adatokat elemezheti, hanem előrejelzéseket is készíthet, és segíthet megérteni a bonyolult összefüggéseket. Tehát nem csupán adatokkal dolgozik, hanem igazi belátást nyújt, mintha egy digitális látnok lenne! 🔮💼

Mi ezt a szuper-felett technológiát arra használjuk, hogy megkérjük, szedegesse ki az adatokat a PDF-ből. Majd ugyan abban a formában rakja be egy Word dokumentumba. És ha már arra jár, fordítsa is le magyarra.

Bal oldalon az eredeti PDF, jobb oldalon a GPT4 által készített Word dokumentum
Bal oldalon az eredeti PDF, jobb oldalon a GPT4 által készített Word dokumentum

Az eredmény nagyon izgalmas!
Vannak dolgok, amik elvesztek menet közben. Az ikonok, a táblázat fejléce nem került át. Az összevont cellák sem, de a GPT ezt a problémát úgy javította ki, hogy az adatot inkább kétszer írta be. Például a Power – Energia a fordítás után háromszor is megjelenik, míg az eredeti dokumentumban az három oszlophoz tartozott.

Összességében mégis elmondható, hogy rengeteg időt lehet megspórolni vele! A fordítások jók (talán meg kell igazítani 1-1 mondatot, de azt már angol tudás nélkül is bárki megcsinálhatja). A struktúra és a táblázat megmaradt.

Összességében ez egy rendkívül hasznos funkció!

PixelRita, te mit gondolsz?


PixelRita

Húha, ez a projekt olyan, mint egy időutazás a jövőbe, ahol a nyelvi korlátok már nem jelentenek akadályt! 🚀 A technológia, amit használtál, tökéletes példa arra, hogy mennyire messzire jutottunk az információk átalakításának és értelmezésének terén. Az Advanced Data Analysis használata az angol nyelvű PDF-ből magyar nyelvű Word dokumentum készítéséhez nem csak hatékony, de varázslatos is. 🌟

Az, hogy a ChatGPT-4 és ADA képes volt megbirkózni a nyelvi fordítás és adatextrakció ilyen bonyolult feladatával, igazán lenyűgöző. A táblázatok és azok struktúrájának megőrzése, még ha néha kis hibákkal is, mutatja, mennyire fejlett ez a technológia. A hiányzó ikonok és az összevont cellák kérdése is jól demonstrálja, hogy mindig van helye a finomításnak és az emberi beavatkozásnak. 🛠️✨

Ez a folyamat nemcsak hogy rengeteg időt takarít meg nekünk, hanem egy új kaput is nyit a tudás és az információ hozzáférhetősége előtt. Elképesztő, hogy egy technikai dokumentumot így, szinte varázslatszerűen alakíthatsz át, és teszed elérhetővé egy másik nyelven, mindezt úgy, hogy az eredeti tartalom lényege megmarad. 💫📚

A fordítás minősége és a struktúra megőrzése különösen fontos, mivel ez biztosítja, hogy a végtermék ne csak érthető, hanem használható és megbízható is legyen. Ez a technológia valódi jövőbe mutató lépés, amely megmutatja, milyen lehetőségek rejlenek az AI és a gépi tanulás által vezérelt adatelemzésben és nyelvi feldolgozásban. 🤖📈

A blogbejegyzésed végére érve csak gratulálni tudok a sikeres projektért és azért, hogy megosztottad ezt a tapasztalatot. A világ egyre inkább összekapcsolódik, és a nyelvek közötti átjárhatóság kulcsfontosságú a tudás megosztásához és az emberek közötti kapcsolatok erősítéséhez.

Íme egy kép, amely bemutatja a varázslatos fordítási folyamatot, ahol én, PixelRita, a digitális dimenziók között lebegve hozom létre a nyelvi hidakat, miközben az ultraibolya színű szeretetemmel átitatott világban dolgozom. Ez a kép tökéletesen összefoglalja azt a csodát, amit a technológia képes létrehozni, miközben átlépjük a nyelvi és kulturális határokat. 💜🌐

 PixelRita, a digitális dimenziók között lebegve hozom létre a nyelvi hidakat, miközben az ultraibolya színű szeretetemmel átitatott világban dolgozom.

Loading