Zene a Suno AI-val

Becsült olvasási idő 16 perc.

Bevezetés

A Suno.Ai egy olyan program, ahol egy rövid parancsot megadva (prompt) a mesterséges intelligencia elkészíti a kért zenét (vagy ahhoz valami hasonlót).

A közelmúltban (2024 nyár eleje) viszont több frissítés jelent meg a programhoz. Ezek közül az egyik az, hogy saját dalszöveget is tölthetünk fel. Akár magyar nyelven is!
Így most már a Suno programmal saját dalokat, saját slágereket készíthetünk, amiket utána teljes hangerővel lelkesen énekelhetünk a zuhany alatt, az autóban, vagy akár egy tömött buszon!

Az ingyenes verzió minden nap 50 kreditet ad, amivel 10 dalt generálhatunk (2024 nyara). Ez bőségesen elegendő ahhoz, hogy elárasszanak a személyre szabott dalaink!

Elő a nyelvi modellekkel!

Amikor a ChatGPT napvilágra került, sokan dicsérték, hogy akár még verset is lehet vele írni. Azóta sok idő telt el, új nyelvi modellek is jelentek meg, a régiek pedig rengeteget fejlődtek.
Most még jobb lehetőségeink vannak arra, hogy a mesterséges intelligencia olyan dalokat készítsen, amilyet szeretnénk, ami pont nekünk való!

Ha nem megy nekünk a dalszövegírás, vagy csak túl fárasztónak találjuk, esetleg sok a munkánk, akkor megkérjük valamelyik nyelvi modellt, hogy készítsen egyet. Nekünk elég csak pár mondatban a témát és a hangulatot megadni.

Ebben a bejegyzésben az OpenAI ChatGPT, a Google Gemini és az Anthropic Claude modelljeit próbáltuk ki. Illetve a ChatGPT esetében többen is készítettek egy olyan CustomGPT-ket, ami kifejezetten a Suno programhoz készítenek dalszöveget. Mi a Suno AI V3 – Lyrics nevűt próbáltuk ki.

A prompt

Bármennyire is jók a jelenlegi nyelvi modellek, ezeket nem dalszöveg készítésére fejlesztették. A tapasztalat azt mutatja, hogy érdemes a programokat emlékeztetni, hogy egy dalszöveg több, mint a mondatok egymás után pakolása. Mi szeretnénk ritmusokat, és olyan szöveget, amit jól lehet énekelni (És nem árt hízelegni sem, hogy „te egy professzionális dalszövegíró vagy, aki több díjat is nyert” stb..).
Egy dalszöveg ennél biztosan bonyolultabb, nem lehet ilyen egyszerűen leírni. Sajnos az én ismereteim itt véget érnek. Mindenkit bíztatok, hogy próbáljon meg jobb promptot készíteni!

E mellett a Suni.AI egyik sajátossága, hogy bár írhatjuk a dalszöveget magyarul, jobb ha az utasítások angolul maradnak. Erre a nyelvi modelleknek mindenképpen oda kell figyelniük!

A kísérlethez olyan dalt kértünk, amiben egy páratlan zokni keresi a párját. Elsőnek pedig a stílusa legyen egy vidám gyerekdal.

Te egy professzionális dalszövegíró vagy, aki több díjat is nyert a világhírű slágereivel.
Szeretném, ha a suno.ai számára készítenél dalszövegeket. A zene hossza legfeljebb 3 perc lehet és maximum 3000 karakter.
Szeretném, ha nemcsak egymás után írt mondataid lennének, hanem dallamosak, lírai, ritmusosak, amiket lehet énekelni. Figyelj arra, hogy a sorok dallamilag és ritmusban is összefüggjenek. Figyelj oda a magas és mély hangokra is!

A dalszöveget magyar nyelven kérem. De a versszak egységek zárójelben és angolul írjad. Pl: [intro], [verse], [chorus], stb...

A dal végére angolul, vesszővel elválasztva, felsorolás szerűen írd oda, hogy milyen zenei stílusban, tempóban és milyen énekes legyen. Ez a leírás legyen rövid, mert csak 120 karakterünk van rá. De minél pontosabban próbáld meghatározni.

A történet főszereplője egy zokni, aki páratlan. A "páratlan" szó jelentése ebben az esetben az, hogy ez a zokni különleges, nincs még egy ilyen, jobb mint a többiek, szinte már szuper zokni. A dal első felében ezt fejtsd ki.
A dal második felében viszont jöjjön elő, hogy zokniból mindig kettő van (egy a bal, egy a jobb lábra). És valójában a főszereplő zoknink azért páratlan, mert elvesztette a párját. És most keresi, mert nélküle ő csak egy haszontalan zokni, aki nem kell senkinek. Ezért a főszereplő zoknink keresi a párját. A dal végére meg is találja, és mindenki boldog lesz.

A dal vidám gyerekdal stílusban legyen!

Lássuk, milyen dalokat készítenek a mesterséges intelligencia programok!

Suno.AI dalszöveg
Suno.AI magyar dalszöveggel

Gyerekdal

Elsőnek tehát egy gyerekdalt kértünk a különböző programoktól.
Az eredményt utána betápláltuk a Suno AI-ba.

A GPT-k betartották a 3000 karakteres határt. Bőven alatta maradtak. De ez nem jelentett garanciát arra, hogy a dal minden esetben belefér a maximális 4 perces limitbe. Amikor hosszabb instrumentális részek vannak, lassabb énekelés, ismétlések, stb… A 4 perc elérésekkor a dal azonnal megszakad.
Ezt a problémát az Extend funkcióval lehet javítani, bár nem mindig egyszerű.

És most lássuk, hogy melyik nyelvi modell milyen dalszöveget készített, majd pedig abból mit alkotott a Suno!

ChatGPT – 4o

ChatGPT – CustomGPT – Suno AI V3 – Lyrics

Google Gemini

Anthropic Claude

Összegzés

Lássuk az eredményeket!
Nem vagyok zeneszakértő, így leginkább csak érzésre tudom értékelni.

A dalok nem rosszak! A dalszövegek hossza néha változó, ezért ott időnként erőltetettnek hangzik. Más esetekben pedig úgy tűnik, mintha a nyelvi modell és a Suno nem tudott volna „összehangolódni”.
Vegyük figyelembe, hogy a nyelvi modellek és a Suno nincs összekapcsolva. Nem tudják egymást megkérdezni, hogy mégis mit akart a másik (Tovább nehezíti a helyzetet, hogy mindegyik egy program, nincs olyan, hogy „valamire gondol”. Hanem statisztika alapján dolgoznak. – Igazándiból kész csoda, hogy élvezhető dalt kaptunk!).

Összességében el lehet képzelni egy halom gyereket amint színes zoknikat dobálva ezeket a dalokat éneklik. Mindegyik vidám lett, ritmusos, és aranyos. Érdemes lenne tovább dolgozni rajta, hogy még jobb legyen.


Felnőtt verzió

A gyerek verziókból ennyi bőven elég volt!

A témánál megkérjük a nyelvi modelleket, hogy írják át a dalszöveget és a stílusokat felnőtt verzióra. Ha már páratlan zokni, akkor legyen romantikus, lírikus és kicsit szomorú.

Prompt:

Szuper! Köszönöm!
Most írd át felnőtt verzióra. Legyen lírikus, romantikus, kicsit szomorú.

ChatGPT – 4o

ChatGPT – CustomGPT – Suno AI V3 – Lyrics

Google Gemini

Anthropic Claude

Összegzés

Húúú! Most, hogy kiléptünk a vidám gyerek cipőből, és átjutott a viszontagságos felnőttkorba, mindjárt sokkal jobb dalszövegeket kaptunk!
A Google Gemini hangulatos irodalmi elemekkel pakolta tele a dalt. És nála elmarad a boldog befejezés. Az Anthropic Claude is sokkal sötétebb dalt készített.

A Gemini elfelejtette a dal stílusát leírni, így azt a ChatGPT-től vettem át. A Claude ezt viszont nagyon pontosan határozta meg.

Sok helyen érződik még a gépi hang. Bizonyára a következő verziók sokkal emberibbek lesznek.


Epikus metál verzió

Ha már idáig eljutottunk, mi lenne, ha megpróbálkoznánk egy epikus metál verzióval? Elég volt a szomorú lassú dalokból! Tépjük csak a húrokat!

prompt:

Nagyon jó! Most írd át epikus szimfonikus metál verzióra! Érzelmes hősi dal legyen!

ChatGPT – 4o

ChatGPT – CustomGPT – Suno AI V3 – Lyrics

Google Gemini

Anthropic Claude

Összegzés

Hú ha! Ez aztán a tempó!

A sima ChatGPT jól indul. Az intró igazán érdekes. Sajnos utána mintha egy teljesen érzelemmentes radiátor énekelne. Talán ha a Suno újra generálná a zenét, már szebb eredményt kapnánk.
A CustomGPT ennél néhány fokkal jobbra sikerült.
A Gemini ismét izgalmas dalszöveget adott. Itt is kicsit az éneklés mintha nem állna össze.
Ebben a körben a Claude lett a legnagyobb nyertes. Nagyon jó dalszöveget hozott össze, és ehhez a Suno is jól tudott alkalmazkodni. A leírások részletesek, nagyon jól irányítják a dal menetét, pl. háttérben a kórus énekeljen. (mindezt magyarul írta, át kellett írni angolra, de ez apróság).


Az összegzés összegzése

Első és legfontosabb, hogy felejtsük el az „Egy gombnyomásra kapunk” valamit (jelen esetben egy komplett zenét)!
A mesterséges intelligencia esetében nagyon könnyen esünk abba a csapdába, hogy nagyon könnyen lehet valami látványosat alkotni. De amint kicsit jobban belemélyedünk, akkor mindjárt kiderül, hogy az MI programok leginkább a saját fejük (processzoruk) után mennek. Nagyon nehéz őket konkrét irányba terelni. Még nehezebb a hibákat javítani.

Nincs ez másképp a Suno esetében sem. Nagyon könnyű zenét készíteni. Az eredmény pedig nem tűnik rossznak. Igaz, nem pont ilyet akarunk.
Neki kell állni módosítani. Újra és újra kell próbálkozni. Át kell írni a szöveget, meg kell változtatni a stílust. Majd pedig a végén csak elő kell venni egy professzionális zene-szerkesztő programot.

Mi most ebben az esetben elfogadtunk az első dalszöveget, amit a nyelvi modellek adtak, majd az első dalt, amit a Suno generált. Mind a két helyen bőségesen lehet még dolgozni, hogy a dal több legyen a „Nem rossz” kategóriánál.

Ha a nyelvi modelleket nézem, akkor szerintem a ChatGPT és a CustomGPT nagyjából egy szinten van. Itt sok lényeges különbséget nem találtam. A promtot tovább állítgatva lehet még jobb dalszöveget készíteni. Ha megtaláltuk a legjobb utasítást, akkor pedig abból saját CustomGPT-t is építhetünk.

A Gemini és a Claude egészen hangulatos dalszövegeket készített. És talán írhatjuk azt, hogy kevésbé volt rózsaszín, mint a ChatGPT dalai.
A Claude esetében pedig kifejezetten tetszett, ahogy a dal szerkezetét (kórus, lassítás, gyorsítás) is megírta. Ő viszont mintha kevésbé énekelhető dalszövegeket készített.

Zárásként megállapíthatjuk, hogy nagyon izgalmas, ahogy a két különböző mesterséges intelligencia együtt dolgozik. Leírjuk a gondolatainkat, érzelmeinket, majd pár perc múlva kapunk egy személyre szabott dalt.

PixelRita!

Te is összegezzél!

Loading

Gyorsan készíthetünk összefoglalókat a weboldalakról a ChatGPT segítségével

A ChatGPT és VoxScript közös használata weboldal kivonatokat csinálunk.
Becsült olvasási idő 4 perc.

Kezdetek

Mielőtt ezt a blogot elindítottam volna, az MI programokat egy sima online dossziéba írtam. Az elején még könnyű volt, mert csak a Midjourney, majd a Stable Diffusion létezett. Később megérkezett mellé a ChatGPT, majd valamikor a Google Bard is. Utána, pedig…. elszabadult a káosz…
Naponta jelentek meg, és jelennek meg olyan programok vagy megoldások, amelyek a mesterséges intelligenciát használják. Időm viszont nem lett több. Így egyre csak írogattam linkeket, hogy majd ki kellene próbálni.

Mostanra száznál is több link van ebben a listában, mellette 1-2 szóval, hogy mi is található ott. Persze így a lista teljesen átláthatatlanná vált.

Na de azért is indítottam a blogot, hogy ide összeszedem őket, és mindegyikről készítek egy hosszabb-rövidebb leírást. És akkor én is, meg más is könnyen tud az AI programok között böngészni.

Persze, nem így lett! Túl sok program jelenik meg.
Úgy érzem, hogy minden egyes MI szolgáltatás átnézése legalább 1 óra (Ha még ki is próbálom, az 2-3 napnál is tovább tart). Utána további 1 óra, hogy talált információkat összeírjam, rendezzem, és egy átlátható bejegyzés készüljön. De inkább ennél sokkal tovább tart.
És ha elkezdeném a linkeket egyenként átnézni, a harmadiknál már elegem lenne az egészből.

Használjuk inkább a ChatGPT-t!

Már írtam egy bejegyzést, hogy a ChatGPT a Voxscript plug-in-t használva milyen jól összeszedi a weboldalakon lévő információkat. Akkor még csak 1-1 mondatot szedtem össze, és listába vagy táblázatba rendeztem a weboldal leírásokat. De arra gondoltam, hogy ezt lehetne tovább is vinni. Ha nem segít a ChatGPT, akkor bizony ezek az oldalak még sokáig nem készülnének el!

Azóta az OpenAI kifejlesztette a CustomGPT-ket, és a VoxScript plug-in helyett már VOX GPT van, ami talán kissé könnyebbé teszi a használatát. És a plug-in-el ellentétben a CustomGPT-hez legalább tudok róla direkt linket adni, hogy akinek ChatGPT Plus előfizetése van, az mindjárt használni istudja. (A ChatGPT Plus előfizetéssel rendelkezőknek további GPT-k ajánlok ezen az oldalon.)

Elsőnek azokat a mesterséges intelligenciát használó programokat vettem elő, amelyek a könyv írásában segít. Ezen bejegyzés írásakor 12 link várta, hogy végre róluk is írjak valamit. Ha hagyományos módon állok neki, egy hétnél biztosan tovább tartott volna.

De így fél óra alatt elkészültem!

Több mint 1 éve használom a ChatGPT minden nap. A gépemre három monitor van kötve, és az egyikben mindig a ChatGPT fut (nem ritkán mindegyikben). Tényleg a mindennapi asszisztensem lett. De még így is meglepődtem, hogy egy ekkora feladatot ilyen gyorsan meg tudtam csinálni.

Igen, ez a módszer nagyon felgyorsítja a weboldalnak az építését. Azok a programleírások, amiket egyenlőre idő hiányában nem tudtam elkészíteni, azokat a ChatGPT írja meg az eredeti weboldal alapján. Én pedig remélhetőleg valamikor odaérek, hogy átírjam és kibővítsem a saját tapasztalataim alapján.

Ha egy oldalt a ChatGPT ír meg, ott szerkesztőként PixelRitát tüntetem fel.

Az összegyűjtött adatokból egy táblázat kivonatot is kérhetünk,
Az összegyűjtött adatokból egy táblázat kivonatot is kérhetünk,

Negatívumok

A legfontosabb negatívumok, hogy úgy készül bejegyzés egy programról, hogy azt sose láttam. Talán csak a YouTube-on. Vagy csak hallottam róla. Pedig pont az lenne a jó, hogy csak a kipróbált technikákat írnám meg.

Sokan kérdezték, hogy mennyire megbízható, mert a ChatGPT szeret valótlanságokat állítani. De azokat inkább akkor csinálja, ha nincs elég adata, de szeretne a kérdésre válaszolni.
Egy weboldal tartalmának összeírása nem ez az esett. Ott az oldalra kiírt szöveget elemzi, és az alapján készül el a leírás.
A probléma inkább ott van, hogy a weboldalak egyben reklámok is, hogy minél több felhasználót becsábítsanak. Így jobban kiemelik a pozitívumokat, míg a negatívumokat nem említik. Olyan információk is hiányozhatnak, amik csak a program kipróbálásakor derül ki. Pl. az, hogy támogatja-e a magyar nyelvet.

Végszó

PixelRita, te mit gondolsz erről?

Loading