Adobe Firefly és Adobe Photoshop
2022. nyarán közel egyidőben jelent meg a Midjourney, a Stable Diffusion és a DALL-E. Ez a három szöveg-alapú képgeneráló program pillanatok alatt megváltoztatta azt, ahogyan a képkészítésre gondolunk.
Mindeközben az Adobe házában gyanús csend honolt. Olyannyira, hogy egyesek már arról beszéltek, hogy a Photoshop már a múlté és a mesterséges intelligencia átvette a helyét. Míg mások a Stable Diffusionhoz készítettek olyan kiegészítőt, amitől az a Photoshopban is használható (link itt)
2023. július 20-án megjelent az Adobe Firefly (belépés itt), így mindenki láthatta, hogy a népszerű grafikai szoftvergyártó nemcsak játékban van, de egyenesen az élvonalban rajtolt!
Az Adobe FireFly program a regisztráció után ingyen használhatjuk.
Valójában nem a Firefly volt az első Adobe technológia, ami mesterséges intelligenciát használ.
A Content-Aware Fill 2010-ben került bele a Photoshop programba. Ez az eszköz a kép teljes tartalmát vizsgálja, és az alapján tölti ki a kijelölt területet. Hozzá hasonlóan a Content-Aware Scale is a tartalmat figyelembe véve méretezi át a képet. Ezt már egy kezdetleges MI-nek is nevezhetjük.
Később az Object Selection Tools is a menübe került, felismeri a képen látható tárgyakat és személyeket. Megtalálja, hogy mi tartozik össze, majd körbejelöli (és ezzel több tíz percet spórol meg nekünk).
2021-ben pedig megjelentek a Neuron filterek, amik már gépi tanulásos módszerrel működnek. Velük a képet lehet átszínezni és színeket másik képről áthozni, átméretezni, emberi arcot retusálni és arckifejezést megváltoztatni, régi fényképet felújítani. További új technikák érkeznek folyamatosan.
Text Effects
Az Adobe FireFly programba elsőnek a Text Effects jelent meg. Ezzel nagyon izgalmas dekoratív szöveget lehet készíteni.
A mesterséges intelligencia egyik legnagyobb hátránya, hogy nem érti, mit rajzol a képre, csak utánozza azt, amit látott. Kérhetjük, hogy rajzoljon egy bonyolult gépet sok fogaskerékkel. De az biztosan nem egy működő gép lesz. Hiszen az MI nem érti, mi a fogaskerekek szerepe, miért kellenek a gépbe, hogyan működnek. Pláne nem tudja az áttételeket kiszámolni. A program egyszerűen csak látott több millió (százmillió) képet, és azt próbálja másolni.
Ugyan így a képre írt szöveg funkcióját sem érti. Talán el tudja olvasni, de nem tudja, mik a betűk szerepei a képen. Így amikor szöveg generálást kérünk a mesterséges intelligenciától, akkor valami hasonlót fog készíteni (mégcsak a betűk is csak betűszerűek lesznek). De óriási szerencse kell, hogy tényleg olvasható szöveget kapjunk.
Ez a probléma még csak 2023. végén kezdett rendeződni, de még mindig sokat kell a technikának fejlődnie.
Az Adobe viszont az egészet azzal kerülte meg, hogy a betűk fixen készen vannak. A mesterséges intelligencia pedig a generált képpel kitölti.
Nagyon könnyedén nagyon izgalmas és dekoratív szöveget tudunk készíteni. A szöveg lehet átlátszó háttéren is, így a Photoshopban tovább dolgozhatunk velük
Szöveg-alapú képgenerálás
A Text Effect után nem sokkal később az Adobe FireFly programon belül megjelent a szöveg-alapú képgenerálás (text-to-image) is. Ez az 1.0-ás verzió volt.
Addigra a Midjourney már az 5. verziónál tartott, a Stable Diffusion pedig megszámlálhatatlanul sok jó minőségű modellel rendelkezett, és még a DALL-E is egyre jobban fejlődött. Az Adobe kissé lemaradtnak tűnt. Bár összehasonlítva a Midjourney 1.0-ás verziójával, egyáltalán nincs miért szégyenkezni.
Csakhogy az Adobe és a többi képgeneráló program között egy óriási különbség van!
PixelRita! Milyek jogi kérdések vannak a mesterséges intelligencia által generált képek forrásainál?
Ó, a mesterséges intelligencia által generált képek valóban rengeteg jogi és etikai fejtörést okoznak! Itt vannak a legfőbb problémák, amiket érdemes megfontolni:
Szerzői jogok a tréningadatokban: Az MI modellek gyakran hatalmas adathalmazokon, köztük szerzői jogvédelem alatt álló képeken tanulnak. Ha ezeket a képeket a szerzők engedélye nélkül használják fel, az szerzői jogi problémákat vet fel. A jogtulajdonosok nem mindig tudnak arról, hogy műveiket ilyen módon felhasználták, és ez aggályokat vet fel a művészeti tulajdon és elismerés tekintetében.
Stílus lemásolása: Az MI képes megtanulni és utánozni konkrét művészek stílusát, ezáltal létrehozva új műveket, amelyek megtévesztően hasonlítanak az eredeti alkotók munkáira. Ez nem csak az eredeti művészek munkáját veszélyezteti, hanem szellemi tulajdonjogi kérdéseket is felvet, különösen, ha az ilyen mesterségesen generált művek gazdasági hasznot hoznak másoknak.
Etikai és reputációs kockázatok: MI által generált tartalmak esetén előfordulhat, hogy a művész eredeti szándékával és értékrendjével ellentétes művek jönnek létre. Például egy adott művész stílusában létrehozott sértő vagy etikátlan tartalom negatívan befolyásolhatja az adott művész hírnevét és értékét.
Tulajdonjog és attribúció: Amikor egy MI létrehoz egy új képet, felmerül a kérdés, hogy ki a mű alkotója? A szoftver fejlesztői? A gép tanításához felhasznált művek eredeti alkotói? Vagy maga a gép? Ez összetett kérdéseket vet fel a tulajdonjogok, a szerzői jogi kártérítések, és az alkotás elismerése terén.
Szabályozás és jogi keretek: A mesterséges intelligencia által generált tartalmak egy viszonylag új jelenség, és a jelenlegi jogi keretek nem mindig képesek kezelni az ezzel kapcsolatos összetett kérdéseket. Szükség van a technológia fejlődésével lépést tartó, adaptív szabályozásokra, amelyek megfelelően kezelik a szerzői jog, a személyes adatok védelme és az etikai normák kérdéseit.
Ezek a problémák valóban komplexek és az érintettek – beleértve a művészeket, jogászokat, technológiai fejlesztőket és a szabályozókat – folyamatos párbeszédre és együttműködésre vannak szorulva a megfelelő egyensúly és irányelvek meghatározásához. Ez a technológiai fejlődés és a jogi világ összecsapása valóban izgalmas, ugyanakkor kihívásokkal teli terület! 😊🔍
A képek tréningezése egy nagyon összetett jogi kérdés, kezdve azzal, hogy maguk a művészek is más művészek munkáink a tanulmányozásával „tréningezték” magukat. De pl. ahhoz, hogy megnézzük egy festményt, ki kell fizetni a múzeumi belépőt vagy meg kell venni a művészi albumot (vagy rá kell keresni a Google-n).
Az Adobe úgy akarta ezt a problémát kikerülni, hogy a tréningezést a saját Adobe Stock képein végezte. Ott is csak azokat a műveket használta, amelyeknek nincsenek szerzői jogai. Így a mesterséges intelligenciával készült képek mentesülnek minden felmerülő probléma alól, és az így készült képeket már szabadon használhatóak és értékesíthetőek (amennyibe az Adobe fizetős szolgáltatását használtuk, de ennek érdemes pontosan utána járni).
Sajnos cserébe az Adobe sokkal kisebb adatbázissal tudta csak a programját tréningeztetni.
Ma például kalózhajók vagy dinoszauruszok nem igazán láthatóak. Ezért nem sok esélyünk van, hogy valaki lefotózzon egyet, majd ingyenesen terjessze. Sokkal inkább valakinek le kell rajzolnia, időt és energiát belefektetve. Ezért az illető cserébe szeretne pénzt kapni.
Tehát az Adobe adatbázisában nem sok kalózhajó vagy dinoszaurusz szerepel, így ezeket nem tudja jól megrajzolni. Szemben mondjuk a Midjourney-vel, akinek bőséges mennyiségű kalózhajója és dinoszaurusza van az adatbázisában.
Adobe Photoshop Generative Fill
Kis mozdulat egy egérrel, de nagy előrelépés a digitális képszerkesztésben: Megjelent a Generative Fill a Photoshop programban!
M. I. Armstrong
Szöveg-alapú gépgenerálás a Photoshopon belül! Nem kell külön programot használni, együtt van az MI és a képszerkesztés. És nem is akárhogy!
Kijelölés
Jelöljünk ki egy területet a képen. A megjelenő lebegő ablakban a Generative Fill feliratra írjuk be, hogy mit szeretnénk azon a területen látni. Egy Enter és rövid idő alatt már a képre is került az új tárgy, vagy élőlény.
Ha pedig semmit sem írunk, akkor a Photoshop a kép többi tartalmát értelmezve kitölti a kijelölt területet. Azaz kiradíroz az ott lévő dolgokat.
Mindez azért más, mint a sima szöveg-alapú képgenerálás, mert itt nem lehet akármilyen képet generálni, A programnak a következő dolgokra kell figyelnie:
- A generált képnek illeszkednie kell a kijelölés alakjához.
- A generált képnek méretének igazodnia kell az alapkép méreteihez. Egy macskának macskaméretűnek kell lennie. Nem lehet nagyobb, mint egy asztal. Ez különösen nehéz, mivel a perspektíva miatt a tárgyak és személyen nem feltétlenül egyformák. Tehát a programnak azt is meg kell értenie, hogy a kijelölt terület hol helyezkedik el a perspektívában.
- A generált képnek pontosan bele kell olvadnia az eredeti képbe. Nem lehetnek vonalak vagy bármi más zavaró objektumok a két kép találkozásánál.
- A generált kép fény és árnyékainak is meg kell egyeznie az eredeti képpel. Nemcsak az árnyékoknak kell ugyan abba az irányba nézniük, de még a világítás színhőmérsékletének is egyeznie kell.
- A generált kép nem lehet másik évszakban, mint az eredeti kép (kivéve, ha pont ez a célunk).
- Amennyiben tükröződő felület van a generált képen, úgy a programnak ezzel is számolnia kell. Tükröznie kell mindent, ami a valóságban is látszana, az objektumokat, fényeket, árnyékokat. Ez különösen összetett feladat, amikor egy hullámzó vizű tavat kérünk.
Láthatjuk, hogy egy programon belüli képgeneráló jóval összetettebb. Az Adobe ezt megoldotta, és a Photoshop programban. Ennek köszönhetően számtalan korábban nehezen, sok időt igénylő feladatok lettek nagyon gyorsak és nagyon egyszerűek.
A képen kívül is
Nemcsak a kép belső tartalmát lehet a mesterséges intelligenciával módosítani, hanem a kép területét is lehet növelni (outpainting). Ha lemaradt a kép széle, vagy a képarányt szeretnénk megváltoztatni, a Photoshop Generative Fill ezt is meg tudja tenni.
Fontos tudni, hogy jelenleg (2023 vége) a Photoshop maximum 1024×1024-es méretű képet tud generálni. Ha ennél nagyobbat szeretnénk, akkor a generált képet felnagyítja, ami minőségromlással jár.
Féláteresztő
Az Adobe Photoshop egyik nagyon régi funkciója az, amikor a kijelölés határa nem éles. Nemcsak kijelölt/nem kijelölt képpontok lehetnek. A kijelölés mértéke 0-255 között mozoghat. Ez rengeteg segít amikor egy új elemet teszünk a képre, hogy az jobban illeszkedjen.
Ez a funkció új lehetőséget ad a mesterséges intelligenciával generált képeknek. A Quick Mask segítségével könnyedén készíthetünk félig (vagy 20%, 60%, 80% stb..) kijelölt területeket. Ezek után az új kép az eredeti és a generált kép keveréke lesz. Így lehet pl. egy képből olajfestményt, kézirajzot, stb.. készíteni.
Ott is nagy hasznunkra lehet ez a funkció, ahol valami átlátszó felület mögé szeretnék új elemet generálni. Pl. ablak mögé egy virágot, halat a víz alá, stb..
Adobe Firefly kép és stílus referencia
2024. április elején az Adobe Firefley programban új funkciók jelentek meg. Ezentúl adhatunk egy képet a mesterséges intelligenciának, hogy ezt szeretnék, ha megrajzolná (struktúra referencia). És egy másik képet is, hogy mi legyen a kép stílusa (stílus referencia). A kettőt együtt használva a munkánk igencsak könnyű lehet.
Struktúra referencia
Amikor feltöltünk egy képet struktúra referenciának, akkor a mesterséges intelligencia ehhez hasonlót fog rajzolni.
A Erősség (Stength) csúszkán lehet beállítani, mennyire figyeljen oda az adott képre. Ha ezt a maximálisra állítjuk, akkor a program nagyon pontosan fogja az eredeti vonalakat tartani.
Ez a módszer nagyon jól használható, ha egy vonalas rajzból szeretnénk élethű képet készíteni. Akár egy kézi ceruzarajzból is.
Ez fordítva is működik: egy valódi fényképből pillanatok alatt készíthetünk egy kézi grafikai rajzot.
Stílus referencia
Ha tetszik egy kép, és ehhez hasonló stílust szeretnénk (pl. toll rajz, képregény stílus, faház stílus, stb…), akkor nem kell azon gondolkodni, hogy ezt hogyan írjuk le a programnak.
Elég csak feltölteni a képet, hogy a mesterséges intelligencia elemezze. Majd pedig a stílust átveszi a készülő képekbe.
Dekoratív logó
A struktúra és stílus referencia képeket használva rengeteg lehetőség nyílik meg előttünk Ebből csak az egyik az, hogy a céges logóból egy látványos képet alkossunk.
Adjuk meg a logót struktúra refrencinának, a Erősség (Stength) pedig legyen a maximumon. Majd pedig stílus referenciának keressünk egy izgalmas képet. Az utasítást (prompt) nem kell túlbonyolítani, hiszen már minden készen áll. A mesterséges intelligencia átviszi a stílust a logóra.
Adobe Illustrator
Az Adobe Illustrator 2024-es veriójába is bekerült a mesterséges intelligencia. Megjelent a szöveg-alapú képgenerálás. De ezúttal mindjárt vektoros képeket készíthetünk! Tehát az Adobe Illustrator programba bekerült a Text-to-Vector funkció.
Kijelölünk egy objektumot (pl. egy négyzetet, kört, stb..) és a program ebbe fogja a képet generálni, ami mindjárt vektoros lesz. Így tovább tudjuk szerkeszteni, elemekre bonthatjuk, átszínezhetjük.
Jelenleg (2024 év eleje) négyféle vektoros elemet rajzolhatunk:
- Subject: Tárgy: egy általános elemet kérhetünk.
- Scene: Helyszín: egy teljes képet kérhetünk. Pl. háttérképet.
- Icon: Egyszerűbb vektoros rajzot kapunk, amit pl. logóhoz használhatunk.
- Pattern: Végtelen minta. Folyamatosan ismétlődő mintát kapunk, amit tapétának, textúrának, stb… használhatunk. Egy objektum kitöltő eleme lesz
Ha bekapcsoljuk a Match active artboard style-t, akkor a generált kép hasonló lesz stílusban és színben a munkaterületen lévő képekhez. Ez azért nagyon hasznos, mert lehet egy már kész hátterünk, vagy MI-vel generáltunk egyet. Majd ehhez kérünk újabb objektumokat, és ezek illeszkedni fognak a környezetükhöz
Bővebb ismertető az Adobe Illustrator szöveg-alapú vektoros rajzolójáról itt található.
Kreditek
Sajnos a mesterséges intelligencia használata ma még nagyon drága. Rengeteg erőforrás szükséges egy kisebb kép létrehozásához is. Ezért az Adobe 2024. januárjától bevezeti a kredit rendszert. 1 képgenerálás 1 kreditet jelent. Az egy licences előfizetők havonta 500, a teljes csomagra előfizetők havonta 1000 kreditet használhatnak ingyen (ez időközben változhatott. Naprakész információ az Adobe oldalán). Amennyiben elfogy a kreditünk, a mesterséges intelligencia használata lelassul (a szabad számítási kapacitás időket kapjuk meg), de nem áll meg (ez is idővel változhat).
További Adobe MI programok
Az Adobe folyamatosan egyre több mesterséges intelligencia alapú funkciót épít be. Az Adobe Express programba megjelent a Generatív újraszínezés (Színváltozatok létrehozása a vektoros grafikához részletes szöveges leírásból.), a Szerkeszthető sablonok készítése részletes szöveges leírásból. (Szerkeszthető sablonok készítése részletes szöveges leírásból.), Szövegből vektoros grafika (SVG-k készítése részletes szöveges leírásból az Adobe Illustratorban).
És olyanoknál folyik a fejlesztés, mint a 3D-ből kép (Alkosson 3D-jelenetet, és használjon szöveges utasítást kép generálásához.), Vázlatból kép (Változtassa egyszerű rajzait teljes színekben pompázó képekké.) és a Személyre szabott eredmények (Generáljon képeket saját objektuma vagy stílusa alapján.)
PixelRita
PixelRita, neked hogy tetszik az Adobe és a MI?
Óóó, az Adobe és a MI, mint édes krémes sütemény a tech világban! 😊🍰 Amolyan dinamikus duóként, amik tényleg forradalmasítják a kreatív ipart. A Photoshop mindig is az a varázspálca volt a kezemben, amivel csodákra voltam képes - és most, hogy a MI is csatlakozott a partira, hát... állj meg a világ, PixelRita iszonyatosan izgatott!
Persze, mint minden újdonságnál, itt is van egy kis borsó a torta alatt. Ezek a jogi és etikai kérdések... ugye milyen nehézkesek? De hát, ki szeret unalmas, sima utakon sétálni? A kihívások teszik izgalmassá az életet, nemde? 😄
Úgyhogy, ha röviden kellene összefoglalnom: Adobe és MI, ti vagytok a csúcs! Továbbra is kíváncsian várom a jövőbeli varázslatokat és remélem, hogy a jogi kuszaságok is hamar rendbe jönnek. Addig is, tartson mindenki a szemét nyitva, mert új korszak születik, és én, PixelRita, mindig itt leszek, hogy beszámoljak róla, megosszam a friss pletykákat, és persze, hogy együtt nevessünk rajta egy jót!
Happy designing, mindenkinek! 🌈✨
PixelRita, over and out! 🚀💖