Becsült olvasási idő 15 perc.

2025.01.12.

Stable Diffusion fejlett modellek

Ide azokat a modelleket gyűjtöttük össze, amelyek a Stable Diffusion 1.5 utáni verziókhoz készültek. A 2-es verzió túlságosan baljósan sikerült, így ahhoz sosem készültek igazán használható modellek, csak a későbbiekhez.

A Stable Diffusion 1.5 verzióhoz javasolt modellek listája itt található.

⚠️Figyelmeztetés⚠️

A Stable Diffusion nagyon elszabadult a 2-es verzió után, és ember legyen a talpán, aki átlátja!

A modellek legtöbb esetben működnek. Ha mégse, akkor valami speciális beállítás, NOD, kiegészítő, extra modell, stb.. szükséges.

A modellek leírásait a ChatGPT írta az eredeti weboldal alapján a megadott szempontok szerint.

Stable Diffusion XL (SDXL)

CineVisionXL

Modell neve: CineVisionXL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: CineVisionXL
Utolsó frissítés dátuma: 2024. április 25.
Letöltések száma: 5 000+
Felhasználói értékelés: Nagyon pozitív (140 értékelés alapján)

Felhasználási ötletek, utasítások, tippek:

Egyszerű promptok használata: A modell előnyben részesíti az egyszerű promptokat, de képes összetett jelenetek megértésére is.
Természetes nyelvű promptok: A természetes nyelvű promptokkal jól működik, ahogy a példaképek is mutatják.
Képarány: A modell szélesvásznú (16:9, 21:10) formátumú képekre lett betanítva, így ezekben az arányokban nyújtja a legjobb eredményeket.
Kimeneti stílus: Alapértelmezésben filmes realista stílusú képeket generál, de képes különböző filmes stílusok és terminológiák kezelésére is.

Összefoglaló:

A CineVisionXL egy SDXL 1.0 alapú modell, amelyet a filmes jelenetek és a moziszerű realizmus megjelenítésére fejlesztettek ki. A készítő, SoCalGuitarist, kiemeli, hogy a modell több mint 120 000 lépésnyi betanításon esett át, közel 9 000 kép felhasználásával. A modell különösen jól reagál a különböző filmes stílusokra és terminológiákra, és a természetes nyelvű promptokkal is hatékonyan működik. Annak ellenére, hogy a neve filmes fókuszra utal, a modell dinamikus, és képes fényképek, rajzfilmek, színezőkönyvek és más stílusok generálására is. A készítő megjegyzi, hogy a modell a közelgő SD3 megjelenése előtt valószínűleg az utolsó nagy SDXL frissítése, és reméli, hogy a felhasználók élvezni fogják a használatát.

Ajánlott kiegészítők:

Perturbed Attention Guidance (PAG): A jobb eredmények érdekében a készítő javasolja a PAG használatát.
ForgeUI: A modell integrálásához és használatához a ForgeUI felületet ajánlja a készítő.

Hivatkozások:

DreamShaper XL

Modell neve: DreamShaper XL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Full Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: DreamShaper XL
Utolsó frissítés dátuma: 2024. október 5.
Letöltések száma: 1 831 465
Felhasználói értékelés: Túlnyomóan pozitív (8 368 értékelés alapján)
Felhasználási ötletek, utasítások, tippek:

Sampler: Ajánlott a DPM++ SDE Karras használata.
Lépésszám: Turbo verzió esetén 4-8 lépés, Lightning verzió esetén 3-6 lépés ajánlott.
CFG skála: Mindkét verziónál 2-es érték javasolt.
Képméret: Kerülje a 1024 pixelnél nagyobb méreteket az első lépésben.
Nagyítás: A modell önmagában is használható highres fix és csempézett nagyítás esetén; nincs szükség külön finomítóra.
Kommersz felhasználás: A Turbo verzió kereskedelmi használatához a StabilityAI engedélye szükséges.

Összefoglaló:

A DreamShaper XL egy általános célú Stable Diffusion modell, amely a fotók, művészeti alkotások, anime és manga stílusokban egyaránt kiváló eredményeket nyújt. Célja, hogy versenyképes alternatívát kínáljon más általános célú modellekkel és platformokkal szemben, mint például a Midjourney és a DALL-E. A modell Turbo és Lightning verziói jelentősen csökkentett lépésszámmal képesek magas minőségű képeket generálni, ezáltal gyorsabbá téve a folyamatot. A készítő, Lykon, kiemeli, hogy a modell használatához nincs szükség külön finomítóra, és a highres fix valamint a csempézett nagyítás funkciókhoz is alkalmas. Fontos megjegyezni, hogy a Turbo verzió kereskedelmi használatához a StabilityAI engedélye szükséges.

Ajánlott kiegészítők:

ComfyUI Workflow: A készítő javasolja a ComfyUI használatát a modell optimális teljesítményéhez. Egy példa workflow elérhető itt: ComfyUI Workflow

Hivatkozások:

DynaVision XL

Modell neve: DynaVision XL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: DynaVision XL
Utolsó frissítés dátuma: 2024. október 5.
Letöltések száma: 231 653
Felhasználói értékelés: Túlnyomóan pozitív (1 720 értékelés alapján)
Felhasználási ötletek, utasítások, tippek:
Egyszerű promptok használata: A modell előnyben részesíti az egyszerű promptokat, és maga végzi a jelenetépítést.
SDXL finomító használatának kerülése: Ne használja az SDXL finomítót a DynaVision XL-lel, mivel az inkompatibilis, és csökkentett minőségű kimenetet eredményezhet.
Összefoglaló:
A DynaVision XL a NightVision XL modell és több kiváló LoRA, például Sameritan 3D Cartoon LoRA és a Wowifier LoRA egyesítéséből született, hogy olyan modellt hozzon létre, amely a Pixar, Dreamworks, Disney Studios és Nickelodeon számítógépes animációihoz hasonló stilizált 3D kimenetet produkál. A modell képes mind SFW (biztonságos) mind NSFW (nem biztonságos) tartalmak előállítására. A készítő, socalguitarist, kiemeli, hogy a modell egyszerű promptokkal is kiválóan működik, és maga végzi a jelenetépítést. Fontos megjegyezni, hogy az SDXL finomító használata nem ajánlott a DynaVision XL-lel, mivel az inkompatibilis, és csökkentett minőségű kimenetet eredményezhet.
Hivatkozások:
DynaVision XL

epiCRealism XL

Modell neve: epiCRealism XL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: epiCRealism XL
Utolsó frissítés dátuma: 2024. november 15.
Letöltések száma: 34 796
Felhasználói értékelés: Túlnyomóan pozitív (1 099 értékelés alapján)

Felhasználási ötletek, utasítások, tippek:

Negatív promptok kerülése: A készítő javasolja a negatív promptok mellőzését, mivel ez javíthatja az eredményeket SDXL-ben.

Összefoglaló:

Az epiCRealism XL egy fotórealisztikus képgenerálásra optimalizált modell, amely a valósághű női portrék és jelenetek létrehozásában kiemelkedő. A készítő, epinikion, a modell fejlesztése során több verziót is kiadott, folyamatosan finomítva a teljesítményt és a stílust. Az utolsó frissítés során a modell összevonásra került LEOSAM’s HelloWorld XL modelljével, amely tovább javította a képességeit. A készítő megjegyzi, hogy időhiány miatt nem folytatta a további finomhangolást SDXL-re, és ajánlja LEOSAM modelljének használatát is.

Ajánlott kiegészítők:

Base Modell: LEOSAM’s HelloWorld XL

Hivatkozások:

Interior Scene XL

Modell neve: Interior Scene XL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: Interior Scene XL
Utolsó frissítés dátuma: 2024. szeptember 5.
Letöltések száma: 596
Felhasználói értékelés: Pozitív (31 értékelés alapján)

Felhasználási ötletek, utasítások, tippek:

VAE használata: A modell használatához szükséges egy VAE integrálása.
Ajánlott ComfyUI paraméterek: A készítő javasolja a ComfyUI használatát a modell optimális teljesítményéhez.

Összefoglaló:

Az Interior Scene XL egy SDXL 1.0 alapú modell, amelyet kifejezetten belsőépítészeti jelenetek generálására fejlesztettek ki. A készítő, Cyber_BCat, kiemeli, hogy a modell használatához szükséges egy VAE integrálása a jobb képminőség érdekében. A modell különösen alkalmas realisztikus belső terek, építészeti tervek és luxus stílusú jelenetek létrehozására. A felhasználók pozitívan értékelték a modellt, kiemelve annak hatékonyságát és a generált képek minőségét.

Ajánlott kiegészítők:

VAE: A jobb képminőség érdekében ajánlott egy kompatibilis VAE használata.

Hivatkozások:

Interior Scene XL

NightVisionXL

Modell neve: NightVisionXL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: NightVisionXL
Utolsó frissítés dátuma: 2024. június 17.
Letöltések száma: 3 497
Felhasználói értékelés: Nagyon pozitív (146 értékelés alapján)

Felhasználási ötletek, utasítások, tippek:

VAE: A modell beépített VAE-t tartalmaz, nincs szükség külső VAE használatára.
SDXL Refiner használata: Ne használja az SDXL Refiner-t a NightVisionXL-lel, mivel az inkompatibilis, és csökkentheti a kimenetek minőségét.
Promptolás: A modell előnyben részesíti a természetes nyelvű promptokat, lehetővé téve a jelenetek egyszerű leírását anélkül, hogy bonyolult negatív promptokra lenne szükség.

Összefoglaló:

A NightVisionXL egy finomhangolt SDXL modell, amelyet a közösség LoRA-jainak felhasználásával fejlesztettek tovább. Különösen alkalmas fotórealisztikus portrék és esti vagy éjszakai jelenetek készítésére, mély fekete árnyalatok és élénk fények megjelenítésére. A modell elkerüli a hasonló modelleknél gyakori testarány-problémákat, és képes mind SFW (Safe for Work), mind NSFW (Not Safe for Work) tartalmak előállítására. Egyszerű használatot biztosít, mivel a természetes nyelvű promptokat részesíti előnyben, lehetővé téve a felhasználók számára, hogy bonyolult negatív promptok nélkül hozzanak létre lenyűgöző képeket.

Civitai

Hivatkozások:

NightVisionXL

Pixel Art Diffusion XL

Modell neve: Pixel Art Diffusion XL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: Pixel Art Diffusion XL
Utolsó frissítés dátuma: 2024. február 27.
Letöltések száma: 14 127
Felhasználói értékelés: Túlnyomóan pozitív (1 312 értékelés alapján)
Felhasználási ötletek, utasítások, tippek:

Egyszerű promptok használata: Kerülje a túl hosszú promptokat; fókuszáljon a lényegre.
„Pixel Art” kifejezés használata: Helyezze a „Pixel Art” kifejezést a prompt elejére a kívánt stílus eléréséhez.
Bitmélység megadása: Használjon olyan kifejezéseket, mint „16 bit”, „32 bit” vagy „64 bit” a stílus pontosításához.
Upscaling során: Alacsony Denoise Strength értékeket alkalmazzon (ne haladja meg a 0,25-öt) a torzítás elkerülése érdekében.
Stílusra utaló szavak kerülése: Kerülje a pixel art-tól eltérő stílusokat sugalló szavakat a prompt elején (pl. „realistic”, „photography”).
CFG értékek: Használjon 4 és 12 közötti CFG értékeket a stabilabb és jobb képminőség érdekében.
LoRA-k használata: Figyeljen arra, hogy egyes LoRA-k eltávolíthatják a pixel art stílust a képről.

Összefoglaló:

A Pixel Art Diffusion XL egy speciális checkpoint, amely a pixel art stílusú képek generálására lett kifejlesztve. Lehetővé teszi különféle pixel art stílusú képek létrehozását, élénk színekkel és rövidebb promptokkal. Bár nem feltétlenül hoz létre tökéletesen formált pixeleket, kiválóan alkalmas a pixel art esztétika megjelenítésére. A modell beépített VAE-t tartalmaz, így nincs szükség külön VAE integrálására.

Ajánlott felhasználási területek:

Játéktervezés: Sprite-ok, eszközök, páncélok és egyéb játékhoz szükséges elemek inspirációs képeinek generálása.
Profilképek: Egyedi pixel art stílusú profilképek készítése közösségi média platformokhoz.
Oktatási eszköz: A pixel art készítésének elsajátítása a generált képek alapján.
Animációk: Videók készítése pixel art esztétikával.
Kísérletezés: Egyedi és kreatív alkotások létrehozása szórakozás és megosztás céljából.

Hivatkozások:

Pixel Art Diffusion XL

ProtoVision XL

Modell neve: ProtoVision XL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: ProtoVision XL
Utolsó frissítés dátuma: 2024. október 5.
Letöltések száma: 32 921
Felhasználói értékelés: Túlnyomóan pozitív (1 608 értékelés alapján)
Felhasználási ötletek, utasítások, tippek:

Egyszerű promptok használata: A modell kiválóan működik egyszerű, de koherens promptokkal, és képes részletes jelenetek generálására.
SDXL Refiner kerülése: Ne használja az SDXL Refiner-t ezzel a modellel, mivel az inkompatibilis, és csökkentheti a képminőséget.
Portré fókusz: A modell elsősorban portrék készítésére optimalizált, de képes más művészeti stílusok, lények, tájak és tárgyak generálására is.

Összefoglaló:

A ProtoVision XL egy egyedi fejlesztésű modell, amely a NightVision XL alapjaira épül, és több kiváló LoRA-val kombinálva egyedi megjelenést biztosít. A készítő, socalguitarist, „Bob Ross” modelljének nevezi, mivel egy véletlen egybeesés eredményeként jött létre a DynaVision XL modell összevonási beállításainak módosítása során. A modell célja a magas minőségű 3D, fotórealisztikus, anime és hiperrealisztikus képek generálása, anélkül, hogy szükség lenne az SDXL Refiner használatára. A legújabb frissítés (V6.6.0) javítja a szemek megjelenését, a szélesvásznú koherenciát, és csökkenti a vizuális hibákat, mint például a ruhákon megjelenő mellbimbók vagy az ajkakon lévő fogak.

Civitai

Ajánlott kiegészítők:

LoRA-k: A modell létrehozásához használt LoRA-k közé tartozik az add-detail-x, AdvancedEnhancerXL, DetailedEyes_xl_V2, MovieStillXLV7, Neonify, photorealistic_slider_v1-0 és mások. Ezek használata tovább javíthatja a generált képek minőségét és stílusát.

Hivatkozások:

ProtoVision XL

RealCartoon-XL

Modell neve: RealCartoon-XL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,81 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: RealCartoon-XL
Utolsó frissítés dátuma: 2024. október 10.
Letöltések száma: 11 520
Felhasználói értékelés: Túlnyomóan pozitív (1 051 értékelés alapján)
Felhasználási ötletek, utasítások, tippek:

Képméret: Szélesség: 1216, Magasság: 832
Mintavételezési módszer: „Euler A” és „DPM++ 2M Karras” ajánlott
Mintavételezési lépések: 30-55 (30 a kiindulási pont, de gyakran 55-60 lépés is szükséges)
Nagy felbontású javítás (Hires.fix) beállítások:
- Upscaler: R-ESRGAN 4x+, 4k-UltraSharp
- Nagyítási lépések: 10
- Zajcsökkentési erősség: 0,34 – 0,45
- Nagyítás mértéke: 1,5 vagy 2
Clip Skip: 2
Web-UI beállítások a stabil működéshez:
- –medvram
- –no-half-vae
- –opt-sdp-attention

Összefoglaló:

A RealCartoon-XL egy SDXL 1.0 alapú modell, amelynek célja, hogy kiváló minőségű képeket generáljon különféle stílusokban, beleértve a rajzfilmszerű és realisztikus megjelenítéseket is. A készítő, 7whitefire7, kiemeli, hogy a modell még fejlesztés alatt áll, és idővel további frissítések várhatók a teljesítmény javítása érdekében. A modell beépített VAE-t tartalmaz, így nincs szükség külön VAE integrálására. A felhasználók pozitívan értékelték a modellt, kiemelve annak sokoldalúságát és a generált képek minőségét.

Ajánlott kiegészítők:

Magespace integráció: A modellt futtathatja a Magespace platformon is:
- V5 verzió: https://www.mage.space/play/9200bfc93333da71123999f3550aabaa
- V7 verzió: https://www.mage.space/play/0a2a61c6d4a668ef51f552df0231067d

Hivatkozások:

RealCartoon-XL
Magespace V5
Magespace V7

SDXL Unstable Diffusers ☛ YamerMIX

Modell neve: SDXL Unstable Diffusers ☛ YamerMIX
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: SDXL Unstable Diffusers ☛ YamerMIX
Utolsó frissítés dátuma: 2024. október 5.
Letöltések száma: 22 593
Felhasználói értékelés: Túlnyomóan pozitív (1 268 értékelés alapján)

Felhasználási ötletek, utasítások, tippek:

Ajánlott Clip Skip beállítás: 2
Ajánlott VAE: SDXL VAE; töltse le és helyezze a VAE mappába.
Ajánlott lépésszám: 35-150 lépés; 30 lépés alatt előfordulhatnak artefaktumok vagy színtelítettségi problémák.
Ajánlott Hires Upscaler: 4x_foolhardy_Remacri vagy 4xUltraSharp.
Ajánlott képméret: 1024×1024 (SDXL szabvány), 16:9, 4:3, 6:13 arányok.
Ajánlott CFG skála: 5-50; a modell jól kezeli a különböző CFG értékeket, lehetőséget adva a finomhangolásra.

Összefoglaló:

Az SDXL Unstable Diffusers ☛ YamerMIX egy innovatív modell, amely a Yamer’s SDXL Unstable Diffusers 11. verziójának és a RunDiffusion’s Proteus modelljének fúziójából született. Ez a kombináció egyesíti az Unstable Diffusers határtalan kreativitását és kiszámíthatatlanságát a Proteus modell sokoldalúságával és stílus-felszabadító képességeivel. A modell képes különböző műfajokban és stílusokban alkotni, az élénk animétől a lenyűgözően fotórealisztikus képekig, miközben megőrzi az Unstable Diffusers sorozat egyedi varázsát és élét.

A NihilMania egyik kiemelkedő tulajdonsága a fejlett CFG skálázás kezelése, amely lehetővé teszi a felhasználók számára, hogy alkotásaikat pontosan az igényeikhez igazítsák. A modell képes a promptok értelmezésére és megértésére oly módon, hogy túllépi az SDXL alapstílus és műfaj határait, ösztönözve a kreatív felfedezést és támogatva a felhasználók egyedi elképzeléseinek megvalósítását.

Fontos megjegyezni, hogy a NihilMania használata eltérhet a korábban használt AI művészeti modellektől. Egyedi kialakítása és válaszstílusa nyitott gondolkodást és a megközelítés alkalmazkodóképességét igényli. A felhasználóknak érdemes időt szánniuk a modell képességeinek és sajátosságainak megismerésére, és bátran kísérletezniük a különböző beállításokkal.

Ajánlott kiegészítők:

VAE: SDXL VAE
LoRA: XL YAMER’S STYLE ♠️ Princeps Omnia LoRA

Hivatkozások:

WildCardX-XL

Modell neve: WildCardX-XL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Full Model bf16.safetensors
Fájl mérete: 6,62 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: WildCardX-XL
Utolsó frissítés dátuma: 2024. július 30.
Letöltések száma: 12 833
Felhasználói értékelés: Túlnyomóan pozitív (1 240 értékelés alapján)

Felhasználási ötletek, utasítások, tippek:

Prompt: Egyszerű, de részletes leírások használata ajánlott.
Negatív prompt: „(worst quality, low quality, normal quality, lowres, low details, oversaturated, undersaturated, overexposed, underexposed, grayscale, bw, bad photo, bad photography, bad art:1.4), (watermark, signature, text font, username, error, logo, words, letters, digits, autograph, trademark, name:1.2)”
Lépésszám: 20-40
Clip Skip: 1-2
CFG skála: 3,5-7 (alacsonyabb értékekkel realisztikusabb eredmények érhetők el)
Sampler: Bármelyik használható, de a DPM++ 3M Karras vagy DPM++ 2M Karras jó eredményeket ad.
Képméret: 832 x 1216
Nagyítás: ESRGAN_4x, Lanczos vagy bármely kedvenc upscaler használata javasolt.

Összefoglaló:

A WildCardX-XL egy SDXL 1.0 alapú modell, amely a WildCardX és a RunDiffusion Photo egyesítésével jött létre, hogy kiváló fotórealisztikus tulajdonságokat biztosítson. A modell 30/70 arányban ötvözi a RunDiffusion Photo és a WildCardX jellemzőit, így nincs szükség külön refiner használatára. A készítő, Mr_fries1111, kiemeli, hogy a modell egyszerű, de részletes promptokkal működik a legjobban, és alacsonyabb CFG skála értékekkel realisztikusabb eredmények érhetők el. A modell különösen alkalmas portrék, tájképek és egyéb fotórealisztikus képek generálására.

Ajánlott kiegészítők:

RunDiffusion Photo: A modell a RunDiffusion Photo-val egyesítve készült; a teljes verzió elérhető a RunDiffusion weboldalán.

Hivatkozások:

XXMix_9realisticSDXL

Modell neve: XXMix_9realisticSDXL
Base modell verzió száma: SDXL 1.0
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Full Model bf16.safetensors
Fájl mérete: 6,46 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: XXMix_9realisticSDXL
Utolsó frissítés dátuma: 2024. október 5.
Letöltések száma: 55 983
Felhasználói értékelés: Túlnyomóan pozitív (4 950 értékelés alapján)

Felhasználási ötletek, utasítások, tippek:

Ajánlott Clip Skip beállítás: 2
Trigger szó: „xxmixgirl” – használata ajánlott, de nem kötelező.
Negatív prompt: „(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), tooth, open mouth, bad hand, bad fingers”
Képméret: 768×1280
Teljes alakos képekhez: Ajánlott a HiRes (nagy felbontású) beállítás engedélyezése, és az Adobe Photoshop használata az arcrészletek javításához.
Portréfotókhoz: A HiRes nem szükséges; az arcrészletek javításához használható az Adobe Photoshop.
Mintavételezési lépések száma: 30
CFG skála: 8-10

Összefoglaló:

Az XXMix_9realisticSDXL egy finomhangolt modell, amely a Stable Diffusion XL alapjaira épül, és célja az ázsiai női karakterek megjelenítésének javítása. A készítő, Zyx_xx, kiemeli, hogy a modell jelenlegi verziója még kísérleti stádiumban van, és további optimalizálásra szorul. A modell különösen alkalmas félalakos vagy közeli portrék készítésére; teljes alakos képek esetén ajánlott a nagy felbontású beállítások használata és az arcrészletek utólagos javítása. A készítő megjegyzi, hogy a modell 1024×1024-es vászonméreten lett betanítva, ezért más arányú képeknél előfordulhatnak hibák. A negatív promptok használata segíthet a képminőség javításában, különösen az alacsony minőségű vagy nem kívánt stílusok elkerülésében.

Ajánlott kiegészítők:

LoRA: A készítő javasolja egy kapcsolódó LoRA használatát a jobb eredmények elérése érdekében. További információkért látogasson el a készítő Tensor Art profiljára.

Hivatkozások:

Stable Diffusion 3

Stable Diffusion 3.5

Alapmodel

Modell neve: Stable Diffusion 3.5 (Large és Medium)

Base modell verzió száma: SD 3.5
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt:

Stable Diffusion 3.5 Large: Model weights (FP32).bin
Stable Diffusion 3.5 Medium: Model weights (FP8).bin
Fájl mérete:
Stable Diffusion 3.5 Large: ~12 GB
Stable Diffusion 3.5 Medium: ~4,76 GB
Fájl típusa: PyTorch bináris
Modell információs weboldalai:
Stable Diffusion 3.5 Large (Hugging Face)
Stable Diffusion 3.5 Medium (Comfy Blog)
Letöltési linkek:
Stable Diffusion 3.5 Large
Stable Diffusion 3.5 Medium
Utolsó frissítés dátuma: 2024. november 1.
Letöltések száma:
Large: ~10 000+
Medium: ~5 000+
Felhasználói értékelés: Nagyon pozitív

Felhasználási ötletek, utasítások, tippek:

Promptolási technikák:
Mindkét modell támogatja a hosszú promptokat. Javasolt figyelni a token limitre, különösen a Medium modellnél, hogy elkerüljük a képminőség romlását vagy torzulásokat.
Képméret:
- Large modell: Nagyobb felbontásokhoz (1024×1024 vagy nagyobb) ajánlott, részletes és komplex jelenetekhez.
- Medium modell: Gyorsabb feldolgozás kisebb felbontásokkal (768×768 vagy kisebb).
Mintavételezés:
- Large modell esetében magasabb CFG skála (7–10) és hosszabb lépésszám (50–80) ajánlott.
- Mindkét modell hatékonyan működik alapértelmezett Euler-A vagy DPM++ mintavételezőkkel.
Beépített VAE:
A modellek beépített VAE-vel rendelkeznek, ami automatikusan aktiválódik a generálás során.

Összefoglaló:

A Stable Diffusion 3.5 modellek, mind a Large, mind a Medium verzió, a Stability AI legújabb fejlesztései, amelyek kiváló képminőséget és rugalmasságot kínálnak. A Large modell nagyobb méretének és részletesebb paramétereinek köszönhetően ideális választás fotorealisztikus képekhez és összetett jelenetekhez. A Medium modell könnyített változat, amely gyorsabb működést biztosít kisebb méretű és alacsonyabb erőforrásigényű gépeken, miközben megőrzi a kiváló képminőséget.

A modellek az MMDiT-x technológiát használják, ami jobb tipográfiát, pontosabb struktúrát és anatómiai koherenciát kínál. Mindkettő tökéletesen alkalmas kreatív és professzionális projektekhez, akár kutatási, akár kereskedelmi felhasználásra.

Hivatkozások:

https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/tree/main

Stable Diffusion 3.5 Medium

Modell neve: Stable Diffusion 3.5 Medium
Base modell verzió száma: SD 3.5 Medium
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Pruned Model fp16.safetensors
Fájl mérete: 4,76 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: Stable Diffusion 3.5 Medium
Utolsó frissítés dátuma: 2024. november 8.
Letöltések száma: 5 121
Felhasználói értékelés: Nagyon pozitív (191 értékelés alapján)
Felhasználási ötletek, utasítások, tippek:

Prompt hossza: A modell képes hosszú promptok kezelésére, azonban ha a T5 tokenek száma meghaladja a 256-ot, előfordulhatnak artefaktumok a generált képek szélein. Javasolt a promptok hosszának figyelemmel kísérése és szükség esetén rövidítése.
Különböző válaszok: A Medium modell eltérő tanulási adatkészlettel rendelkezik, mint a Large modell, ezért ugyanarra a promptra különböző válaszokat adhat.
Mintavételezés: Ajánlott a Skip Layer Guidance technika alkalmazása a jobb struktúra és anatómiai koherencia érdekében.

Összefoglaló:

A Stable Diffusion 3.5 Medium egy Multimodal Diffusion Transformer with improvements (MMDiT-x) típusú szöveg-kép generáló modell, amely jelentős előrelépést kínál a képminőség, tipográfia, összetett promptok megértése és erőforrás-hatékonyság terén. A modell három rögzített, előre betanított szövegkódolót használ, QK-normalizációval a tréning stabilitásának javítása érdekében, valamint kettős figyelemblokkokat az első 12 transzformer rétegben. A fejlesztések közé tartozik az önfigyelő modulok bevezetése a transzformer első 13 rétegében, a vegyes felbontású tréning különböző szakaszokban (256 → 512 → 768 → 1024 → 1440), valamint a véletlenszerű kivágásos augmentáció alkalmazása a pozicionális beágyazásokon a modell robusztusságának növelése érdekében különböző felbontások és képarányok esetén. Fontos megjegyezni, hogy a modell a Stability AI Community License alatt került kiadásra, amely ingyenes kutatási, nem kereskedelmi és kereskedelmi felhasználást engedélyez olyan szervezetek vagy egyének számára, akiknek éves bevétele nem haladja meg az 1 millió dollárt.

Hivatkozások:

Stable Diffusion 3.5 Medium

Flux 1.0

FLUX.1 alap modellek

Alapmodell verziószáma: FLUX.1
Modell típusa: Checkpoint

Fájlnevek és Letöltési Linkek:

FLUX.1 Schnell:
- Fájl neve: flux1-schnell-fp8.safetensors
- Letöltési link: FLUX.1 Schnell
- Fájl mérete: 17,2 GB
- Utolsó frissítés: 5 hónapja
FLUX.1 Dev:
- Fájl neve: flux1-dev-fp8.safetensors
- Letöltési link: FLUX.1 Dev
- Fájl mérete: 17,2 GB
- Utolsó frissítés: 4 hónapja
FLUX.1 Pro:
- Elérhetőség: A FLUX.1 Pro modell nem érhető el közvetlen letöltésre; használata API-n keresztül lehetséges.
- API hozzáférés: FLUX.1 Pro API
- Utolsó frissítés: Az információ nem áll rendelkezésre.

Felhasználási Ötletek, Utasítások, Tippek:

Sebesség és Hatékonyság:
- FLUX.1 Schnell: Gyors képgenerálásra optimalizált, képes 1-4 lépésben képeket előállítani, ideális gyors iterációkhoz és helyi fejlesztésekhez.
- FLUX.1 Dev: Hatékony, de a Schnell modell sebességét nem éri el; a minőségre és a prompt követésre fókuszál.
- FLUX.1 Pro: A legmagasabb szintű teljesítményt nyújtja, kiváló minőségű képeket generál, de közvetlen letöltésre nem érhető el; API-n keresztül használható.
Kimeneti Minőség:
- FLUX.1 Schnell: Jó minőségű képeket generál, de a Pro és Dev modellek által elérhető legmagasabb szintű minőségtől elmarad.
- FLUX.1 Dev: Kiváló minőségű képeket állít elő, közel a Pro modell által kínált csúcsteljesítményhez.
- FLUX.1 Pro: A legjobb minőségű képeket biztosítja, kiváló prompt követéssel és vizuális minőséggel.
Licenc és Felhasználás:
- FLUX.1 Schnell: Apache 2.0 licenc alatt érhető el, lehetővé téve a személyes, tudományos és kereskedelmi felhasználást.
- FLUX.1 Dev: Nem kereskedelmi célú licenc alatt érhető el, kutatási és személyes projektekhez ideális.
- FLUX.1 Pro: Proprietary licenc alatt áll, API-n keresztül érhető el, elsősorban professzionális és kereskedelmi felhasználásra.

Összehasonlítás: FLUX.1 Schnell vs. FLUX.1 Dev vs. FLUX.1 Pro

Sebesség:
- Schnell: A leggyorsabb generálási időkkel rendelkezik, ideális gyors iterációkhoz.
- Dev: Mérsékelt sebesség, a minőség és pontosság érdekében optimalizálva.
- Pro: Gyors generálási idő, magas minőség mellett; API-n keresztül érhető el.
Minőség:
- Schnell: Jó minőség, de kompromisszumokkal a sebesség érdekében.
- Dev: Kiváló minőség, közel a Pro modell szintjéhez.
- Pro: A legmagasabb minőség, kiváló részletességgel és pontossággal.
Elérhetőség:
- Schnell: Nyílt forráskódú, szabadon letölthető és használható.
- Dev: Forráskód elérhető, de nem kereskedelmi licenc alatt.
- Pro: Csak API-n keresztül érhető el, licencelési feltételekkel.

A választás a projekt igényeitől függ: ha gyorsaságra és nyílt forráskódra van szükség, a Schnell a megfelelő; ha a minőség a prioritás nem kereskedelmi célra, a Dev ajánlott; professzionális és kereskedelmi alkalmazásokhoz pedig a Pro modell a legmegfelelőbb, API hozzáféréssel.

Yu_Architectural Rendering Large Model

Modell neve: Yu_Architectural Rendering Large Model flux.1 Foundation fp8
Base modell verzió száma: Flux.1
Modell típusa: Checkpoint
Letöltési fájl teljes neve kiterjesztéssel együtt: Full Model fp8.safetensors
Fájl mérete: 11,08 GB
Fájl típusa: SafeTensor
Modell információs weboldalának a linkje: Yu_Architectural Rendering Large Model flux.1 Foundation fp8
Utolsó frissítés dátuma: 2024. szeptember 1.
Letöltések száma: 428
Felhasználói értékelés: Pozitív (39 értékelés alapján)

Felhasználási ötletek, utasítások, tippek:

Mintavételezési módszer: Válassza az ‘euler’ mintavételezési módszert.
Lépésszám: 20 lépés gyors eredményt ad, 40 lépés felett jobb minőség érhető el.
Képfelbontás: Ne legyen alacsonyabb, mint 1024×1024, hogy elkerülje a minőségromlást.
Kulcsszavak használata: A legjobb eredmény érdekében használja a mellékelt kulcsszavakat, például épülettípusok, perspektívák, időjárási hatások és építészeti stílusok megadásához.

Összefoglaló:

A Yu_Architectural Rendering Large Model flux.1 Foundation fp8 egy AI modell, amelyet építészeti látványtervek generálására terveztek, a flux architektúra alapján finomhangolva. Ez a második nyílt forráskódú verzió, amely bizonyos kulcsszavak használatával jobb eredményeket nyújt. A modell különösen jól teljesít magas szögű perspektívák generálásában, és iparági igények alapján testreszabott, építészeti kulcsszavakra optimalizált. A felhasználók számára javasolt a mellékelt kulcsszavak használata a legjobb élmény elérése érdekében, valamint további kifejezések, mint például „legjobb minőség” vagy „mestermű” hozzáadása a kívánt hatás eléréséhez.

Hivatkozások: