Stable Diffusion, Midjourney: Ako funguje umelá kreativita?

Catalogue

Article

Aktualizované • Autor: Michal Rybka

Novou a prekvapivou formou umelej inteligencie je umelá kreativita. V poslednom čase sa objavil celý rad programov, ktoré dokážu generovať obrazy na základe textových vstupov. Samotná kreatívna AI sa stala preslávenou v roku 2015, kedy Google uviedol Deep Dream Generator. Ten dokázal vyšperkovať vstupný obraz do podoby farebnej halucinácie – bolo to zaujímavé, ale trochu jednoúčelové.

Artificial Intelligence photography in the creation of art. Vytvorené s pomocou Midjourney. Vytvoril Václav Závada.

Ako funguje umelá kreativita – OBSAH

  1. Čo je to latentná difúzia?
  2. Ako funguje generovanie obrázkov s AI?
  3. Vzniká nové povolanie AI umelca

Čo je to latentná difúzia?

Nové kreatívne programy sú založené na modernom koncepte latentnej difúzie, čo je proces, kedy sa neurónová sieť učí rozoznávať obrazy na stále viac zašumených vstupoch, takže sa doslova naučí vidieť tvary v chaose. Samotné tvorenie prebieha opačne, totiž vygeneruje sa vstup z čistého šumu, v ktorom v jednotlivých iteráciách sieť rozoznáva tvary a nahrádza náhodný vstup prvkami, ktoré v ňom vidí. To, čo je na tomto procese ohromujúce, je možnosť, že presne takto vznikajú sny – náhodná aktivita spiaceho mozgu je interpretovaná ako obrazy a vízie.

Latentná difúzia vznikla ako koncept pred rokom, ale dnes už máme komerčné platformy, ako je Midjourney, ale aj Open Source nástroj Stable Diffusion. Tie sú rozdelené na dve časti – samotné učenie neurónovej siete prebieha na superpočítačoch, kde sa jej predkladajú miliardy vstupov, výsledný model je možné prevádzkovať na domácich počítačoch s modernou grafickou kartou a kapacitou minimálne 8 GB RAM. Učiť podobné modely zatiaľ na domácich počítačoch nie je možné, je to výpočtovo príliš náročné.

Vytvorené s pomocou Midjourney

Ako by vyzeral Midjourney, ak by bol človekom? Spýtali sme sa priamo Midjourney – takto zachytil sám seba.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Vytvorené s pomocou Midjourney

A ako by podľa Midjourney vyzeral Stable Diffusion, pokiaľ by bol človekom?
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

i

Aké náročné je vytrénovať nový AI model pre Stable Diffusion?

Vyššie Michal uviedol, že na domácich počítačoch trénovať umelú inteligenciu nie je možné. Teoreticky to nie je pravda, pochopiteľne sa dá – lenže čas, ktorý by ste na to potrebovali, by sa počítal v stovkách rokov. A to nepreháňame.

Aby sme boli konkrétnejší. Na superpočítači NVIDIA DGX A100, ktorý má 128 CPU jadier, 55.296 jadier a predáva sa za približne 200.000 USD dolárov potrebuje na tréning Stable Diffusion modelu 7 výpočtových hodín.

Jeden superpočítač NVIDIA DGX A100 by preto na tréning modelu potreboval 9 rokov. Takže teóriu bokom, v skutočnosti má Michal pravdu: na domácich počítačoch trénovať model zatiaľ nemožno.

Ako funguje generovanie obrázkov s AI?

Generovanie obrazov prebieha tak, že systém vezme textové vstupy, ktoré mu hovoria, čo by mal v šume vidieť – a tiež náhodne generovaný šum, z ktorého začne spracovávať obrazový výsledok. Pretože sa začína z náhodného vzoru, výsledkom je vždy unikátny obraz, aj keď sa navzájom môžu podobať obsahy a štýly. Generovanie je iteratívne, to znamená, že vzniká viacero obrazov, medzi ktorými si používateľ vyberie tie, ktoré sa mu páčia, a tie nechá rozpracovať. Nejde teda o plne automatický proces, kedy by AI vytvorila najlepší možný obraz, ale skôr tvorivý nástroj, ktorý navrhuje jednotlivé možnosti a spolu s človekom ich dotvára.

Vytvorené s pomocou Midjourney

Ako by vyzeral DALLE.E 2, ak by bol človekom? Vytvorené opäť s pomocou Midjourney.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Človek je autorom unikátnych vstupov a taktiež vyberá z možných výstupov, takže produktom kreatívnej AI je ľudské autorské dielo. AI ako taká nemá právnu subjektivitu a nemôže byť autorom, zákon dnes nazerá na produkciu kreatívnej AI ako na výstup softvérového nástroja – podobne ako napríklad pri Adobe Photoshope. Hoci prebiehajú diskusie o tom, či autorom nemôže byť sieť ako taká – nie, nemôže, zákon neuznáva právnu subjektivitu AI a bolo by veľmi problematické niečo také zavádzať. Právna subjektivita znamená, že na AI by sa pozeralo ako na človeka ako v zmysle práv aj povinností – a vzhľadom na to, že zákony boli navrhnuté ľuďmi pre ľudí, zahrnutie AI do súčasného právneho systému by prinieslo viac škôd ako úžitku.

Vytvorené s pomocou Midjourney

Midjourney – česká žena v uliciach Prahy.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Vytvorené s pomocou Midjourney

Midjourney – česká žena v uliciach Prahy.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

i

Autorské právo vs AI umenie

Ako uviedol Michal vyššie, umelá inteligencia nemôže byť „autorom“ v zmysle autorského zákona. Pokiaľ ale na tvorbu vášho výstupu použijete konkrétneho autora, alebo použijete referenčný obrázok, ktorý následne s pomocou umelej inteligencie upravíte, potom ide o tzv. odvodené autorské dielo. Môžu tak nastať teoreticky dve situácie:

1. Pokiaľ použijete špecifický spôsob zadania (prompts), ktorý má rozhodujúci vplyv na podobu výsledného obrázku, prípadne použijete svoju referenčnú fotografiu/obrázok, potom možno výstup AI považovať za tzv. „odvodené autorské dielo“. Inými slovami, takému obrázku patrí ochrana diela v zmysle autorského zákona.

2. Pokiaľ svoj obrázok založíte na obrázku niekoho iného, prípadne prevezmete jeho spôsob zadania, potom si môže taká osoba (teoreticky) nárokovať svoje práva s argumentom, že ide o „odvodené autorské dielo“.

Je otázkou, aký postoj by k tejto veci zaujali súdy. Preto vyššie uvedený text neberte ako nespochybniteľnú pravdu, ale skôr ako názor. Zatiaľ totiž neexistuje žiadny súdny precedens, aspoň na Slovensku či v Českej republike. A ak existuje nejaká objektívna pravda, potom tá, že zákon môže vykladať iba súd, nie editor na Alza.cz.

Vytvorené s pomocou Midjourney

Midjourney – česká žena v uliciach Prahy.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Vytvorené s pomocou Midjourney

Midjourney – česká žena v uliciach Prahy.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Vzniká nové povolanie AI umelca

Kreatívna AI je dnes naozaj skôr nástrojom, ktorý ale dokáže veľmi rýchlo a efektívne generovať vizuálny obsah. Vzniká nová pozícia AI umelca, čo je človek, ktorý v spolupráci s AI nástrojmi dokáže generovať obsah podľa svojich predstáv – je to úloha podobná napríklad špecialistovi na vyhľadávanie, iba s umeleckým presahom.

i

Midjourney vs Stable Diffusion

Povrchné porovnanie výstupu z Midjourney a Stable Diffusion, ktoré tu nájdete v podobe obrázkov okolo, môže byť zavádzajúce. S ovládaním Stable Diffusion nemáme také skúsenosti, a nevieme tak naplno využiť jeho potenciál. Ten je obrovský. Oproti Midjourney totiž beží na vašom počítači, môžete si teda stiahnuť ľubovoľný model, ktorý sa špecializuje na vami vybraný žáner. Už teraz na internete nájdete vyššie desiatky solídnych modelov – niektoré sa špecializujú na anime, iné na vojenskú techniku.

Aktuálne ale musíme podotknúť, že výstup zo Stable Diffusion je výrazne menej konzistentný. Mnoho obrázkov, ktoré nami boli vygenerované, mali biednu kvalitu, zatiaľ čo pri Midjourney sme sa nemuseli nejako zvlášť snažiť. Stable Diffusion má obrovský potenciál. Zároveň pretože všetko beží na vašom hardvéri, neriešite problémy so zákazmi a obmedzeniami (čo je zároveň mierne desivé), a hlavne – je zadarmo.

Lenže aby ste z neho dostali konkurencieschopný výstup, musíte ísť šťastiu naproti, sťahovať rôzne modely, skúšať, experimentovať s rôznymi kombináciami nastavenia a frázovania vašej požiadavky. Pre zaujímavosť prikladáme aj niekoľko obrázkov, ktoré sa do článku nedostali. Nájdete ich tu: Stable Difusion, Midjourney.

Vytvorené s pomocou Midjourney

Stable Diffusion: dievča v uliciach Prahy.
Nástroj: Stable Diffusion. Vytvoril: Václav Závada (26. 7. 2023)

Vytvořeno s pomocí Midjourney

Stable Diffusion: dievča v uliciach Prahy.
Nástroj: Stable Diffusion. Vytvoril: Václav Závada (26. 7. 2023)

Môžeme očakávať, že sa kreatívna inteligencia rýchlo presadí aj v oblasti kreatívneho písania a filmárčiny, takže sa pomerne rýchlo objavia filmy vytvárané AI a dosť možno aj napísané a režírované AI. Znamená to koniec kreatívnych povolaní – alebo ich demokratizáciu? To zatiaľ nevieme – a nevieme ani, kde presne ležia limity schopností súčasnej kreatívnej AI. Aktuálne sa umelá inteligencia zlepšuje každým dňom a svoj potenciál zdá sa zatiaľ nedosiahla. Možno tak konštatovať, že nástroje založené na latentnej difúzii priniesli až šokujúci pokrok. Zatiaľ ale vždy platilo, že každá podobná technológia má svoje limity a bude časom nahradená lepšou a výkonnejšou inteligenciou.

Vytvorené s pomocou Midjourney

Stable Diffusion: dievča v uliciach Prahy.
Nástroj: Stable Diffusion. Vytvoril: Václav Závada (26. 7. 2023)

Vytvorené s pomocou Midjourney

Stable Diffusion: dievča v uliciach Prahy.
Nástroj: Stable Diffusion. Vytvoril: Václav Závada (26. 7. 2023)

V blízkej budúcnosti môžeme očakávať normalizáciu nasadenia kreatívnej AI v každodennom živote a dosť možno aj zábavnejší a hravejší svet, pretože výkon, s ktorým je kreatívna AI schopná generovať neustále nový obsah, je jednoducho ohromujúci. Táto technológia je jednoducho tu – a my si na ňu budeme musieť zvyknúť – a zmieriť sa aj s tým, že ďalšia oblasť, v ktorej sa presadí, môže byť úplne iná, než akú čakáme.

Michal Rybka

Michal Rybka

Michal Rybka je publicista a nadšenec s 20 rokmi skúseností v IT a gamingu. Je kurátorom AlzaMuzea a YouTube kanála AlzaTech. Napísal niekoľko fantasy a sci-fi poviedok, ktoré vyšli v knižnej podobe, a pravidelne pokrýva piatkový obsah na internetovom magazíne PCTuning.

4.6 247×
Google Nest Mini 2nd Generation - Charcoal
Voice Assistant - OS supported: Android and iOS controls your smart home and plays music, 3 ambient sound microphones, EU distribution, language used: English and German.
+Gift Speaker Mount AlzaErgo with a value of 5.80 €
44.90 €
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: GOOGH51
15.68 €
Buy
Available for reading
Order Code: EK40191
13.26 €
Buy
Available for reading
Order Code: EK33556
4.7 17×
Google Nest Audio Chalk
Voice Assistant - OS supported: Android and iOS controls your smart home and plays music, 3 ambient sound microphones, language used: English.
109.90 €
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: GOOGnestA1
4.8 667×
Apple HomePod Mini, White
Voice Assistant - Siri for Apple HomeKit, OS supported: iOS controls your smart home and plays music, 2 ambient sound microphones, Camera, EU distribution, language used: English and German. - Siri for Apple HomeKit, OS supported: iOS 2,4 GHz WiFi Connection, controls your smart home and plays music, Apple Music support, language used: English, German and In Japanese.
113.90 €
Buy
In stock > 5 pcs
Order Code: JA041a1
5.0
Apple HomePod (2nd generation) White
Voice Assistant - Manufacturer app, Siri for Apple HomeKit, OS supported: iOS controls your smart home and plays music, 4 ambient sound microphones, language used: English.
368.90 €
Buy
In stock > 5 pcs
Order by midnight, get it at the AlzaBox in the morning.
Info
Order Code: apple23_01
Print
P-DC1-WEB09
We will call you and advise you professionally
+420 225 340 120
Order inquiry
Question about the product
Please enter your telephone:
Call me
We care about your privacy Alza.cz a. s., Company identification number 27082440, uses cookies to ensure the functionality of the website and with your consent also to personalisage the content of our website. By clicking on the “I understand“ button, you agree to the use of cookies and the transfer of data regarding the behavior on the website for displaying targeted advertising on social networks and advertising networks on other websites.
More information Less info