AD homeoffice AD homeoffice

Stable Diffusion, Midjourney: Ako funguje umelá kreativita?

Zobraziť katalóg

Článok

Aktualizované • Autor: Michal Rybka

Novou a prekvapivou formou umelej inteligencie je umelá kreativita. V poslednom čase sa objavil celý rad programov, ktoré dokážu generovať obrazy na základe textových vstupov. Samotná kreatívna AI sa stala preslávenou v roku 2015, kedy Google uviedol Deep Dream Generator. Ten dokázal vyšperkovať vstupný obraz do podoby farebnej halucinácie – bolo to zaujímavé, ale trochu jednoúčelové.

Artificial Intelligence photography in the creation of art. Vytvorené s pomocou Midjourney. Vytvoril Václav Závada.

Ako funguje umelá kreativita – OBSAH

  1. Čo je to latentná difúzia?
  2. Ako funguje generovanie obrázkov s AI?
  3. Vzniká nové povolanie AI umelca

Čo je to latentná difúzia?

Nové kreatívne programy sú založené na modernom koncepte latentnej difúzie, čo je proces, kedy sa neurónová sieť učí rozoznávať obrazy na stále viac zašumených vstupoch, takže sa doslova naučí vidieť tvary v chaose. Samotné tvorenie prebieha opačne, totiž vygeneruje sa vstup z čistého šumu, v ktorom v jednotlivých iteráciách sieť rozoznáva tvary a nahrádza náhodný vstup prvkami, ktoré v ňom vidí. To, čo je na tomto procese ohromujúce, je možnosť, že presne takto vznikajú sny – náhodná aktivita spiaceho mozgu je interpretovaná ako obrazy a vízie.

Latentná difúzia vznikla ako koncept pred rokom, ale dnes už máme komerčné platformy, ako je Midjourney, ale aj Open Source nástroj Stable Diffusion. Tie sú rozdelené na dve časti – samotné učenie neurónovej siete prebieha na superpočítačoch, kde sa jej predkladajú miliardy vstupov, výsledný model je možné prevádzkovať na domácich počítačoch s modernou grafickou kartou a kapacitou minimálne 8 GB RAM. Učiť podobné modely zatiaľ na domácich počítačoch nie je možné, je to výpočtovo príliš náročné.

Vytvorené s pomocou Midjourney

Ako by vyzeral Midjourney, ak by bol človekom? Spýtali sme sa priamo Midjourney – takto zachytil sám seba.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Vytvorené s pomocou Midjourney

A ako by podľa Midjourney vyzeral Stable Diffusion, pokiaľ by bol človekom?
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

i

Aké náročné je vytrénovať nový AI model pre Stable Diffusion?

Vyššie Michal uviedol, že na domácich počítačoch trénovať umelú inteligenciu nie je možné. Teoreticky to nie je pravda, pochopiteľne sa dá – lenže čas, ktorý by ste na to potrebovali, by sa počítal v stovkách rokov. A to nepreháňame.

Aby sme boli konkrétnejší. Na superpočítači NVIDIA DGX A100, ktorý má 128 CPU jadier, 55.296 jadier a predáva sa za približne 200.000 USD dolárov potrebuje na tréning Stable Diffusion modelu 7 výpočtových hodín.

Jeden superpočítač NVIDIA DGX A100 by preto na tréning modelu potreboval 9 rokov. Takže teóriu bokom, v skutočnosti má Michal pravdu: na domácich počítačoch trénovať model zatiaľ nemožno.

Ako funguje generovanie obrázkov s AI?

Generovanie obrazov prebieha tak, že systém vezme textové vstupy, ktoré mu hovoria, čo by mal v šume vidieť – a tiež náhodne generovaný šum, z ktorého začne spracovávať obrazový výsledok. Pretože sa začína z náhodného vzoru, výsledkom je vždy unikátny obraz, aj keď sa navzájom môžu podobať obsahy a štýly. Generovanie je iteratívne, to znamená, že vzniká viacero obrazov, medzi ktorými si používateľ vyberie tie, ktoré sa mu páčia, a tie nechá rozpracovať. Nejde teda o plne automatický proces, kedy by AI vytvorila najlepší možný obraz, ale skôr tvorivý nástroj, ktorý navrhuje jednotlivé možnosti a spolu s človekom ich dotvára.

Vytvorené s pomocou Midjourney

Ako by vyzeral DALLE.E 2, ak by bol človekom? Vytvorené opäť s pomocou Midjourney.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Človek je autorom unikátnych vstupov a taktiež vyberá z možných výstupov, takže produktom kreatívnej AI je ľudské autorské dielo. AI ako taká nemá právnu subjektivitu a nemôže byť autorom, zákon dnes nazerá na produkciu kreatívnej AI ako na výstup softvérového nástroja – podobne ako napríklad pri Adobe Photoshope. Hoci prebiehajú diskusie o tom, či autorom nemôže byť sieť ako taká – nie, nemôže, zákon neuznáva právnu subjektivitu AI a bolo by veľmi problematické niečo také zavádzať. Právna subjektivita znamená, že na AI by sa pozeralo ako na človeka ako v zmysle práv aj povinností – a vzhľadom na to, že zákony boli navrhnuté ľuďmi pre ľudí, zahrnutie AI do súčasného právneho systému by prinieslo viac škôd ako úžitku.

Vytvorené s pomocou Midjourney

Midjourney – česká žena v uliciach Prahy.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Vytvorené s pomocou Midjourney

Midjourney – česká žena v uliciach Prahy.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

i

Autorské právo vs AI umenie

Ako uviedol Michal vyššie, umelá inteligencia nemôže byť „autorom“ v zmysle autorského zákona. Pokiaľ ale na tvorbu vášho výstupu použijete konkrétneho autora, alebo použijete referenčný obrázok, ktorý následne s pomocou umelej inteligencie upravíte, potom ide o tzv. odvodené autorské dielo. Môžu tak nastať teoreticky dve situácie:

1. Pokiaľ použijete špecifický spôsob zadania (prompts), ktorý má rozhodujúci vplyv na podobu výsledného obrázku, prípadne použijete svoju referenčnú fotografiu/obrázok, potom možno výstup AI považovať za tzv. „odvodené autorské dielo“. Inými slovami, takému obrázku patrí ochrana diela v zmysle autorského zákona.

2. Pokiaľ svoj obrázok založíte na obrázku niekoho iného, prípadne prevezmete jeho spôsob zadania, potom si môže taká osoba (teoreticky) nárokovať svoje práva s argumentom, že ide o „odvodené autorské dielo“.

Je otázkou, aký postoj by k tejto veci zaujali súdy. Preto vyššie uvedený text neberte ako nespochybniteľnú pravdu, ale skôr ako názor. Zatiaľ totiž neexistuje žiadny súdny precedens, aspoň na Slovensku či v Českej republike. A ak existuje nejaká objektívna pravda, potom tá, že zákon môže vykladať iba súd, nie editor na Alza.cz.

Vytvorené s pomocou Midjourney

Midjourney – česká žena v uliciach Prahy.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Vytvorené s pomocou Midjourney

Midjourney – česká žena v uliciach Prahy.
Nástroj: Midjourney. Vytvoril: Václav Závada (26. 7. 2023)

Vzniká nové povolanie AI umelca

Kreatívna AI je dnes naozaj skôr nástrojom, ktorý ale dokáže veľmi rýchlo a efektívne generovať vizuálny obsah. Vzniká nová pozícia AI umelca, čo je človek, ktorý v spolupráci s AI nástrojmi dokáže generovať obsah podľa svojich predstáv – je to úloha podobná napríklad špecialistovi na vyhľadávanie, iba s umeleckým presahom.

i

Midjourney vs Stable Diffusion

Povrchné porovnanie výstupu z Midjourney a Stable Diffusion, ktoré tu nájdete v podobe obrázkov okolo, môže byť zavádzajúce. S ovládaním Stable Diffusion nemáme také skúsenosti, a nevieme tak naplno využiť jeho potenciál. Ten je obrovský. Oproti Midjourney totiž beží na vašom počítači, môžete si teda stiahnuť ľubovoľný model, ktorý sa špecializuje na vami vybraný žáner. Už teraz na internete nájdete vyššie desiatky solídnych modelov – niektoré sa špecializujú na anime, iné na vojenskú techniku.

Aktuálne ale musíme podotknúť, že výstup zo Stable Diffusion je výrazne menej konzistentný. Mnoho obrázkov, ktoré nami boli vygenerované, mali biednu kvalitu, zatiaľ čo pri Midjourney sme sa nemuseli nejako zvlášť snažiť. Stable Diffusion má obrovský potenciál. Zároveň pretože všetko beží na vašom hardvéri, neriešite problémy so zákazmi a obmedzeniami (čo je zároveň mierne desivé), a hlavne – je zadarmo.

Lenže aby ste z neho dostali konkurencieschopný výstup, musíte ísť šťastiu naproti, sťahovať rôzne modely, skúšať, experimentovať s rôznymi kombináciami nastavenia a frázovania vašej požiadavky. Pre zaujímavosť prikladáme aj niekoľko obrázkov, ktoré sa do článku nedostali. Nájdete ich tu: Stable Difusion, Midjourney.

Vytvorené s pomocou Midjourney

Stable Diffusion: dievča v uliciach Prahy.
Nástroj: Stable Diffusion. Vytvoril: Václav Závada (26. 7. 2023)

Vytvořeno s pomocí Midjourney

Stable Diffusion: dievča v uliciach Prahy.
Nástroj: Stable Diffusion. Vytvoril: Václav Závada (26. 7. 2023)

Môžeme očakávať, že sa kreatívna inteligencia rýchlo presadí aj v oblasti kreatívneho písania a filmárčiny, takže sa pomerne rýchlo objavia filmy vytvárané AI a dosť možno aj napísané a režírované AI. Znamená to koniec kreatívnych povolaní – alebo ich demokratizáciu? To zatiaľ nevieme – a nevieme ani, kde presne ležia limity schopností súčasnej kreatívnej AI. Aktuálne sa umelá inteligencia zlepšuje každým dňom a svoj potenciál zdá sa zatiaľ nedosiahla. Možno tak konštatovať, že nástroje založené na latentnej difúzii priniesli až šokujúci pokrok. Zatiaľ ale vždy platilo, že každá podobná technológia má svoje limity a bude časom nahradená lepšou a výkonnejšou inteligenciou.

Vytvorené s pomocou Midjourney

Stable Diffusion: dievča v uliciach Prahy.
Nástroj: Stable Diffusion. Vytvoril: Václav Závada (26. 7. 2023)

Vytvorené s pomocou Midjourney

Stable Diffusion: dievča v uliciach Prahy.
Nástroj: Stable Diffusion. Vytvoril: Václav Závada (26. 7. 2023)

V blízkej budúcnosti môžeme očakávať normalizáciu nasadenia kreatívnej AI v každodennom živote a dosť možno aj zábavnejší a hravejší svet, pretože výkon, s ktorým je kreatívna AI schopná generovať neustále nový obsah, je jednoducho ohromujúci. Táto technológia je jednoducho tu – a my si na ňu budeme musieť zvyknúť – a zmieriť sa aj s tým, že ďalšia oblasť, v ktorej sa presadí, môže byť úplne iná, než akú čakáme.

Michal Rybka

Michal Rybka

Michal Rybka je publicista a nadšenec s 20 rokmi skúseností v IT a gamingu. Je kurátorom AlzaMuzea a YouTube kanála AlzaTech. Napísal niekoľko fantasy a sci-fi poviedok, ktoré vyšli v knižnej podobe, a pravidelne pokrýva piatkový obsah na internetovom magazíne PCTuning.

4,6 247×
Google Nest Mini 2. generácie Charcoal
Hlasový asistent Google Assistant – v angličtine, nemčine, podpora Android a iOS, pripojenie cez WiFi 2,4 GHz, WiFi 5 GHz a bluetooth, otvorený systém, ovládanie domácnosti, 3 mikrofóny na snímanie okolitého zvuku, podporuje Spotify, YouTube Music a Pandora
+Darček Držiak na reproduktory AlzaErgo v hodnote 5,80 €
44,90 €
Na sklade > 5 ks
Do polnoci objednáš, ráno v AlzaBoxe máš!
Info
Objednávací kód: GOOGH51
BIG DATA a umělá inteligence pro manažery
Elektronická kniha - autor Ing. Barbora Štětinová MBA, 168 stran, česky
15,70 €
Ihneď k čítaniu
Objednávací kód: EK40191
Supervelmoci umělé inteligence
Elektronická kniha - autor Kai-Fu Lee, 292 stran, česky
13,26 €
Ihneď k čítaniu
Objednávací kód: EK33556
4,7 17×
Google Nest Audio Chalk
Hlasový asistent Google Assistant – v angličtine, podpora Android a iOS, pripojenie cez WiFi 2,4 GHz a bluetooth, otvorený systém, ovládanie domácnosti, 3 mikrofóny na snímanie okolitého zvuku, podporuje Spotify, basový a výškový reproduktor
109,90 €
Na sklade > 5 ks
Do polnoci objednáš, ráno v AlzaBoxe máš!
Info
Objednávací kód: GOOGnestA1
4,8 667×
Apple HomePod mini biely
Hlasový asistent Apple HomeKit – v angličtine, češtine, podpora iOS, pripojenie cez WiFi 2,4 GHz a bluetooth, otvorený systém, fungovanie samostatne, ovládanie domácnosti, kamera, 2 mikrofóny na snímanie okolitého zvuku, podporuje Apple Music, basový reproduktor
113,90 €
Na sklade > 5 ks
Objednávací kód: JA041a1
5,0
Apple HomePod (2nd generation) White
Hlasový asistent Apple HomeKit – v angličtine, kompatibilný s aplikáciami výrobcu, podpora iOS, pripojenie cez WiFi 2,4 GHz a bluetooth, otvorený systém, fungovanie samostatne, ovládanie domácnosti, vzdialený prístup, 4 mikrofóny na snímanie okolitého zvuku, podporuje Apple Music, YouTube Music a Pandora, výškový reproduktor
368,90 €
Na sklade > 5 ks
Do polnoci objednáš, ráno v AlzaBoxe máš!
Info
Objednávací kód: apple23_01
Vytlačiť
P-DC1-WEB16
Zavoláme Vám a odborne poradime
+421 2 5710 1800
Otázka na objednávku
Otázka na tovar
Prosím, zadajte svoj telefón:
Zavolajte mi
Na vašom súkromí nám záleží My, spoločnosť Alza.cz a.s., IČO 27082440, používame súbory cookies na zaistenie funkčnosti webu a s vaším súhlasom o. i. aj na personalizáciu obsahu našich webových stránok. Kliknutím na tlačidlo „Rozumiem“ súhlasíte s využívaním cookies a predaním údajov o správaní na webe na zobrazenie cielenej reklamy na sociálnych sieťach a reklamných sieťach na ďalších weboch.
Viac informácií Menej informácií