AI Art: co už umí a co ještě ne

Loni jsem trochu experimentoval s malířskými schopnostmi tehdy nastupující generativní AI Art. Letos, za dlouhých zimních večerů jsem si na to vzpomněl a napadlo mne podívat se, jak moc za ten rok AI pokročila. Nu, posuďte sami.

Na vygenerování každého obrázku, což trvá bratru 5-10 vteřin, je potřeba PROMPT ("nápověda"), tedy text, který algoritmu sdělí, co chcete nakreslit (popřípadě jakým stylem) a náhodné číslo SEED ("semínko"), které algoritmu umožňuje použít stejný prompt vícekrát. Při standardním nastavení ho algoritmus vybere za vás.

Základní princip algoritmu jsem popsal zde. Věcná část promptu je uvedena kurzívou nad každým obrázkem. Stylovou část jsem většinou vynechal, protože vesměs používám standardní předvolby.

Začnu s nedostatky.

Co AI ještě moc neumí.

Pokud zadáte v promptu něco specifického nebo komplikovaného, model se občas splete a vygeneruje logický nesmysl - např. polární lišku s 6 nohama. Obvykle ale stačí ten samý prompt projet ještě jednou (počítač vybere nový náhodný "seed") a chybka se napraví.

(arctic foxes in front of a waterfall in a distant galaxy)

(arctic foxes in front of a waterfall in a distant galaxy)

+++

Podobně se na dalším dvojobrázku červeným pandám trochu zdeformovaly nástroje. Opět stačilo změnit "seed" a situace se napravila (přesto ale ta pravá panda na druhém obrázku drží svůj nástroj nepřirozeně - to už se mi ale ladit nechtělo). Bohužel ten nový "seed" vymyslí úplně nový obrázek na dané téma. Doufám, že za rok se AI naučí prostě napravovat své chybky při zachování původní kompozice. Do jisté míry se to dá nakamuflovat tlačítkem "EVOLVE", které daný obrázek trochu někam posune, ale kontrolu nad tím, kam ho posune, nemáte.

(red pandas with musical instruments dancing in front of a christmas tree)

(red pandas with musical instruments dancing in front of a christmas tree)

+++

Při generaci obličejů AI občas znetvoří rysy tváře - zejména v případech, kdy obličej není dominantní složkou obrázku, ale je součástí nějaké komplexnější kompozice. Opět stačí vygenerovat nový obrázek se stejným promptem a nový seed většinou zjedná nápravu. I na druhém obrázku je ale chybka - najdete ji?

(a blonde goddess downhill skiing)

(a blonde goddess downhill skiing)

+++

To samé potkalo i Marilyn Monroe, kterou jsem pro zajímavost pozval do Prahy (abych viděl jak ji AI ztvární -- myslím tu Prahu). Marilyn se povedla teprve na druhý pokus.

(Marilyn Monroe visiting Prague)

(Marilyn Monroe visiting Prague)

+++

Obecně ale musím uznat, že při malování známých osob učinila AI poměrně výrazný pokrok (loňský pokus o znázornění Marilyn a Alberta Einsteina najdete zde).

(Marilyn Monroe visiting Prague)

(Albert Einstein riding a bull in a rodeo)

To rodeo mě celkem zaujalo, tak jsem na to téma nasekal ještě dva obrázky.

(a cowboy riding a shark under water)

(a mouse riding a cat in a rodeo)

+++

Co už AI docela umí.

Z těch několika experimentů mi přijde, že nejsilnější stránkou AI jsou různé fantaskní krajiny (zejména vysokohorské), jejichž detaily by lidskému malíři pravděpodobně zabraly několik hodin.

(a fairy village in high mountains)

(a fairy village in high mountains)

+++

Dobře zvládá i detailně vypiplané hrady a kláštery.

(the mysterious castle in carpathians)

(the mystical land of shangri-la in high himalayas)

+++

Další dvojice je inspirovaná starší písničkou skupiny Kansas.

(journey from mariabronn)

(journey from mariabronn)

+++

AI si lehce poradila i s visutými zahradami královny Semiramis přenesenými do moderní doby. Tady jsem použil úplně stejný prompt (i ten stylový), takže názorně vidíte jak se ten rozdílný "seed" projeví. Jen trochu zahejbá s kompozicí.

(hanging gardens of semiramis in a modern city)

(hanging gardens of semiramis in a modern city)

+++

Zrcadlení je taktéž vyvedeno poměrně realisticky.

(a fantasy castle reflecting in a norwegian fjord)

(a fantasy castle reflecting in a jungle lake)

+++

A nebojte se popustit uzdu fantasii.

(a ballet rehearsal in a deep canyon)

(the fern heaven)

+++

Ani umělé světlo nedělá AI větší potíže (opět stejný námět i styl).

(a staircase to golgotha)

(a staircase to golgotha)

+++

A v nočních výjevech přímo září.

(a jungle at night with ruins in the background)

(a jungle at night with ruins in the background)

+++

Všechny předchozí obrázky znázorňují konkretní objekty. Na závěr jsem proto předhodil AI něco abstraktnějšího: "den, kdy jsem pochopil smysl života". A teď se ukaž, blamáž.

Na většině obrázků se objevila postava hledící směrem k horizontu.

(the day I understood the meaning of life)

(the day I understood the meaning of life)

+++

Popřípadě vícero osob.

(the day we understood the meaning of life)

(the day we understood the meaning of life)

+++

Při vhodném nastavení stylu se ale objevily zajímavé nápady.

(the day we understood the meaning of life)

(the day we understood the meaning of life)

No, van Gogh to ještě není, ale pokrok za minulý rok je znatelný. A pokud potřebujete rychlou ilustraci pro nějaké své literární dílko, poslouží to docela dobře a hlavně rychle. Nemluvě o tom, že je to zábavná kratochvíle.

+++

 

Nominujte autora do ankety Bloger roku

Autor: Jan Řeháček | čtvrtek 15.2.2024 9:09 | karma článku: 17,91 | přečteno: 372x
  • Další články autora

Jan Řeháček

Impresionisté na hladině

9.3.2024 v 9:09 | Karma: 22,50

Jan Řeháček

Není větvička jako větvička

9.2.2024 v 9:09 | Karma: 19,45