Jump to content

AI generatori slika - Stable Diffusion i derivati


Dandy

Recommended Posts

Igram se već neko vreme sa AI generatorima slika i jako sam impresioniran mogućnostima, ali sam naleteo i na dosta ograničenja.
U svakom slučaju je interesantna tematika za koju mislim da zavređuje posebnu temu.

Osnovni softver se zove Stable Diffusion ( https://github.com/Stability-AI/stablediffusion ) i koristi "modele" koji su trenirani na velikom broju slika. Slike se generišu primarno na osnovu tekstualnih prompt-ova, ali ima tu i raznih dodatnih podešavanja koja mogu dosta da utiču na finalni ishod.
Za izvršavanje na lokalnom računaru je dobro imati NVidia grafičku kartu sa što više grafičke memorije.
Srećom, postoje i razne on-line varijante tipa Midjourney ( https://www.midjourney.com/ ) i Leonardo AI ( https://leonardo.ai/ ), koje mogu da se koriste do neke mere besplatno.

Deliću ovde neke primere koje sam generisao, plus mi je ideja da postujem korisne linkove i savete, kako dalje budem istraživao u ovom pravcu.

Pošto mi je trenutno glavno interesovanje kombinovanje mojih fotografija sa AI generatorom, ovo su neki rezultati sa Midjourney-a, kada sam mu uz input sliku (uglavnom portret neke devojke) dao dodatna uputstva.
Korišćena je ista početna slika, samo je u jednom slučaju bio anime stil, a u drugom noćna street fotografija sa light painting-om.

Dandy_full_body_anime_c1b1fc04-3e8f-4243-ac6c-c9f0e7aeb540 (1).png

Dandy_full_body_anime_cdd72619-c8ba-4c31-9946-3971883cebbe.png

Dandy_pretty_girl_full_body_anime_night_photography_light_paint_6889d073-c3fb-440f-afe7-9174513b9fcd.png

Dandy_pretty_girl_full_body_anime_night_photography_light_paint_f34b9c36-81d3-41c4-a375-88166eaea557.png

  • Like +1 2
  • Downvote (-1) 1

Dandy [RUR]

Link to comment
Share on other sites

Meni te AI generisane stvari stvarno deluju jako interesantno, nešto sam eksperimentisao malo ali nemam tako dobre klinke kao ove tvoje 😉 

Kad smo kod Stable Diffusion, ovo što su ovi likovi uradili je zaista impresivno u smislu video post produkcije i animacije, ko nije video preporučujem da pogleda

I sad nisam ja u fazonu "AI će da zameni sve i sutra dolazi SkyNET da nas pokori" ali je očigledno da se dešavaju jako krupne promene. Sama činjenica da svako može da uzme svoju fotografiju i da kaže "aj mi sad napravi da izgleda kao anime" i da dobije vrlo solidan rezultat je već game changer. Pri čemu se menja i dosta nekih drugih stvari vezanih za fotografiju i dizajn - recimo činjenica da imaš online AI alate za rotoscoping, tj "frajštendovanje" što bi rekli ovi za print, prosto deluje da će mnoge stvari u dizajnu biti znatno olakšane i automatizovane. Doduše to prosto znači i da će dosta ljudi koji radi neke low level poslove u tim oblastima postati donekle suvišni, ali ćemo to još videti kako ide. 

Generalno mislim da je dobro da postoji tema o ovome jer je jako zanimljiv razvoj događaja i tehnologije. 

Heghlu'meH QaQ jajvam

Link to comment
Share on other sites

Pa mogli bi. Trenutno je glavna prepreka postići konzistentnost likova između slika, ali radi se na tome

Evo još par primera generisanih slika na osnovu istog početnog portreta. Jedan je zalazak sunca u Parizu, drugi je Pixar style princeza

Dandy_beautiful_girl_in_Paris_Eiffel_tower_in_the_background_su_1de9370b-e583-4944-96de-0481f0ca725c.png

Dandy_Disney_princess_portrait_pretty_dress_Pixar_style_8K_caf11acd-1c13-4381-8eab-6cb67464e842.png

Dandy [RUR]

Link to comment
Share on other sites

Da, to su ovi likovi koji su pravili anime animaciju pokušali da pređu jer su imali nekonzistentnost, pa su mu ubacivali prvo slike da uči, pri čemu su i kostime pojednostavili, a onda su dobijali setove slika pa su iz njih izbacivali one koje nisu konzistentne. I onda ih dodatno uprosečivali u Afteru ili čemu već da bi dobili frejmove koji su međusobno slični. Pri čemu sve što su radili je relativno moguće automatizovati, osim te procene šta je konzistentno, na tome verovatno još mora da uči AI, ali verujem da nismo više od par godina daleko od toga da bude potpuno automatizovano. Ono kao daš prompt da nacrta ilustracije za dečiju knjigu i sve budu u nekom istom stilu i sa istim likovima i to završiš za 15ak minuta. 

Veći problem sa AI generisanim slikama po mom mišljenju trenutno je da baš brzo postanu dosadne, tj lako provališ da je AI ako znaš šta gledaš. Problem je što 99% ljudi nema predstavu šta gleda 😄 Tipa pre neki dan na nekoj "haha" ortačkoj chat grupi dobijem sliku u prilogu (malo je NSFW ali nije mnogo 🙂 i na keca odmah kapiram da je AI. Plus je odaje potpis pornpen.ai, na koji moram da priznam da nisam još klinknuo! Ali realno ne treba potpis da bi skapirao da je AI. 

Spoiler


photo_2023-03-08_18-20-07.jpg

 

 

Heghlu'meH QaQ jajvam

Link to comment
Share on other sites

1 hour ago, Dandy said:

Pa istina, ali sve je teže provaliti u nekim situacijama.
Ovo su neki primeri, gde sam se trudio da dobijem rezultat koji što više liči na pravu fotografiju

To naravno stoji, ove super izgledaju. Ali je tu opet pitanje što si ti neko ko je već imao dobru osnovu pa si se s njom igrao što mislim da i jeste ideja sa AI - biće jedan dodatni alat dobrim dizajnerima, fotografima i sl. Ne možeš samo da ukucaš prompt i dobiješ ovakve rezultate, tj ne može laik to da uradi. 

Heghlu'meH QaQ jajvam

Link to comment
Share on other sites

14 hours ago, Zwerko said:

To naravno stoji, ove super izgledaju. Ali je tu opet pitanje što si ti neko ko je već imao dobru osnovu pa si se s njom igrao što mislim da i jeste ideja sa AI - biće jedan dodatni alat dobrim dizajnerima, fotografima i sl. Ne možeš samo da ukucaš prompt i dobiješ ovakve rezultate, tj ne može laik to da uradi. 

Pa poenta je da možeš. Izguglaš za čas neke dobre prompt-ove, a slike generalno ispadaju i bolje ako ne pokušavaš da ih vežeš za neku početnu fotografiju (to te samo dodatno ograničava).
Nije više teško dobiti slike koje super izgledaju, najveći je problem dobiti tačno ono što želiš.

Evo ti bukvalno prva četiri rezultata sa Midjourney-a na prompt "beautiful girl, full body, professional color grading, soft shadows, no contrast, clean sharp focus, film photography, 85mm lens --ar 2:3"

Dandy_beautiful_girl_full_body_professional_color_grading_soft__5497d807-bba8-432a-aecd-c4d4168c8b47.png

Dandy_beautiful_girl_full_body_professional_color_grading_soft__6a30b864-d9f6-4479-a12a-44ffc18d0eb5.png

Dandy_beautiful_girl_full_body_professional_color_grading_soft__9b854f42-3a0d-4c93-b0e8-46f2328549ce.png

Dandy_beautiful_girl_full_body_professional_color_grading_soft__7c7ed3aa-dc14-4cc7-b690-617c3a4ab855.png

Dandy [RUR]

Link to comment
Share on other sites

Slažem se ali samo donekle - prvo ovo ne bih rekao da je običan prompt koji pravi neko ko je laik na polju fotografije 🙂 Drugo rezultati su daleko od sjajnih, ja bih rekao da je samo ova četvrta riba stvarno super, ova plavuša bukvalno "vrišti" AI, dok su ove druge dve baš sumnjive, u smislu odmah bih se zapitao da li je AI ili ne. A čak i ova četvrta kad se zagledaš malo bolje ima probleme, tipa sise i haljina su joj ogromni, proporcija ne valja. Ako bi uradio krop od ramena na gore bi baš imala smisla, ali je opet to dodatna obrada naknadno. E sad kažem tu je opet šta ko gleda i kako, za 80-90% ljudi će ovo biti "joj, što su lepe ribe", a i definitivno će se sistemi usavršavati velikom brzinom pa se te dečije bolesti opeglaju možda već i za godinu-dve i postane ozbiljan alat koji će na primer da ubije stock fotografiju kao takvu. 

Drugo je pitanje pravne regulative - mislim da države trenutno baš kaskaju s time, a ključno pitanje je šta AI sme da koristi kao reference i kako se u tom slučaju nadoknađuju autorska prava autorima? Recimo muzička industrija je poprilično napravila ozbiljne korake da uguši AI koji je koristio za analizu autore kojima nisu istekla autorska prava. Kod vizuelnih stvari je to i dalje baš baš nejasno ali mislim da će morati brzo da se rešava. 

  • Downvote (-1) 2

Heghlu'meH QaQ jajvam

Link to comment
Share on other sites

Ceo sistem autorskih prava je glupost, po mom mišljenju. A ovde imaš veliku separaciju između osnovnog izvora i podataka koje AI ima u bazi, plus je sve što se generiše derivat i zasebno delo, tako da ne vidim pravnu osnovu za povredu autorskih prava. To bi bilo kao kada bi mene neko tužio jer sam iz glave nacrtao reprodukciju nekog dela koje sam video u galeriji.
Ali videćemo šta će da izmozgaju pravnici... sa njima se nikada ne zna

Dandy [RUR]

Link to comment
Share on other sites

On 3/10/2023 at 10:43 AM, Zwerko said:

Drugo je pitanje pravne regulative - mislim da države trenutno baš kaskaju s time, a ključno pitanje je šta AI sme da koristi kao reference i kako se u tom slučaju nadoknađuju autorska prava autorima? Recimo muzička industrija je poprilično napravila ozbiljne korake da uguši AI koji je koristio za analizu autore kojima nisu istekla autorska prava. Kod vizuelnih stvari je to i dalje baš baš nejasno ali mislim da će morati brzo da se rešava. 

ne razumem šta su uradili u muzičkoj industriji i kako mogu da uguše AI inače? AI je analizirao autore kojima NISU istekla autorska prava i od toga pravio nove pesme? Kako su ih uopšte povezali sa tim autorima i dokazali plagijate?

On 3/10/2023 at 11:07 AM, Dandy said:

Ceo sistem autorskih prava je glupost, po mom mišljenju. A ovde imaš veliku separaciju između osnovnog izvora i podataka koje AI ima u bazi, plus je sve što se generiše derivat i zasebno delo, tako da ne vidim pravnu osnovu za povredu autorskih prava. To bi bilo kao kada bi mene neko tužio jer sam iz glave nacrtao reprodukciju nekog dela koje sam video u galeriji.
Ali videćemo šta će da izmozgaju pravnici... sa njima se nikada ne zna

iskreno ne vidim kako ovo mogu da zabrane sa legalne strane.

ali ne sumnjam da mogu da nađu način da zabrane nekim "zakonom" kao "e jbg ne može AI soriška to nije kreirano od strane čoveka i samim tim nema pravu vrednost!"

Link to comment
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...