ხელოვნების სტილები ხელოვნური ინტელექტისთვის

ხელოვნური ინტელექტის ხელოვნების სტილები: შემოქმედებითი შესაძლებლობების შესწავლა

ხელოვნური ინტელექტი აღარ არის ჩარჩენილი ცხრილებში. ის ხატავს, ხატავს, კოლაჟს აკეთებს - ზოგჯერ შემაშფოთებლად კარგადაც. თუ ოდესმე დაჯდებით და გიფიქრიათ, კარგი, მაგრამ როგორ ვუთხრა ხელოვნურ ინტელექტს, რა დახატოს? - სწორედ აქ ჩნდება „ხელოვნური ინტელექტის მხატვრული სტილების“ იდეა.

ქვემოთ განვიხილავთ, თუ რომელი სტილებია ყველაზე მეტად გამოსადეგი ტექსტის სურათად გარდაქმნის სისტემებში, რატომ და როგორ შეგიძლიათ მათი მართვა საკუთარი ნაპერწკლის დაკარგვის გარეშე. პრაქტიკული ტესტირების შედეგად მიღებულ რამდენიმე პრაქტიკულ შენიშვნას (მათ შორის, რა გამომივიდა სინამდვილეში რამდენიმე გაშვების შემდეგ) და რამდენიმე ტექნიკურ დეტალს დავურთავ, რათა პროცესი ნაკლებად დაემსგავსოს კამათლის გაგორებას [1][2][3][4][5].

სტატიები, რომელთა წაკითხვაც შეიძლება მოგეწონოთ ამის შემდეგ:

🔗 როგორ შევქმნათ ხელოვნური ინტელექტის ხელოვნება: სრული სახელმძღვანელო დამწყებთათვის
ეტაპობრივი სახელმძღვანელო დამწყებთათვის ხელოვნური ინტელექტით გენერირებული ციფრული ნამუშევრების შესაქმნელად.

🔗 ხელოვნური ინტელექტით გენერირებული ხელოვნების გარიჟრაჟი: კრეატიულობის გათავისუფლება თუ დავის გაღვივება
ხელოვნური ინტელექტის მიერ გენერირებული ხელოვნების გარშემო კრეატიულობის, ეთიკისა და დებატების შესწავლა.

🔗 გრაფიკული დიზაინისთვის საუკეთესო ხელოვნური ინტელექტის ინსტრუმენტები: საუკეთესო ხელოვნურ ინტელექტზე დაფუძნებული დიზაინის პროგრამული უზრუნველყოფა
აღმოაჩინეთ ძლიერი ხელოვნური ინტელექტის ინსტრუმენტები, რომლებიც თანამედროვე გრაფიკული დიზაინის სამუშაო პროცესებს გარდაქმნიან.


რა ხდის ხელოვნური ინტელექტის ხელოვნების სტილებს რეალურად კარგს? ✨

სტილის არჩევა მხოლოდ ტენდენციების დევნა არ არის. ზოგიერთი სტილის შენარჩუნება მოდელებისთვის უბრალოდ უფრო ადვილია. რამდენიმე მიზეზი, თუ რატომ:

  • სიცხადე - სტილები ნამდვილად განსხვავებული „წესებით“ (კუბიზმის დაქუცმაცებული გეომეტრია; მანგას ხაზებით გაჯერებული პანელები) უფრო განმეორებადია, რადგან სამიზნე ვიზუალი დიდად არ იცვლის მიმართულებას [3][4].

  • მოქნილობა - შერწყმისადმი მეგობრული სტილები (ვთქვათ, „კიბერპანკი + რეალიზმი“) თანამედროვე დიფუზიის მოდელებს საშუალებას აძლევს, დაეყრდნონ ჯვარედინი ყურადღების კონცენტრაციას, რათა ყველაფერი სუფთად შეურიონ ერთმანეთს [1].

  • ამოცნობადობა - სტილები, რომლებიც სასწავლო მონაცემებში ათასჯერ არის ნანახი (ანიმე, იმპრესიონიზმი, ფოტორეალიზმი), უფრო ზუსტად ჩანს [2].

  • განწყობა/ატმოსფერო - ისეთი სიტყვები, როგორიცაა „მელანქოლიური“, „მშვიდი“ ან „ნეონის შუქით განათებული“, საიმედოდ ცვლის განათებას, პალიტრას და კომპოზიციას ისე, რომ განზრახ იგრძნობა [5].

მიზანი არ არის რაიმე კლინიკური „სიზუსტე“. ეს არის სტილი, როგორც თქვენი განწყობის ან ისტორიის კონტეინერი - და იმის სწავლა, თუ როგორ უნდა წაახალისოთ მოდელი ისე, რომ მან შეძლოს ამ კონტეინერში არაერთხელ მოხვედრა.


როგორ „ხედავს“ ხელოვნური ინტელექტი სტილს (მარტივი ვერსია, ჟარგონის გადატვირთვის გარეშე)

თანამედროვე ტექსტიდან გამოსახულებამდე გარდაქმნის მოდელები სამ რამეს აერთიანებს:

  1. ტექსტისა და სურათის შესაბამისობა - CLIP-ის მსგავსი სისტემები სწავლობენ, „რომელი სიტყვები რომელ იერსახეს შეესაბამება“. ამიტომ, როდესაც ამბობთ „gritty ink wash“, ის ამ ფრაზას ვიზუალურ სურათებს აკავშირებს [3].

  2. დიფუზია ლატენტურ სივრცეში - ფარული დიფუზია თანდათან ამძაფრებს ხმაურიან გამოსახულებას თქვენი აღწერილობის შესაბამისად. ასე აღწევს ის როგორც ეფექტურობას, ასევე კონტროლს [1].

  3. სწრაფი მოდიფიკატორები - პატარა „საზოგადოებრივი ხრიკები“ - კინემატოგრაფიული განათება, რგოლის განათება, მაღალი კონტრასტის მქონე ფირის მარცვლოვანება - რეგულირებადი ციფერბლატების მსგავსია, რომელთა ერთმანეთზე დაწყობა შეგიძლიათ [5].

რატომ არის ეს მნიშვნელოვანი: თუ სტილი ნათლად არსებობს ტრენინგის მონაცემებში და თქვენ აღწერთ მას სწორი დამატებებით, თქვენ სწრაფად მიიღებთ თანმიმდევრულ შედეგებს [1][2][5].


შედარების ცხრილი: ხელოვნური ინტელექტის პოპულარული ხელოვნების სტილები 🖌️

არეული, მაგრამ სასარგებლო შთამაგონებელი ფურცელი მოდის:

ხელოვნების სტილი აუდიტორია ფასი (AI ინსტრუმენტები) რატომ მუშაობს
რეალიზმი ფოტოგრაფები, ბრენდები უფასო – $$$ გამოიყურება დახვეწილი და სანდო
ანიმე/მანგა ახალგაზრდა გულშემატკივრები, მოთამაშეები უფასო - საშუალო ფასი ძლიერი ხაზოვანი სტრუქტურა; მყისიერად იკითხება
სიურეალიზმი კრეატიულები, მეოცნებეები თავისუფალი უცნაური ნაზავები კარგად ერგება დიფუზიას
კიბერპანკი ტექნოლოგიების მოყვარულები, ფუტურისტები ხშირად უფასო დამატებები ნეონი + კონტრასტი = მყისიერი „ვაუ“ ფაქტორი ⚡
იმპრესიონიზმი ხელოვნების მოყვარულები საშუალო ფასი მსუბუქი + ფუნჯისებრი ტექსტურები მოდელისთვის შესაფერისია
დაბალი პოლი 3D დიზაინერები, დეველოპერები მრავალფეროვანი მარტივი გეომეტრია შედეგებს თანმიმდევრულს ხდის
პიქსელ არტი მოთამაშეები, ნოსტალგიის მაძიებლები უფასო (ძირითადად) მკაცრი შეზღუდვების სახელმძღვანელოს შემადგენლობა

ველის ხატვა: კიბერპანკის შემთხვევაში, „რბილი რგოლის განათება + მოცულობითი ნისლი“ ზედმეტად სუფთა გამოსავლის თავიდან ასაცილებლად, გამოიყენეთ „8-ბიტიანი, 32×32, შეზღუდული პალიტრა“


ღრმა ანალიზი: რეალიზმი სიურეალიზმის წინააღმდეგ 🎭

რეალიზმი პროპორციებსა და დეტალებზეა ორიენტირებული - იდეალურია მარკეტინგული შეჯიბრებებისთვის ან პროდუქტის დიზაინისთვის, სადაც დამაჯერებლობა მნიშვნელოვანია. ისეთი მინიშნებები, როგორიცაა ფოტორეალური, ზედაპირული ხედვის სიღრმე, სტუდიური განათება, 85 მმ ლინზა, ხელოვნურ ინტელექტს მკაფიო ტექნიკურ საყრდენს აძლევს.

სიურეალიზმი, მეორე მხრივ, უცნაურობისკენ იხრება. დიფუზიური მოდელები აქ ნამდვილად ბრწყინავს: „საათებისგან დამზადებული ლოკოკინა“, „ვიოლინოს სიმებიანი ქალაქი“ - ისეთი რაღაცეები, რისი რაციონალიზაციაც ადამიანებს არ შეუძლიათ, მაგრამ მოდელს ვიზუალურად შეუძლია ერთმანეთთან შეერთება. ეს არის ყურადღების გადაკვეთა, რომელიც ჩუმად ახდენს თავის მაგიას [1]. კარგი თეგები: სიზმრისეული, შეუძლებელი გეომეტრია, ეშერისეული .


ანიმე და მანგა: ხელოვნური ინტელექტის საყვარელი 🌸

ანიმე/მანგა თითქმის უსამართლოდ ეფექტურია. განსაზღვრული ხაზოვანი, უჯრედების დაჩრდილვა და ხატოვანი პროპორციები მოდელს ანიჭებს ჩაკეტილ შაბლონს, გარდა ამისა, ეს სასაცილოდ გავრცელებულია სავარჯიშო მონაცემებში [2]. და ჰიბრიდები? ოქრო. სცადეთ კიბერპანკ ანიმე სამურაი ან სტიმპანკ მანგა დეტექტივი .

ხარაჩოების მინიშნება, რომლებზეც უნდა დაეყრდნოთ:

  • „ანიმეს ძირითადი ვიზუალი, დინამიური პოზა, სუფთა ხაზოვანი გამოსახულება, ელფერი, ექსპრესიული თვალები, დეტალური ფონი“

  • „მანგას პანელი, ეკრანის ტონის დაჩრდილვა, ჰოლანდიური კუთხე, ტუშის აქცენტი“

შენიშვნა: თუ გამომავალი სურათები ბუნდოვანია, გამოიყენეთ „სუფთა ხაზოვანი, ბრტყელი დაჩრდილვა“ ან შეზღუდეთ ფერები „შეზღუდული პალიტრით“.


კიბერპანკი და ფუტურისტული სტილები ⚡

ნეონის აბრები, ქრომირებული ანარეკლი, წვიმიანი ღამეები - მოდელი ამას სრულად უმკლავდება. Diffusion შესანიშნავად უმკლავდება მაღალი კონტრასტის განათებას + ამრეკლავ მასალებს . ისეთი წარწერები, როგორიცაა „ნეონის შუქით განათებული ხეივანი, მოცულობითი ნისლი, გუბის ანარეკლი“, ხშირად პოსტერისთვის იდეალურად გამოიყურება.

გამოსწორების რჩევა: ცვილის მსგავსი ზედაპირები? მოთხოვნაში „ზედაპირისქვეშა გაფანტვა, ფირისებრი დახარისხება“


იმპრესიონიზმი და ფერწერული ტექსტურები 🎨

აქ დეტალი არ არის მთავარი. იმპრესიონიზმი ხარობს რბილი კიდეებით, გატეხილი ფერებითა და სინათლის თამაშით. ისეთი შტრიხები, როგორიცაა ხილული ფუნჯის შტრიხები, პლენარული განათება, ოქროს საათი, კარგად მუშაობს. მოდელი გვთავაზობს დეტალებს ზედმეტი რენდერინგის გარეშე, რაც - სასაცილოა - როგორც ავთენტური, ასევე გამოთვლითი თვალსაზრისით მარტივი [4].


მინიმალიზმი, პიქსელ-არტი და რეტრო 🕹️

შეზღუდვები ამარტივებს. დაბალი პოლიგრაფია გეომეტრიის სიცხადეს ეყრდნობა; პიქსელური გრაფიკა გარჩევადობით + პალიტრით ფიქსირდება.

სასარგებლო ჩარჩოები:

  • „დაბალი პოლი დიორამა, მყარი კიდეები, ბრტყელი დაჩრდილვა, გარემოს ოკლუზია“

  • „პიქსელური არტი, 32×32 სპრაიტი, NES სტილი, შეზღუდული ყოყმანი“

შენიშვნა: თუ პიქსელური არტი ზედმეტად პრიალა გამოიყურება, ანალოგური სიმკვეთრისთვის „CRT სკანირების ხაზები, ცვალებადი ჩრდილები“


ჰიბრიდული მიქსები: სადაც ხელოვნური ინტელექტი ბრწყინავს ✨

ველური ბარათი: ჯვარედინი დამტვერვა. დიფუზია საშუალებას გაძლევთ გააერთიანოთ ისეთი გავლენები, რომლებსაც მხატვრების უმეტესობა არ შეეხებოდა - ვან გოგის კიბერპანკი , ანიმე ნუარის კუბიზმი , რენესანსის მექა ანგელოზი. ეს ნეირონული სტილის გადაცემის 2.0-ს ჰგავს, მაგრამ გაცილებით კონტროლირებადია [1][4].

რეცეპტის ფორმატი:
[თემა] + [ერა/მოძრაობა] + [განათება] + [საშუალება/მასალა] + [კომპოზიცია] + [პალიტრა/განწყობა]

მაგ.: „მევიოლინე სახურავზე - იმპრესიონისტული ზეთის ნახატი - ოქროს საათის განათება - ცენტრიდან გადახრილი - ნოსტალგიური პალიტრა“.


სწრაფი შაბლონები, რომლებიც რეალურად ცვლის შედეგებს 🛠️

განმეორებითი საცდელი გაშვებიდან:

  1. საშუალო + სტილის შეხამება განმარტავს კიდეებს/ტექსტურებს: ზეთის სიურეალიზმი, ციფრული მანგა [5].

  2. „Lighting First“ რეალიზმს სიტყვების დალაგებაზე მეტად ცვლის.

  3. კამერის ენა (კუთხეები, ლინზების სიგრძე) მყისიერ პროგნოზირებადობას უზრუნველყოფს.

  4. შეზღუდვები მნიშვნელოვანია - ისინი აშკარად აიძულებენ გარჩევადობას/პალიტრას მინიმალიზმის ან პიქსელური ხელოვნებისთვის.

  5. მცირე რედაქტირებები > დიდი გადაწერები . „ნეონის“ → „ნატრიუმის ორთქლის“ შეცვლა ხშირად უფრო ეფექტურია, ვიდრე სრული რემონტი [5].


რეალობის სწრაფი შემოწმება 🔍

  • მიკერძოება - ონლაინში გავრცელებული სტილები (ანიმე, ფოტორეალიზმი) დომინირებს შედეგებში; იშვიათ სტილებს სჭირდებათ მითითება ან დახვეწა [2].

  • რატომ მუშაობს სიურეალი - Diffusion-ის სიმკვეთრე ანატომიის ხარვეზებს მალავს - უცნაურ ნივთებს განზრახ შექმნილს ხდის [1].

  • სტრიქონის დრიფტი - თუ ყველა შედეგი ერთნაირად გამოიყურება, თემის გადახედვამდე შეცვალეთ მოდიფიკატორები [5].

  • უფლებები/ეთიკა - მონაცემთა ნაკრებები ფართოდ გამოიყენება; შედეგების გამოყენება პასუხისმგებლობით, განსაკუთრებით კომერციული მიზნებისთვის [2].


მინი-ჩანაწერები (ჩემი სენდბოქსიდან) 🧪

  • კიბერპანკ პორტრეტი - „პორტრეტი, ფირუზისფერ-მეწამული ნეონი, წვიმიანი ხეივანი, რგოლის განათება, 85 მმ, კინემატოგრაფიული ბოკე“.
    იმუშავა, რადგან: ლინზა + განათება იდეალურად აშორებდა სუბიექტს/ფონის ფერს.

  • იმპრესიონისტული პეიზაჟი - „მდინარის პირა ოქროს საათში, იმპრესიონისტული ზეთის საღებავი, ხილული ფუნჯის შტრიხები“.
    ეფექტური იყო, რადგან: საშუალო სიზუსტის ტექსტურა, განათება სითბოს ავლენდა.

  • Pixel-Art Creature - „32×32 პიქსელიანი დრაკონი, შეზღუდული ცვალებადობა, 1 პიქსელიანი კონტური, იზომეტრიული“
    იმუშავა, რადგან: შეზღუდვებმა შეაჩერა დაგლუვება.


სწრაფი მითითების მოთხოვნები (კოპირება/ჩასმა)

  • რეალიზმი (პროდუქტი): „სტუდიური პროდუქტის ფოტო, softbox განათება, 50 მმ ლინზა, პრიალა კერამიკა, სუფთა სქრომა“

  • ანიმე მოქმედება: „ანიმეს ძირითადი ვიზუალი, შემოკლებული დინამიური პოზა, ცელულიტის დაჩრდილვა, სიჩქარის ხაზები“

  • სიურეალისტური კოლაჟი: „ოცნების პეიზაჟი, შეუძლებელი გეომეტრია, მცურავი კიბეები, რბილი ნისლი, ოქროს საათის სინათლის მარცვლები“

  • დაბალი პოლიგრაფიული სცენა: „იზომეტრიული დაბალი პოლიგრაფიული ქალაქი, ბრტყელი დაჩრდილვა, ამბიენტური ოკლუზია, პასტელის პალიტრა“

  • იმპრესიონისტული პორტრეტი: „ზეთი ტილოზე, ფუნჯის თავისუფალი ნაზავი, რგოლის განათება, იმპასტოს ელფერები“


შეჯამება 🖼️

„ხელოვნური ინტელექტის ხელოვნების სტილები“ ​​წესების წიგნები არ არის - ისინი სათამაშო მოედნებია. რეალიზმი მუშაობს, როდესაც ნდობა მნიშვნელოვანია; სიურეალიზმი, როდესაც რეალობის გატეხვა გსურთ; ანიმე/მანგა, როდესაც გჭირდებათ სიცხადე და სტილების შერევის შესაძლებლობა. გამარჯვებული სტრატეგია სტრუქტურირებული თამაშია: აირჩიეთ სტილი, აირჩიეთ განათება + საშუალება, დაამატეთ რამდენიმე მოდიფიკატორი და შემდეგ გაიმეორეთ. თუ ეს გაგრძნობინებთ - თუნდაც უცნაურად არასრულყოფილი იყოს - თქვენ ზონაში ხართ.


ცნობები

[1] რომბახი, რ. და სხვ. (2022). მაღალი გარჩევადობის გამოსახულების სინთეზი ლატენტური დიფუზიური მოდელებით (CVPR). PDF
[2] შუმანი, ს. და სხვ. (2022). LAION-5B: ღია მასშტაბური მონაცემთა ნაკრები ახალი თაობის გამოსახულება-ტექსტის მოდელების ტრენინგისთვის. PDF
[3] რადფორდი, ა. და სხვ. (2021). ტრანსფერული ვიზუალური მოდელების შესწავლა ბუნებრივი ენის ზედამხედველობიდან (CLIP). PDF
[4] გეტისი, ლ. და სხვ. (2016). გამოსახულების სტილის გადაცემა კონვოლუციური ნეირონული ქსელების გამოყენებით (CVPR). PDF
[5] ოპენლენდერი, ჯ. (2024). ტექსტიდან გამოსახულებად გენერირების მოთხოვნის მოდიფიკატორების ტაქსონომია. ქცევა და ინფორმაციული ტექნოლოგიები. სტატია


იპოვეთ უახლესი ხელოვნური ინტელექტი ოფიციალურ ხელოვნური ინტელექტის ასისტენტების მაღაზიაში

ჩვენს შესახებ

ბლოგზე დაბრუნება