რა არის ხელოვნური ინტელექტის ტრენერი?

ხელოვნური ინტელექტი ზოგჯერ ჯადოსნურ ხრიკს ჰგავს. შემთხვევით კითხვას აკრიფებთ და ჰმმ - წამებში გხვდებათ გლუვი, დახვეწილი პასუხი. თუმცა, აი, რაშია საქმე: ყოველი „გენიალური“ მანქანის უკან რეალური ადამიანები დგანან, რომლებიც გზადაგზა მას უბიძგებენ, ასწორებენ და აყალიბებენ. ამ ადამიანებს ხელოვნური ინტელექტის ტრენერებიდა მათ მიერ შესრულებული სამუშაო უფრო უცნაური, სასაცილო და გულწრფელად რომ ვთქვათ, უფრო ადამიანურია, ვიდრე ადამიანების უმეტესობა ფიქრობს.

მოდით, განვიხილოთ, თუ რატომ არიან ეს ტრენერები მნიშვნელოვანი, როგორია მათი ყოველდღიურობა სინამდვილეში და რატომ იზრდება ეს როლი უფრო სწრაფად, ვიდრე ვინმე ვარაუდობდა.

სტატიები, რომელთა წაკითხვაც შეიძლება მოგეწონოთ ამის შემდეგ:

🔗 რა არის ხელოვნური ინტელექტის არბიტრაჟი: სიმართლე პოპულარული სიტყვის მიღმა
განმარტავს ხელოვნური ინტელექტის არბიტრაჟს, მის რისკებს, სარგებელს და გავრცელებულ მცდარ წარმოდგენებს.

🔗 ხელოვნური ინტელექტის მონაცემთა შენახვის მოთხოვნები: რა უნდა იცოდეთ
მოიცავს ხელოვნური ინტელექტის სისტემების შენახვის საჭიროებებს, მასშტაბირებას და ეფექტურობას.

🔗 ვინ არის ხელოვნური ინტელექტის მამა?
იკვლევს ხელოვნური ინტელექტის პიონერებს და ხელოვნური ინტელექტის საწყისებს.

რა ხდის ხელოვნური ინტელექტის ტრენერს სანდოს? 🏆

ეს ღილაკების დაჭერა არ არის. საუკეთესო მწვრთნელები ნიჭის საკმაოდ უცნაურ ნაზავს ეყრდნობიან:

მოთმინება (დიდი რაოდენობით) - მოდელები ერთბაშად არ სწავლობენ. ტრენერები ერთი და იგივე შესწორებებს მანამ ასრულებენ, სანამ არ დაკმაყოფილდებიან.
ნიუანსების აღმოჩენა - სარკაზმის, კულტურული კონტექსტის ან მიკერძოების დაჭერა არის ის, რაც ადამიანურ უკუკავშირს უპირატესობას ანიჭებს [1].
მარტივი კომუნიკაცია - სამუშაოს ნახევარი ისეთი მკაფიო ინსტრუქციების დაწერაა, რომელთა არასწორად წაკითხვა ხელოვნურ ინტელექტს არ შეუძლია.
ცნობისმოყვარეობა + ეთიკა - კარგი ტრენერი ეჭვქვეშ აყენებს, არის თუ არა პასუხი „ფაქტობრივად სწორი“, მაგრამ სოციალურად ყრუ - ხელოვნური ინტელექტის ზედამხედველობის მთავარი თემა [2].

მარტივად რომ ვთქვათ: ტრენერი ნაწილობრივ მასწავლებელია, ნაწილობრივ რედაქტორი და ოდნავ ეთიკოსიც.

ხელოვნური ინტელექტის მწვრთნელის როლები ერთი შეხედვით (გარკვეული თავისებურებებით 😉)

როლის ტიპი	ვინ ჯდება საუკეთესოდ	ტიპიური ანაზღაურება	რატომ მუშაობს (ან არ მუშაობს)
მონაცემთა ეტიკეტირების პროგრამა	ადამიანები, რომლებსაც უყვართ დახვეწილი დეტალები	დაბალი–საშუალო $$	აბსოლუტურად გადამწყვეტი მნიშვნელობა აქვს; თუ ეტიკეტები უხარისხოა, მთელი მოდელი ზარალდება [3] 📊
RLHF სპეციალისტი	მწერლები, რედაქტორები, ანალიტიკოსები	საშუალო–მაღალი $$	ახდენს პასუხების რანჟირებას და გადაწერას, რათა ტონი და სიცხადე შეესაბამებოდეს ადამიანის მოლოდინებს [1]
დომენის ტრენერი	იურისტები, ექიმები, ექსპერტები	მთელ რუკაზე 💼	ამუშავებს ნიშურ ჟარგონსა და უახლეს შემთხვევებს ინდუსტრიის სპეციფიკური სისტემებისთვის
უსაფრთხოების მიმომხილველი	ეთიკის მოყვარული ადამიანები	საშუალო $$	იყენებს მითითებებს, რათა ხელოვნური ინტელექტი თავიდან აიცილოს მავნე კონტენტი [2][5]
კრეატიული ტრენერი	მხატვრები, მთხრობელები	არაპროგნოზირებადი 💡	ეხმარება ხელოვნურ ინტელექტს წარმოსახვის გამოხატვაში, უსაფრთხო საზღვრებში დარჩენისას [5]

(დიახ, ფორმატირება ცოტა არეულია - დაახლოებით ისე, როგორც თავად სამუშაო.)

ხელოვნური ინტელექტის მწვრთნელის ცხოვრებიდან ერთი დღე

მაშ, როგორ გამოიყურება სინამდვილეში ნამუშევარი? წარმოიდგინეთ ნაკლებად მომხიბვლელი კოდირება და მეტი:

ხელოვნური ინტელექტის მიერ დაწერილი პასუხების რანჟირება ყველაზე ცუდიდან საუკეთესომდე (კლასიკური RLHF ნაბიჯი) [1].
გაუგებრობების გამოსწორება (მაგალითად, როდესაც მოდელი ივიწყებს, რომ ვენერა მარსი არ არის).
ჩატბოტის პასუხების გადაწერა ისე, რომ ისინი უფრო ბუნებრივად ჟღერდეს.
ტექსტის, სურათების ან აუდიოს მთების მონიშვნა - სადაც სიზუსტე ნამდვილად მნიშვნელოვანია [3].
კამათი იმის შესახებ, საკმარისად კარგია თუ არა „ტექნიკურად სწორი“ თუ უსაფრთხოების სახელმძღვანელო მითითებები უნდა გადაფაროს [2].

ეს ნაწილობრივ შრომატევადია, ნაწილობრივ კი თავსატეხი. გულწრფელად რომ ვთქვათ, წარმოიდგინეთ, თუთიყუშს არა მხოლოდ ლაპარაკს ასწავლით, არამედ სიტყვების ოდნავ არასწორად გამოყენების შეწყვეტასაც - ეს არის განწყობა. 🦜

რატომ არიან მწვრთნელები გაცილებით მნიშვნელოვანი, ვიდრე თქვენ გგონიათ

ადამიანების მართვის გარეშე, ხელოვნური ინტელექტი შეძლებდა:

ხმა მკაცრი და რობოტულია.
უკონტროლოდ გავრცელებული მიკერძოება (საშინელი აზრი).
საერთოდ მენატრება იუმორი ან თანაგრძნობა.
ნაკლებად უსაფრთხოდ იყავით მგრძნობიარე კონტექსტში.

ტრენაჟორები არიან ისინი, ვინც ფარულად ახერხებენ „არეული ადამიანური ნივთების“ - ჟარგონის, სითბოს, ზოგჯერ უხერხული მეტაფორების - შეღწევას და ამავდროულად, უსაფრთხოებისთვის დამცავ ბარიერებს იყენებენ [2][5].

უნარები, რომლებიც რეალურად მნიშვნელოვანია

დაივიწყეთ მითი, რომ დოქტორის ხარისხი გჭირდებათ. ყველაზე მეტად რაც დაგეხმარებათ არის:

წერის + რედაქტირების ხრიკები - დახვეწილი, მაგრამ ბუნებრივი ჟღერადობის ტექსტი [1].
ანალიტიკური აზროვნება - მოდელის განმეორებითი შეცდომების აღმოჩენა და მათი კორექტირება.
კულტურული ცნობიერება - იმის ცოდნა, თუ როდის შეიძლება ფრაზის გამოყენება არასწორად წარიმართოს [2].
მოთმინება - რადგან ხელოვნური ინტელექტი მყისიერად არ ითვისებს.

ბონუს ქულები მრავალენოვანი უნარებისთვის ან ნიშური ექსპერტიზისთვის.

სადაც მწვრთნელები გამოჩნდებიან 🌍

ეს სამსახური მხოლოდ ჩატბოტებს არ ეხება - ის ყველა სექტორში შეღწევას გულისხმობს:

ჯანდაცვა - მოსაზღვრე შემთხვევებისთვის ანოტაციის წესების დაწერის წესი (გამოძახილია ჯანდაცვის ხელოვნური ინტელექტის სახელმძღვანელოში) [2].
ფინანსები - თაღლითობის გამოვლენის სისტემების ტრენინგი ადამიანების ცრუ განგაშის გარეშე [2].
საცალო ვაჭრობა - სწავლების ასისტენტები, რათა მათ შეძლონ მყიდველებისთვის ჟარგონული ჟარგონით სარგებლობა და ამავდროულად ბრენდის ტონის დაცვა [5].
განათლება - რეპეტიტორული ბოტების ისე ჩამოყალიბება, რომ ისინი წახალისებისკენ იყოს მიმართული და არა მფარველობისკენ [5].

არსებითად: თუ ხელოვნურ ინტელექტს მაგიდასთან ადგილი აქვს, ფონზე მწვრთნელი იმალება.

ეთიკის ნაწილი (ამის გამოტოვება შეუძლებელია)

სწორედ აქ ხდება ეს მნიშვნელოვანი. უკონტროლოდ დატოვებული ხელოვნური ინტელექტი იმეორებს სტერეოტიპებს, დეზინფორმაციას ან უარესს. ტრენერები ამას აჩერებენ ისეთი მეთოდების გამოყენებით, როგორიცაა RLHF ან კონსტიტუციური წესები, რომლებიც მოდელებს სასარგებლო, უვნებელი პასუხებისკენ მიმართავენ [1][5].

მაგალითი: თუ ბოტი მიკერძოებულ სამუშაო რეკომენდაციებს გვთავაზობს, ტრენერი ამას აღნიშნავს, წესების წიგნს გადაწერს და უზრუნველყოფს, რომ ეს აღარ განმეორდეს. ეს არის ზედამხედველობა მოქმედებაში [2].

არც ისე სახალისო მხარე

ყველაფერი იდეალურად არ არის. მწვრთნელები შემდეგ საკითხებს აგვარებენ:

ერთფეროვნება - დაუსრულებელი იარლიყების მიკერება მოძველებულია.
ემოციური დაღლილობა - მავნე ან შემაშფოთებელი კონტენტის განხილვას შეიძლება უარყოფითი შედეგები მოჰყვეს; დამხმარე სისტემები გადამწყვეტია [4].
აღიარების ნაკლებობა - მომხმარებლები იშვიათად აცნობიერებენ ტრენერების არსებობას.
მუდმივი ცვლილება - ინსტრუმენტები განუწყვეტლივ ვითარდება, რაც იმას ნიშნავს, რომ ტრენერებმა ფეხი უნდა აიწყონ.

მიუხედავად ამისა, ბევრისთვის ტექნოლოგიების „ტვინის“ ჩამოყალიბების მღელვარება მათ დამოკიდებულს ინარჩუნებს.

ხელოვნური ინტელექტის ფარული MVP-ები

მაშ ასე, ვინ არიან ხელოვნური ინტელექტის ტრენერები? ისინი წარმოადგენენ ხიდს ნედლ ალგორითმებსა და სისტემებს შორის, რომლებიც რეალურად მუშაობს ადამიანებისთვის. მათ გარეშე, ხელოვნური ინტელექტი იქნებოდა ბიბლიოთეკარის გარეშე ბიბლიოთეკის მსგავსი - უამრავი ინფორმაცია, მაგრამ მისი გამოყენება თითქმის შეუძლებელია.

შემდეგ ჯერზე, როდესაც ჩატბოტი გაგაცინებთ ან გაოცებთ, რომ თავს „ტონუსში“ იგრძნობთ, მადლობა გადაუხადეთ ტრენერს. ისინი ჩუმი ფიგურები არიან, რომლებიც მანქანებს არა მხოლოდ გამოთვლით, არამედ ერთმანეთთან აკავშირებენ [1][2][5].

ცნობები

[1] ოუიანგი, ლ. და სხვ. (2022). ენობრივი მოდელების სწავლება ინსტრუქციების შესრულებისთვის ადამიანის უკუკავშირის გამოყენებით (InstructGPT). NeurIPS. ბმული

[2] NIST (2023). ხელოვნური ინტელექტის რისკების მართვის ჩარჩო (AI RMF 1.0). ბმული

[3] ნორთკატი, ს. და სხვ. (2021). ტესტის ნაკრებებში გავრცელებული ეტიკეტის შეცდომები არღვევს მანქანური სწავლების საორიენტაციო ნიშნულებს. NeurIPS მონაცემთა ნაკრებები და საორიენტაციო ნიშნულები. ბმული

[4] ჯანმო/შრომის საერთაშორისო ორგანიზაცია (2022). სამსახურში ფსიქიკური ჯანმრთელობის შესახებ სახელმძღვანელო პრინციპები. ბმული

[5] ბაი, ი. და სხვ. (2022). კონსტიტუციური ხელოვნური ინტელექტი: ხელოვნური ინტელექტის უკუკავშირისგან უვნებლობა. arXiv. ბმული

იპოვეთ უახლესი ხელოვნური ინტელექტი ოფიციალურ ხელოვნური ინტელექტის ასისტენტების მაღაზიაში

ჩვენს შესახებ

ბლოგზე დაბრუნება