რა არის ჰუმანოიდი რობოტის ხელოვნური ინტელექტი?

ჰუმანოიდი რობოტის ხელოვნური ინტელექტი არის იდეა - და სულ უფრო ხშირად პრაქტიკა - ადაპტირებადი ინტელექტის ჩანერგვის მანქანებში, რომლებიც ასახავს ჩვენს ძირითად ფორმას. ორი ხელი, ორი ფეხი, სენსორები იქ, სადაც შეიძლება იყოს სახე და ტვინი, რომელსაც შეუძლია დანახვა, გადაწყვეტილების მიღება და მოქმედება. ეს თავისთავად სამეცნიერო ფანტასტიკური ქრომი არ არის. ადამიანის ფორმა პრაქტიკული ხრიკია: სამყარო ადამიანებისთვისაა შექმნილი, ამიტომ რობოტს, რომელიც იზიარებს ჩვენს კვალს, სახელურებს, კიბეებს, ხელსაწყოებს და სამუშაო სივრცეებს, თეორიულად, პირველივე დღეს მეტის გაკეთება შეუძლია. ელეგანტური ქანდაკების აშენების თავიდან ასაცილებლად, მაინც გჭირდებათ შესანიშნავი აპარატურა და სერიოზული ხელოვნური ინტელექტის ნაკრები. თუმცა, ნაწილები უფრო სწრაფად ერთდება, ვიდრე უმეტესობა მოელის. 😉

თუ გსმენიათ ისეთი ტერმინები, როგორიცაა განსახიერებული ხელოვნური ინტელექტი, ხედვა-ენა-მოქმედების მოდელები ან რობოტების თანამშრომლობითი უსაფრთხოება და აზროვნება... მაგარი სიტყვებია, ახლა კი რა - ეს სახელმძღვანელო ყველაფერს უბრალო ენით, ქვითრებითა და ოდნავ არეული ცხრილით განმარტავს.

სტატიები, რომელთა წაკითხვაც შეიძლება მოგეწონოთ ამის შემდეგ:

🔗 რამდენად მალე დაიკავებენ ილონ მასკის რობოტები თქვენს სამსახურს?
იკვლევს ჰუმანოიდური სამუშაო ადგილის ავტომატიზაციის ვადებს, შესაძლებლობებსა და რისკებს.

🔗 რა არის ხელოვნური ინტელექტის მიკერძოება, მარტივად ახსნილი
განმარტება, გავრცელებული წყაროები, რეალური მაგალითები და შერბილების სტრატეგიები.

🔗 რას აკეთებს ხელოვნური ინტელექტის ტრენერი?
როლი, უნარები, სამუშაო პროცესები და კარიერული გზები მოდელების სწავლებაში.

🔗 პროგნოზირებადი ხელოვნური ინტელექტი დამწყებთათვის -
როგორ პროგნოზირებენ პროგნოზირებადი მოდელები შედეგებს, გამოყენების შემთხვევებსა და ზღვრებს.

რა არის ზუსტად ჰუმანოიდი რობოტის ხელოვნური ინტელექტი?

თავისი არსით, ჰუმანოიდი რობოტის ხელოვნური ინტელექტი სამ რამეს აერთიანებს:

ჰუმანოიდური ფორმა - სხეულის გეგმა, რომელიც დაახლოებით ჩვენსას იმეორებს, ამიტომ მას შეუძლია კიბეებზე ასვლა, თაროებზე მისვლა, ყუთების გადაადგილება, კარების გაღება, ხელსაწყოების გამოყენება.
განსახიერებული ინტელექტი - ხელოვნური ინტელექტი მხოლოდ ღრუბელში არ ლივლივებს; ის ფიზიკურ აგენტშია, რომელიც აღიქვამს, გეგმავს და მოქმედებს სამყაროში.
განზოგადებული კონტროლი - თანამედროვე რობოტები სულ უფრო ხშირად იყენებენ მოდელებს, რომლებიც აკავშირებენ ხედვას, ენასა და მოქმედებას, რათა ერთი პოლიტიკა გავრცელდეს სხვადასხვა ამოცანებზე. Google DeepMind-ის RT-2 წარმოადგენს ხედვა-ენა-მოქმედების (VLA) მოდელის კანონიკურ მაგალითს, რომელიც სწავლობს ვებ + რობოტის მონაცემებიდან და ამ ცოდნას რობოტის მოქმედებებად აქცევს [1].

უფრო მარტივი ვარიანტი: ჰუმანოიდი რობოტის ხელოვნური ინტელექტი არის რობოტი ადამიანის მსგავსი სხეულითა და ტვინით, რომელიც აერთიანებს ხედვას, გაგებას და შესრულებას - იდეალურ შემთხვევაში, მრავალ დავალებას შორის და არა მხოლოდ ერთში.

რა ხდის ჰუმანოიდ რობოტებს სასარგებლოს🔧🧠

მოკლე პასუხი: სახე არა, შესაძლებლობები. უფრო გრძელი პასუხი:

მობილურობა ადამიანურ სივრცეებში - კიბეები, ბილიკები, ვიწრო გასასვლელები, კარები, უხერხული კუთხეები. ადამიანის კვალი სამუშაო ადგილების ნაგულისხმევი გეომეტრიაა.
ოსტატური მანიპულირება - ორ კომპეტენტურ ხელს დროთა განმავლობაში შეუძლიათ მრავალი საქმის შესრულება ერთი და იგივე ბოლო ეფექტორით (თითო სამუშაოზე ნაკლები მორგებული დამჭერი).
მულტიმოდალური ინტელექტი - VLA მოდელები სურათებს + ინსტრუქციებს აკავშირებს მოქმედებად მოტორულ ბრძანებებთან და აუმჯობესებს დავალებების განზოგადებას [1].
თანამშრომლობისთვის მზადყოფნა - უსაფრთხოების კონცეფციები, როგორიცაა მონიტორინგის ქვეშ გაჩერებები, სიჩქარისა და დაშორების მონიტორინგი და სიმძლავრისა და ძალის შეზღუდვა, მომდინარეობს კოლაბორაციული რობოტის სტანდარტებიდან (ISO/TS 15066) და მასთან დაკავშირებული ISO უსაფრთხოების მოთხოვნებიდან [2].
პროგრამული უზრუნველყოფის განახლება - იგივე აპარატურას შეუძლია ახალი უნარების შეძენა მონაცემების, სიმულაციისა და განახლებული პოლიტიკის მეშვეობით (არ არის საჭირო ამწე-სატვირთის განახლება მხოლოდ ახალი ადგილის შესასწავლად) [1].

ჯერჯერობით ეს ყველაფერი „მარტივი ღილაკების“ მოთხოვნით არ შემოიფარგლება. თუმცა, სწორედ ამ კომბინაციის გამო იზრდება პროცენტი.

სწრაფი განმარტება, რომლის მოპარვაც სლაიდისთვის შეგიძლიათ 📌

ჰუმანოიდი რობოტის ხელოვნური ინტელექტი არის ინტელექტი, რომელიც აკონტროლებს ადამიანის ფორმის რობოტს, რათა აღიქვას, იმსჯელოს და იმოქმედოს ადამიანის გარემოში არსებული მრავალფეროვანი ამოცანების შესრულებისას, რაც ხორციელდება მოდელების მეშვეობით, რომლებიც აკავშირებენ ხედვას, ენასა და მოქმედებას, ასევე უსაფრთხოების პრაქტიკით, რაც საშუალებას იძლევა ადამიანებთან თანამშრომლობის [1][2].

დასტა: სხეული, ტვინი, ქცევა

თუ გონებრივად ჰუმანოიდებს სამ ფენად გამოყოფთ, სისტემა ნაკლებად იდუმალებით მოგეჩვენებათ:

კორპუსი - აქტივატორები, სახსრები, ბატარეა, სენსორები. მთელი სხეულის კონტროლი ბალანსისა და მანიპულირებისთვის, ხშირად მოქნილი ან ბრუნვის მომენტით კონტროლირებადი სახსრებით.
ტვინი - აღქმა + დაგეგმვა + კონტროლი. უფრო ახალი ტალღაა VLA: კამერის კადრები + ბუნებრივი ენის მიზნები → მოქმედებები ან ქვეგეგმები (RT-2 არის შაბლონი) [1].
ქცევა - რეალური სამუშაო პროცესები, რომლებიც შედგება ისეთი უნარებისგან, როგორიცაა არჩევანის გაკეთება-დახარისხება, ხაზზე მიწოდება, ჩანთების დამუშავება და ადამიან-რობოტის გადაცემა. პლატფორმები სულ უფრო ხშირად ათავსებენ ამ უნარებს ორკესტრირების ფენებში, რომლებიც უერთდება WMS/MES-ს, რათა რობოტი შეესაბამებოდეს დავალებას და არა პირიქით [5].

წარმოიდგინეთ ეს ისე, როგორც ადამიანი, რომელიც სამსახურში ახალ საქმეს სწავლობს: ხედავს, ესმის, დაგეგმავს, აკეთებს - შემდეგ კი ხვალ უკეთესად გააკეთებს.

სად ჩნდება დღეს ჰუმანოიდი რობოტის ხელოვნური ინტელექტი 🏭📦

განლაგებები კვლავ მიზნობრივია, მაგრამ ისინი მხოლოდ ლაბორატორიული დემონსტრაციები არ არის:

საწყობი და ლოჯისტიკა - ტოტების გადაადგილება, პალეტებიდან კონვეიერზე გადატანა, ბუფერული ამოცანები, რომლებიც განმეორებადი, მაგრამ ცვალებადი ხასიათისაა; მომწოდებლები ღრუბლოვან ორკესტრირებას პილოტური და WMS-თან ინტეგრაციის სწრაფ გზად მიიჩნევენ [5].
ავტომობილების წარმოება - Mercedes-Benz-ში Apptronik-ის Apollo-სთან ერთად პილოტები მოიცავდნენ ინსპექტირებას და მასალების დამუშავებას; ადრეული ამოცანები დისტანციური ოპერაციით სრულდებოდა და შემდეგ, სადაც ეს საიმედო იყო, ავტონომიურად სრულდებოდა [4].
მოწინავე კვლევა და განვითარება - უახლესი მობილურობა/მანიპულირება აგრძელებს მეთოდების ფორმირებას, რომლებიც დროთა განმავლობაში თანდათანობით ინერგება პროდუქტებში (და უსაფრთხოების შემთხვევებში).

მინი-შემთხვევების სქემა (რეალური პილოტებისგან): დაიწყეთ ვიწრო ხაზის მიწოდებით ან კომპონენტების შატლით; გამოიყენეთ ტელეოპტიკური/დახმარებული დემო ვერსიები მონაცემების შესაგროვებლად; შეაფასეთ ძალები/სიჩქარეები თანამშრომლობითი უსაფრთხოების ჩარჩოსთან მიმართებაში; შემდეგ განაზოგადეთ ქცევა მიმდებარე სადგურებზე. ეს არ არის მომხიბვლელი, მაგრამ მუშაობს [2][4].

როგორ სწავლობს ჰუმანოიდი რობოტის ხელოვნური ინტელექტი პრაქტიკაში 🧩

სწავლა ერთი რამ არ არის:

იმიტაცია და ტელეოპერაცია - ადამიანები ახდენენ ამოცანების დემონსტრირებას (VR/კინესთეტიკური/ტელეოპიური), რაც ავტონომიისთვის სათესლე მონაცემთა ნაკრებებს ქმნის. რამდენიმე პილოტი ღიად აღიარებს ტელეოპიური დახმარებით ვარჯიშს, რადგან ის აჩქარებს ძლიერ ქცევას [4].
გაძლიერებული სწავლება და სიმულაციური სწავლება რეალურზე - დომენის რანდომიზაციისა და ადაპტაციის გამოყენებით სიმულაციური გადაცემის პრაქტიკაში გაწვრთნილი პოლიტიკა; კვლავ გავრცელებულია ლოკომოციისა და მანიპულირებისთვის.
ხედვა-ენა-მოქმედების მოდელები - RT-2 სტილის პოლიტიკა კამერის კადრებს + ტექსტურ მიზნებს მოქმედებებთან აკავშირებს, რაც ვებ-ცოდნას ფიზიკურ გადაწყვეტილებებზე გავლენის მოხდენის საშუალებას აძლევს [1].

მარტივად რომ ვთქვათ: აჩვენე, მოახდინე მისი სიმულირება, ესაუბრე - შემდეგ გაიმეორე.

უსაფრთხოება და ნდობა: არამომხიბვლელი აუცილებელი ნივთები 🛟

ადამიანებთან ახლოს მომუშავე რობოტები მემკვიდრეობით იღებენ უსაფრთხოების მოლოდინებს, რომლებიც დღევანდელ აჟიოტაჟზე დიდი ხნით ადრე არსებობდა. ორი მნიშვნელოვანი ფაქტორი, რომელთა ცოდნაც ღირს:

ISO/TS 15066 - სახელმძღვანელო კოლაბორაციული აპლიკაციებისთვის, მათ შორის ურთიერთქმედების ტიპები (სიჩქარისა და განშორების მონიტორინგი, სიმძლავრისა და ძალის შეზღუდვა) და ადამიანისა და სხეულის კონტაქტის ლიმიტები [2].
NIST AI რისკების მართვის ჩარჩო - მმართველობის სახელმძღვანელო (GOVERN, MAP, MEASURE, MANAGE), რომლის გამოყენებაც შეგიძლიათ მონაცემებზე, მოდელის განახლებებსა და საველე ქცევებზე, როდესაც რობოტის გადაწყვეტილებები შესწავლილი მოდელებიდან მოდის [3].

სრული ვერსია: შესანიშნავი დემო ვერსიები მაგარია; დადასტურებული უსაფრთხოების შემთხვევები და მმართველობაც უფრო მაგარია.

შედარების ცხრილი: ვინ რას აშენებს, ვისთვის 🧾

(განზრახ არათანაბარი ინტერვალი. ცოტა ადამიანური, ცოტა არეული.)

ინსტრუმენტი / რობოტი	აუდიტორია	ფასი / წვდომა	რატომ მუშაობს პრაქტიკაში
Agility Digit	სასაწყობო ოპერაციები, 3PL; ტოტების/ყუთების გადაზიდვები	საწარმოს განლაგებები/პილოტები	სპეციალურად შექმნილი სამუშაო პროცესები პლუს ღრუბლოვანი ორკესტრირების ფენა სწრაფი WMS/MES ინტეგრაციისა და პილოტირების სწრაფი დროისთვის [5].
აპტრონიკი აპოლო	წარმოებისა და ლოჯისტიკის გუნდები	პილოტები დიდი ორიგინალი მწარმოებლებით	ადამიანისთვის უსაფრთხო დიზაინი, ცვლადი ელემენტების პრაქტიკულობა; პილოტები ხაზზე მიწოდებისა და შემოწმების ამოცანებს ასრულებენ [4].
ტესლა ოპტიმუსი	კვლევა და განვითარება ზოგადი დანიშნულების ამოცანებისთვის	კომერციულად ხელმისაწვდომი არ არის	განმეორებადი/სახიფათო დავალებების შესრულებისას (ადრეული ეტაპი, შინაგანი განვითარება) ფოკუსირება ბალანსზე, აღქმასა და მანიპულირებაზე.
BD ატლასი	მოწინავე კვლევა და განვითარება: მობილურობისა და მანიპულირების საზღვარი	არაკომერციული	ხელს უწყობს მთელი სხეულის კონტროლსა და სისწრაფეს; განსაზღვრავს დიზაინის/კონტროლის მეთოდებს, რომლებიც მოგვიანებით პროდუქტებში იგზავნება.

(დიახ, ფასები ბუნდოვანია. კეთილი იყოს თქვენი მობრძანება ადრეულ ბაზრებზე.)

რას უნდა მიაქციოთ ყურადღება ჰუმანოიდი რობოტის ხელოვნური ინტელექტის შეფასებისას 🧭

დღევანდელი დავალების შესრულება და გეგმა - შეუძლია თუ არა მას ამ კვარტალში თქვენი ორი საუკეთესო დავალების შესრულება და არა მხოლოდ მაგარი დემო დავალების შესრულება.
უსაფრთხოების შემთხვევა - დასვით კითხვა, თუ როგორ არის ISO-ს კოლაბორაციული კონცეფციები (სიჩქარე და განცალკევება, სიმძლავრე და ძალის ლიმიტები) თქვენს უჯრედში ასახული [2].
ინტეგრაციის ტვირთი - საუბრობს თუ არა ეს თქვენს WMS/MES-ზე და ვის ეკუთვნის უწყვეტი მუშაობის დრო და უჯრედების დიზაინი; მოძებნეთ კონკრეტული ორკესტრის ინსტრუმენტები და პარტნიორული ინტეგრაციები [5].
სწავლის ციკლი - როგორ ხდება ახალი უნარების დაუფლება, დადასტურება და თქვენს ფლოტში მათი დანერგვა.
მომსახურების მოდელი - საპილოტე პირობები, MTBF, სათადარიგო ნაწილები და დისტანციური დიაგნოსტიკა.
მონაცემთა მართვა - ვის ეკუთვნის ჩანაწერები, ვინ ამოწმებს უმაღლეს საქმეებს და როგორ გამოიყენება RMF-თან თავსებადი კონტროლი [3].

გავრცელებული მითები, თავაზიანად დაუმუშავებელი 🧵

„ჰუმანოიდები უბრალოდ რობოტების კოსფლეია“. ზოგჯერ ბორბლიანი რობოტი იმარჯვებს. მაგრამ როდესაც საქმე კიბეებს, კიბეებს ან ხელის ხელსაწყოებს ეხება, ადამიანის მსგავსი სხეულის გეგმა მახასიათებელია და არა ელეგანტურობას.
„ეს ყველაფერი ზედმიწევნითი ხელოვნური ინტელექტია, კონტროლის თეორიის გარეშე“. რეალური სისტემები აერთიანებს კლასიკურ კონტროლს, მდგომარეობის შეფასებას, ოპტიმიზაციას და შესწავლილ პოლიტიკას; ინტერფეისები მაგიაა [1].
„უსაფრთხოება დემონსტრაციის შემდეგ თავისით მოგვარდება“. პირიქით. უსაფრთხოების ღობეები, რომელთა გამოცდაც კი შეგიძლიათ ხალხის თანდასწრებით. სტანდარტებს გარკვეული მიზეზი აქვს [2].

საზღვრის მინი ტური 🚀

აპარატურაზე დამონტაჟებული VLA-ები - ჩნდება კომპაქტური, მოწყობილობაზე დამონტაჟებული ვარიანტები, რათა რობოტებმა შეძლონ ლოკალურად მუშაობა უფრო დაბალი შეყოვნებით, ხოლო უფრო მძიმე მოდელები საჭიროების შემთხვევაში ჰიბრიდულ/ღრუბლოვან რეჟიმში რჩებიან [1].
ინდუსტრიის პილოტები - ლაბორატორიების გარდა, ავტომწარმოებლები იკვლევენ, თუ სად ქმნიან ჰუმანოიდები პირველ რიგში ბერკეტებს (მასალების დამუშავება, შემოწმება) ტელეოპტიკური დახმარებით ტრენინგის გამოყენებით, რათა დააჩქარონ პირველივე დღიდან სარგებლიანობა [4].
განსახიერებული საორიენტაციო მაჩვენებლები - აკადემიურ წრეებსა და ინდუსტრიაში სტანდარტული დავალებების ნაკრები ხელს უწყობს პროგრესის თარგმნას გუნდებსა და პლატფორმებს შორის [1].

თუ ეს ფრთხილ ოპტიმიზმად ჟღერს - იგივე. პროგრესი არასტაბილურია. ეს ნორმალურია.

რატომ ჩნდება ფრაზა „ადამიანოიდი რობოტის ხელოვნური ინტელექტი“ გამუდმებით საგზაო რუკებში 🌍

ეს კონვერგენციის მოწესრიგებული ეტიკეტია: ზოგადი დანიშნულების რობოტები, ადამიანურ სივრცეებში, რომლებიც მუშაობენ მოდელებით, რომლებსაც შეუძლიათ მიიღონ ინსტრუქციები, როგორიცაა „დადეთ ლურჯი ურნა მესამე სადგურზე, შემდეგ მოიტანეთ ბრუნვის მომენტის გასაღები“ და უბრალოდ... გააკეთონ ეს. როდესაც ადამიანებზე მორგებულ აპარატურას VLA სტილის მსჯელობასთან და თანამშრომლობით უსაფრთხოების პრაქტიკასთან აერთიანებთ, პროდუქტის ზედაპირის ფართობი ფართოვდება [1][2][5].

დასკვნითი შენიშვნები - ან ქარიანი „ძალიან გრძელია, არ წამიკითხავს“ 😅

ჰუმანოიდი რობოტის ხელოვნური ინტელექტი = ადამიანის ფორმის მანქანები განსახიერებული ინტელექტით, რომლებსაც შეუძლიათ სხვადასხვა დავალების აღქმა, დაგეგმვა და შესრულება.
თანამედროვე ბიძგი მოდის VLA მოდელებიდან, როგორიცაა RT-2, რომლებიც რობოტებს ეხმარებიან ენიდან და სურათებიდან ფიზიკურ მოქმედებებზე განზოგადებაში [1].
სასარგებლო დანერგვები ჩნდება საწყობებსა და წარმოებაში, უსაფრთხოების ჩარჩოებითა და ინტეგრაციის ინსტრუმენტებით, რომლებიც წარმატებით ქმნიან ან არღვევენ მოთხოვნებს [2][4][5].

ეს იდეალური გამოსავალი არ არის. თუმცა, თუ პირველ დავალებას სწორად აირჩევთ, უჯრედს კარგად დააპროექტებთ და სწავლის ციკლს აქტიურად გააგრძელებთ, სარგებლიანობა იმაზე ადრე გამოჩნდება, ვიდრე წარმოგიდგენიათ.

ჰუმანოიდი რობოტის ხელოვნური ინტელექტი მაგია არ არის. ეს არის სანტექნიკა, დაგეგმვა და დახვეწა - პლუს რამდენიმე წამიანი სიხარული, როდესაც რობოტი ასრულებს დავალებას, რომელიც აშკარად არ შეუდგენიათ. და ზოგჯერ უხერხული შენახვა, რომელიც ყველას აიძულებს ამოისუნთქოს და შემდეგ ტაშს დაუკრას. ეს პროგრესია. 🤝🤖

ცნობები

Google DeepMind - RT-2 (VLA მოდელი): წაიკითხეთ მეტი
ISO - თანამშრომლობითი რობოტების უსაფრთხოება: წაიკითხეთ მეტი
NIST - ხელოვნური ინტელექტის რისკების მართვის ჩარჩო: წაიკითხეთ მეტი
როიტერი - Mercedes-Benz × Apptronik-ის პილოტები: წაიკითხეთ მეტი
Agility Robotics - ორკესტრირება და ინტეგრაცია: წაიკითხეთ მეტი

იპოვეთ უახლესი ხელოვნური ინტელექტი ოფიციალურ ხელოვნური ინტელექტის ასისტენტების მაღაზიაში

ჩვენს შესახებ

ბლოგზე დაბრუნება