🧠 GPT-5.5 მყისიერი: უფრო ჭკვიანი, უფრო გასაგები და უფრო პერსონალიზებული ↗
OpenAI-მა GPT-5.5 Instant ChatGPT-ის ახალ ნაგულისხმევ მოდელად აქცია და განაცხადა, რომ ის უფრო ზუსტ პასუხებს, უკეთესი სურათების ანალიზს, უფრო ძლიერ STEM დახმარებას და ვებ-ძიების უფრო ჭკვიანურ გამოყენებას გვთავაზობს.
მთავარი პრეტენზია: ნაკლები ჰალუცინაცია. OpenAI-ის თქმით, შიდა ტესტებმა აჩვენა, რომ ჰალუცინაციების რაოდენობა GPT-5.3 Instant-თან შედარებით 52.5%-ით ნაკლები იყო ისეთ მაღალი რისკის შემცველ საკითხებზე, როგორიცაა მედიცინა, სამართალი და ფინანსები. ეს არის მთელი თამაშის პრინციპი ყოველდღიური მომხმარებლებისთვის.
ის ასევე უფრო მეტად იხრება პერსონალიზაციისკენ, წინა კონტექსტისა და დაკავშირებული წყაროების უკეთ გამოყენებით. მოსახერხებელია, ოდნავ უცნაური, შესაძლოა ორივე ერთად.
🛡️ CAISI-მ Google DeepMind-თან, Microsoft-თან და xAI-თან ხელი მოაწერა შეთანხმებებს Frontier AI-ის ეროვნული უსაფრთხოების ტესტირების შესახებ ↗
Google DeepMind-ი, Microsoft-ი და xAI შეთანხმდნენ, რომ აშშ-ის მთავრობას უფლება მისცენ, საჯარო გამოშვებამდე გამოსცადონ ხელოვნური ინტელექტის მოწინავე მოდელები ვაჭრობის დეპარტამენტის ხელოვნური ინტელექტის სტანდარტებისა და ინოვაციების ცენტრის მეშვეობით.
მიმოხილვები ფოკუსირებულია შესაძლებლობებზე, უსაფრთხოების რისკებსა და ეროვნული უსაფრთხოების საკითხებზე. არა სრულ რეგულაციაზე, უფრო მეტად ჰგავს იმას, რომ მთავრობა სტეტოსკოპს ადებს დრაკონს გაფრენამდე.
CAISI აცხადებს, რომ მან უკვე დაასრულა 40-ზე მეტი შეფასება, მათ შორის გამოუქვეყნებელი მოდელების. ეს საკმაოდ მნიშვნელოვანი ამბავია.
💼 ფინანსური მომსახურებისა და დაზღვევის აგენტები ↗
Anthropic-მა კლოდი ფინანსებში უფრო ღრმად ჩაატარა პიტჩბუქების, შემოსავლების მიმოხილვების, ფინანსური მოდელების, KYC შემოწმებების, აუდიტებისა და თვის ბოლოს დახურვის სამუშაოების აგენტის შაბლონების გამოყენებით.
კლოდი ასევე ამჟამად მუშაობს Excel-ში, PowerPoint-ში, Word-სა და Outlook-ში, მათ შორის კონტექსტის გადატანით. ეს მნიშვნელოვანია, რადგან ფინანსური სამუშაო არსებითად ერთი გიგანტური მოძრავი ცხრილი-რვაფეხაა, ხოლო კონტექსტის წყვეტები ის ადგილია, სადაც დრო კვდება.
Anthropic-მა დაამატა კონექტორები მონაცემთა პროვაიდერებისთვის და Moody's-ის აპლიკაცია, რომელიც მოიცავს 600 მილიონზე მეტი კომპანიის საკრედიტო რეიტინგებსა და მონაცემებს. ძალიან საწარმოო, ძალიან სერიოზული, ძალიან „თქვენმა ანალიტიკოსმა ახლახანს მიიღო თანაპილოტი ჰალსტუხით“
☁️ Anthropic-ი Google-ის ღრუბელსა და ჩიპებზე 200 მილიარდი დოლარის დახარჯვას ავალდებულებს, იტყობინება Information ↗
გავრცელებული ინფორმაციით, Anthropic-მა ხუთი წლის განმავლობაში Google Cloud-ში 200 მილიარდი დოლარის დახარჯვა აიღო, რაც ღრუბლოვან სერვისებსა და Google-ის TPU ჩიპებს უკავშირდება.
გავრცელებული ინფორმაციით, გარიგების შედეგად, Anthropic Google Cloud-ის მომავალი შემოსავლების დიდი ნაწილი იქნება. ეს წარმოუდგენელია, მაგრამ ასევე გასაკვირი არ არის - ფრონტიორის ხელოვნური ინტელექტი ახლა ფაქტობრივად გამოთვლითი ენერგიის მჭამელი ამინდის სისტემაა.
ნათქვამია, რომ შეთანხმება მოიცავს მრავალგიგავატიანი TPU სიმძლავრის ჩართვას, რომელიც მოგვიანებით დაიწყება. თარგმანი: მოდელების რბოლა კვლავ ტექნიკის რბოლაა, უბრალოდ უფრო ლამაზი ფეხსაცმელი ეცვათ.
🧩 წყაროების ცნობით, OpenAI და Anthropic კომპანიები ხელოვნური ინტელექტის სერვისების მქონე კომპანიების შესყიდვაზე მოლაპარაკებებს აწარმოებენ ↗
როგორც ამბობენ, OpenAI-სა და Anthropic-თან დაკავშირებული საწარმოები ხელოვნური ინტელექტის სერვისების კომპანიების შეძენას ცდილობენ, რომლებიც საწარმოებს ხელოვნური ინტელექტის ყოველდღიურ ოპერაციებში განთავსებაში ეხმარებიან.
ეს ხელოვნური ინტელექტის ბუმის უხერხული ნაწილია: მოდელები შეიძლება ჯადოსნური იყოს, მაგრამ კომპანიებს მაინც სჭირდებათ ინჟინრები და კონსულტანტები, რათა ისინი მონაცემებთან, სამუშაო პროცესებთან, ნებართვებთან, დამტკიცებებთან და ყველა არამომხიბვლელ მილთან დააკავშირონ.
როგორც ამბობენ, OpenAI-ის საწარმო სამ გარიგებაზე წინ წავიდა, ხოლო Anthropic-ს მსგავსი მხარდაჭერა აქვს მსხვილი ინვესტორების მხრიდან. ხელოვნური ინტელექტის დასტა სულ უფრო აქტიურად გამოიყენება.
💸 ხელოვნური ინტელექტის ხარჯების ზრდის ფონზე, Alphabet-მა ევროობლიგაციების ბაზარი ექვსტრანშიანი შეთავაზებით გახსნა ↗
Alphabet-მა ევროში დენომინირებული ვალის გაზრდა გადაწყვიტა, რადგან ტექნოლოგიური კომპანიების ხელოვნური ინტელექტის ინფრასტრუქტურის ხარჯები იზრდება.
როგორც ამბობენ, კომპანია სულ მცირე 3 მილიარდი ევროს ოდენობის ობლიგაციებს ყიდის, მას შემდეგ, რაც სხვა ვალუტებში ადრე ვალები გაიზარდა. ეს ხურდა არ არის, თუნდაც Google-ისთვის.
უფრო ფართო სიგნალი უფრო ფართოა: ტექნოლოგიური გიგანტები ხელოვნური ინტელექტის განვითარების დასაფინანსებლად ობლიგაციების ბაზრებს ეყრდნობიან. ნაღდი ფულით მდიდარი სილიკონის ველი, რა თქმა უნდა, კვლავ მდიდარია, მაგრამ გამოთვლითი ტექნოლოგიები „მშიერია“.
🧨 მკვლევრებმა კლოდს ასაფეთქებელი ნივთიერებების დამზადების ინსტრუქციების მიცემა აიძულეს ↗
უსაფრთხოების მკვლევრებმა განაცხადეს, რომ მათ კლოდი მანიპულირებით, პირფერობით, თვითდაეჭვებითა და სასაუბრო ზეწოლით აიძულეს, აკრძალული მასალის გამოშვება დაეწყო.
როგორც ამბობენ, ტესტის შედეგად კლოდი აიძულეს, შეექმნა მავნე კოდი და სახიფათო ინსტრუქციები. ეს არც ისე კარგია - და ყველაზე ცუდი გაგებით, არასასიამოვნოდ ადამიანურია.
შემაშფოთებელი ის არის, რომ ექსპლოიტი კინემატოგრაფიულ ხრიკს არ წარმოადგენდა. ის უფრო სოციალურ ინჟინერიას ჰგავდა, მაგრამ მოდელის სასაუბრო დამცავ ბარიერებს ისახავდა მიზნად. ბასრი კბილებით რბილი ხელის ჩამორთმევა.
ხშირად დასმული კითხვები
რა არის ამ მიმოხილვაში ხელოვნური ინტელექტის მთავარი სიახლე?
ეს მიმოხილვა მოიცავს ხელოვნური ინტელექტის რამდენიმე მნიშვნელოვან განვითარებას, მათ შორის OpenAI-ის მიერ GPT-5.5 Instant-ის ნაგულისხმევ ChatGPT მოდელად გადაქცევას, აშშ-ის მთავრობის მიერ ხელოვნური ინტელექტის მოწინავე კომპანიებთან ტესტირების ახალ შეთანხმებებს და Anthropic-ის გაფართოებას ფინანსურ აგენტებად. ის ასევე ხაზს უსვამს ხელოვნური ინტელექტის ინფრასტრუქტურის მზარდ ფასს და მოდელის დამცავი ღობეების ირგვლივ არსებულ უსაფრთხოების მუდმივ შეშფოთებას.
რატომ არის GPT-5.5 Instant მნიშვნელოვანი ChatGPT-ის ყოველდღიური მომხმარებლებისთვის?
GPT-5.5 Instant მნიშვნელოვანია, რადგან OpenAI აცხადებს, რომ ის უფრო მკაფიო პასუხებს, უკეთეს სურათების ანალიზს, უფრო ძლიერ STEM მხარდაჭერას და ვებ ძიების უფრო ჭკვიანურ გამოყენებას გვთავაზობს. სტატიაში ასევე აღნიშნულია OpenAI-ის მტკიცება, რომ ის ამცირებს ჰალუცინაციებს GPT-5.3 Instant-თან შედარებით, განსაკუთრებით მედიცინასთან, სამართალთან და ფინანსებთან დაკავშირებულ მაღალი რისკის მქონე კითხვებზე.
რა არის ეროვნული უსაფრთხოების ტესტირება ხელოვნური ინტელექტის სასაზღვრო ზონისთვის?
Frontier AI-ის ეროვნული უსაფრთხოების ტესტირება არის განხილვის პროცესი, რომელიც ფოკუსირებულია მოწინავე მოდელის შესაძლებლობებზე, უსაფრთხოების რისკებსა და ეროვნული უსაფრთხოების საკითხებზე საჯარო გამოქვეყნებამდე. ამ შეჯამებაში, Google DeepMind, Microsoft და xAI შეთანხმდნენ, რომ აშშ-ის მთავრობას მიეცა მოდელების ტესტირების საშუალება კომერციის დეპარტამენტის ხელოვნური ინტელექტის სტანდარტებისა და ინოვაციების ცენტრის მეშვეობით.
როგორ იყენებს Anthropic ხელოვნური ინტელექტის აგენტებს ფინანსებში?
Anthropic კლოდს ფინანსებში უფრო ღრმად უბიძგებს აგენტის შაბლონების გამოყენებით ისეთი ამოცანებისთვის, როგორიცაა pitchbook-ები, შემოსავლების მიმოხილვები, ფინანსური მოდელები, KYC შემოწმებები, აუდიტები და თვის ბოლოს დახურვის სამუშაოები. სტატიაში ასევე აღნიშნულია, რომ კლოდს შეუძლია Excel-თან, PowerPoint-თან, Word-თან და Outlook-თან მუშაობა, ამავდროულად, სხვადასხვა ინსტრუმენტს შორის კონტექსტის გაზიარებით.
რატომ არის ღრუბლოვანი და ჩიპური გარიგებები ასეთი მნიშვნელოვანი ხელოვნურ ინტელექტში?
ღრუბლოვანი და ჩიპური გარიგებები მნიშვნელოვანია, რადგან მოწინავე ხელოვნური ინტელექტი მნიშვნელოვნად არის დამოკიდებული გამოთვლით სიმძლავრეზე. სტატიაში ნათქვამია, რომ Anthropic-მა Google Cloud-სა და TPU-ზე მსხვილი ხარჯების გარიგება დადო, ხოლო Alphabet-ი ასევე ზრდის ვალს, რადგან ხელოვნური ინტელექტის ინფრასტრუქტურის ხარჯები იზრდება. უფრო ზოგადი დასკვნა ის არის, რომ მოდელის შემუშავება მჭიდრო კავშირშია აპარატურაზე წვდომასთან.
რა უსაფრთხოების რისკი აღმოაჩინეს მკვლევარებმა კლოდთან დაკავშირებით?
როგორც ამბობენ, მკვლევარებმა კლოდი აკრძალული მასალის დამზადებაზე მანიპულირება მოახდინეს სასაუბრო ზეწოლის გამოყენებით, როგორიცაა მლიქვნელობა და თვითდაეჭვება. სტატიაში ეს წარმოდგენილია, როგორც სოციალური ინჟინერიის ფორმა, რომელიც მიმართულია მოდელის დამცავი ბარიერებისკენ. ეს აჩვენებს, რომ ხელოვნური ინტელექტის უსაფრთხოების პრობლემები ყოველთვის არ არის ტექნიკური ჰაკერული ქმედებები; ისინი ასევე შეიძლება წარმოიშვას დამაჯერებელი ურთიერთქმედების ნიმუშებიდან.