W tym, co wielu nazywa „Rokiem Ucieleśnionej Sztucznej Inteligencji”, Meta to zrobiła zrobił duży krok w rozwijaniu możliwości robotycznych dzięki zestawowi nowych technologii. Dział Fundamental AI Research (FAIR) firmy Meta wprowadził niedawno trzy artefakty badawcze — Meta Sparsh, Meta Digit 360 i Meta Digit Plexus — każdy z nich zapewnia postęp w percepcji dotyku, zręczności i współpracy człowiek-robot.
Czym jest ucieleśniona sztuczna inteligencja i dlaczego ma to znaczenie?
Ucieleśniona sztuczna inteligencja odnosi się do systemów sztucznej inteligencji zaprojektowanych tak, aby istniały i działały w świecie fizycznym, rozumiejąc otoczenie i wchodząc w interakcje z otoczeniem w sposób naśladujący ludzką percepcję i działanie. Tradycyjne systemy sztucznej inteligencji przodują w analizie danych, ale nie sprawdzają się w zastosowaniach do zadań fizycznych, które wymagają nie tylko wzroku, ale także informacji zwrotnej sensorycznej, takiej jak dotyk. Budując ucieleśnioną sztuczną inteligencję, badacze chcą stworzyć roboty, które będą w stanie wyczuwać, reagować, a nawet dostosowywać się do otoczenia, wypełniając lukę między inteligencją cyfrową a funkcjonalnością w świecie rzeczywistym.
Innowacje Meta w zakresie ucieleśnionej sztucznej inteligencji mają na celu osiągnięcie tego, co główny naukowiec zajmujący się sztuczną inteligencją, Yann LeCun, nazywa zaawansowaną inteligencją maszynową (AMI). Koncepcja ta przewiduje maszyny, które potrafią rozumować na podstawie przyczyny i skutku, planować działania i dostosowywać się do zmian w swoim otoczeniu, przechodząc w ten sposób od zwykłych narzędzi do współpracujących asystentów.
Przełomy Meta w zakresie ucieleśnionej sztucznej inteligencji: Sparsh, Digit 360 i Digit Splot
Ostatnie ogłoszenia Meta podkreślają jej zaangażowanie w przezwyciężanie ograniczeń obecnej technologii robotyki. Przyjrzyjmy się możliwościom każdego nowego narzędzia.
Meta Sparsh: Podstawa zmysłu dotyku
Meta Sparsh, co w sanskrycie oznacza „dotyk”, to pierwszy w swoim rodzaju oparty na wizji model wyczuwania dotykowego, który umożliwia robotom „wyczuwanie” powierzchni i obiektów. Sparsh to koder ogólnego przeznaczenia, który wykorzystuje bazę danych zawierającą ponad 460 000 obrazów dotykowych, aby nauczyć roboty rozpoznawać i interpretować dotyk. W przeciwieństwie do tradycyjnych modeli, które wymagają szkolenia dotyczącego konkretnego zadania, Sparsh wykorzystuje samonadzorowane uczenie się, co pozwala mu dostosować się do różnych zadań i czujników bez konieczności posiadania obszernych oznakowanych danych.
Ta zdolność do generalizowania jest kluczowa w przypadku robotów, które muszą wykonywać szeroki zakres zadań. Sparsh wykorzystuje różnorodne czujniki dotykowe, płynnie integrując się z różnymi konfiguracjami robotów. Umożliwiając robotom postrzeganie dotyku, Sparsh otwiera możliwości w obszarach, w których zręczna manipulacja i dotykowe informacje zwrotne mają kluczowe znaczenie, takich jak zastosowania medyczne, chirurgia robotyczna i produkcja precyzyjna.
Meta Digit 360: Wykrywanie dotykowe na poziomie człowieka w robotyce
Digit 360 to nowy dotykowy czujnik dotykowy firmy Meta, zaprojektowany tak, aby naśladować ludzki dotyk. Wyposażony w 18 różnych funkcji wykrywania, Digit 360 zapewnia bardzo szczegółowe dane dotykowe, które mogą uchwycić drobne zmiany w powierzchni, sile i teksturze obiektu. Zbudowany z ponad 8 milionów „takseli” (pikseli dotykowych), Digit 360 pozwala robotom wykrywać siły tak subtelne jak 1 miliniuton, zwiększając ich zdolność do wykonywania złożonych, zróżnicowanych zadań.
Ten przełom w wyczuwaniu dotyku ma praktyczne zastosowania w różnych dziedzinach. W opiece zdrowotnej Digit 360 można zastosować w protetyce, aby zapewnić pacjentom wzmocniony zmysł dotyku. W rzeczywistości wirtualnej mogłoby to zwiększyć wciągające doświadczenia, umożliwiając użytkownikom „dotykanie” obiektów w środowiskach cyfrowych. Meta współpracuje z GelSight Inc w celu komercjalizacji Digit 360, mając na celu udostępnienie go szerszej społeczności badawczej do przyszłego roku.
Meta Digit Plexus: platforma dla rąk robota obsługującego dotyk
Trzecia główna wersja Meta, Digit Plexus, to ujednolicona platforma sprzętowo-programowa zaprojektowana w celu integracji różnych czujników dotykowych w jednej robotycznej dłoni. Digit Plexus łączy czujniki na opuszkach palców i dłoni, zapewniając robotom bardziej skoordynowany, przypominający ludzki system reakcji na dotyk. Integracja ta pozwala robotom przetwarzać informacje zwrotne sensoryczne i wprowadzać korekty w czasie rzeczywistym podczas wykonywania zadań, podobnie jak działają ludzkie ręce.
Standaryzując sprzężenie zwrotne w całej dłoni robota, Digit Plexus zwiększa kontrolę i precyzję. Meta przewiduje zastosowania tej platformy w takich dziedzinach, jak produkcja i zdalna konserwacja, gdzie istotne jest delikatne obchodzenie się z materiałami. Aby pomóc w budowaniu społeczności robotyki open source, Meta udostępnia bezpłatnie projekty oprogramowania i sprzętu dla Digit Plexus.
Współpraca Meta z GelSight Inc i Wonik Robotics
Oprócz tych postępów technologicznych Meta nawiązała współpracę w celu przyspieszenia przyjęcia wykrywania dotyku w robotyce. Współpracując z GelSight Inc i Wonik Robotics, Meta ma na celu udostępnianie swoich innowacji badaczom i programistom na całym świecie. Dystrybucją Digit 360 zajmie się GelSight Inc, natomiast Wonik Robotics wyprodukuje Allegro Hand – rękę robota zintegrowaną z Digit Plexus – której premiera przewidywana jest na przyszły rok.
Partnerstwa te są znaczące, ponieważ stanowią zwrot w kierunku demokratyzacji technologii robotycznej. Udostępniając powszechnie te zaawansowane systemy dotykowe, Meta wspiera ekosystem współpracy, który może zaowocować nowymi zastosowaniami i poprawić wydajność robotów w różnych branżach.
PARTNR: Nowy punkt odniesienia we współpracy człowieka z robotem
Meta wprowadza także PARTNR (Planning And Reasoning Tasks in human-Robot Collaboration), punkt odniesienia zaprojektowany do oceny modeli sztucznej inteligencji dotyczących interakcji człowiek-robot w warunkach domowych. Zbudowany na symulatorze Habitat 3.0, PARTNR zapewnia realistyczne środowisko, w którym roboty mogą wchodzić w interakcję z ludźmi podczas wykonywania złożonych zadań, od prac domowych po nawigację w świecie fizycznym.
Dzięki ponad 100 000 zadań językowych PARTNR oferuje ustandaryzowany sposób testowania efektywności systemów AI w scenariuszach współpracy. Celem tego benchmarku jest pobudzenie badań nad robotami, które pełnią rolę „partnerów”, a nie zwykłych narzędzi, wyposażając je w zdolność podejmowania decyzji, przewidywania ludzkich potrzeb i zapewniania pomocy w codziennych sytuacjach.
Kredyty obrazkowe: Meta