Pies-robot sam nauczył się chodzić. Ile trwała nauka?

Robot samodzielnie nauczył się chodzić. Nauka trwała stosunkowo krótko, a jej efekty są zdumiewające.

news
Adam Adamczyk19 lipca 2022
16

źródło: YouTube | Danijar Hafner

Sztuczna inteligencja towarzyszy nam niemal każdego dnia – na przykład, kiedy toczymy wirtualne pojedynki z botami w grach komputerowych. Modele uczenia maszynowego są coraz bardziej zaawansowane, a to oznacza, że programy opierające się na AI są w stanie uzyskiwać odpowiedzi szybciej i z większą precyzją. Sztuczna inteligencja może uczyć się samodzielnie, czego dowiódł pewien pies robot, który sam nauczył się chodzić.

Pierwsze kroki robota

Danijar Hafner i jego współpracownicy z Uniwersytetu Kalifornijskiego w Berkeley wykorzystali technikę uczenia maszynowego, zwaną uczeniem wzmacniającym (reinforcement learning), która polega na trenowaniu algorytmów poprzez nagradzanie ich za pożądane działania. Dzięki temu algorytmowi udało się sprawić, by pies-robot samodzielnie nauczył się chodzić. Przez pierwsze pół godziny stawiał on kroki bardzo nieporadnie, jednak jego ruchy z czasem zaczęły stawać się bardziej stabilne. Samodzielna nauka chodzenia zajęła robotowi godzinę, a po tym czasie był w stanie przemieszczać się na tyle pewnie, by od razu stawać na nogi po przewróceniu.

Czym jest uczenie wzmacniające?

Reinforced Learning to metoda uczenia maszynowego oparta na nagradzaniu pożądanych zachowań i/lub karaniu tych niechcianych. Ogólnie rzecz biorąc, obiekt poddawany tego typu nauce jest w stanie postrzegać i interpretować swoje środowisko, podejmować działania i uczyć się metodą prób i błędów. Uczenie wzmacniające jest oparte na konkretnym algorytmie stworzonym przez programistów, a ten użyty do nauki pierwszych kroków opisanego robota nosi nazwę Dreamer.

Wyszkoliliśmy czworonożnego robota, aby nauczył się chodzić bezpośrednio w świecie fizycznym bez wsparcia symulatorów. Nauka od zera w ciągu zaledwie godziny była możliwa dzięki zastosowaniu algorytmu Dreamer do ciągłego uczenia się modelu świata i planowania wewnątrz niego.

Więcej artykułów związanych ze sztuczną inteligencją przeczytacie tutaj:

  1. 865 dni. Tyle znam się ze sztuczną inteligencją
  2. AI znalazła sposób, żeby zapewnić człowiekowi szczęście

Adam Adamczyk

Adam Adamczyk

Pisaniem zajmuje się zawodowo od 2013 roku. W 2021 roku dołączył do GRYOnline.pl, gdzie poza tematyką gamingową zajmuje się informacjami stricte technologicznymi. Współpracował z największymi sklepami muzycznymi w Polsce, tworząc artykuły związane z instrumentami i ogólnie pojętym udźwiękowieniem. Grami komputerowymi interesuje się od dziecka. Poza tym jego zainteresowania obejmują grę na gitarze, komponowanie muzyki oraz sporty siłowe.

Discord został pozwany. Powodem nieskuteczna weryfikacja wieku nieletnich

Discord został pozwany. Powodem nieskuteczna weryfikacja wieku nieletnich

Nowe sterowniki Nvidii 576.02 dla wielu są strzałem w dziesiątkę - ale nie wszystkim wychodzi to na dobre

Nowe sterowniki Nvidii 576.02 dla wielu są strzałem w dziesiątkę - ale nie wszystkim wychodzi to na dobre

Android 16 Beta 4 - co nowego? Sprawdzamy nowości wprowadzone przez Google

Android 16 Beta 4 - co nowego? Sprawdzamy nowości wprowadzone przez Google

Apple aż trzy razy zmieniało swoją koncepcję na procesory. 20 lat temu doprowadziło to firmę na skraj upadku

Apple aż trzy razy zmieniało swoją koncepcję na procesory. 20 lat temu doprowadziło to firmę na skraj upadku

Nazwa PSX do dzisiaj jest błędnie kojarzona przez graczy. To miało być centrum domowej rozrywki od Sony

Nazwa PSX do dzisiaj jest błędnie kojarzona przez graczy. To miało być centrum domowej rozrywki od Sony