Ceea ce face ca acest robot cu patru picioare să fie special este faptul că a învățat să se rostogolească și să meargă de unul singur, fără să i se arate ce trebuie să facă într-o simulare pe calculator. 

Danijar Hafner și colegii săi de la Universitatea din California, Berkeley, au folosit o tehnică de inteligență artificială numită „învățare prin consolidare”, care antrenează algoritmii prin recompensarea lor pentru acțiunile dorite, pentru a stimula robotul să meargă de la zero în lumea reală. Echipa a folosit același algoritm pentru a antrena cu succes alți trei roboți, cum ar fi unul care a fost capabil să ridice mingi și să le mute de pe o tavă pe alta.

În mod tradițional, roboții sunt antrenați într-un simulator pe calculator înainte de a încerca să facă ceva în lumea reală. „Problema este că simulatorul nu va fi niciodată la fel de precis ca în lumea reală. Întotdeauna vor exista aspecte ale lumii pe care le vei omite", spune Hafner, care a lucrat la acest proiect împreună cu colegii săi Alejandro Escontrela și Philipp Wu și care acum este stagiar la DeepMind. Adaptarea lecțiilor din simulator la lumea reală necesită, de asemenea, un plus de inginerie, spune el.

Algoritmul echipei, numit Dreamer, folosește experiențele anterioare pentru a construi un model al lumii înconjurătoare. Dreamer permite, de asemenea, robotului să efectueze calcule de tip trial-and-error într-un program de calculator, spre deosebire de lumea reală, prin prezicerea potențialelor rezultate viitoare ale acțiunilor sale posibile. Acest lucru îi permite să învețe mai repede decât ar putea învăța prin simpla practică. Odată ce robotul a învățat să meargă, a continuat să învețe să se adapteze la situații neașteptate, cum ar fi să reziste la a fi răsturnat.

„Învățarea roboților prin modelul trial and error este o problemă dificilă, îngreunată și mai mult de timpii lungi de instruire pe care îi necesită", spune Lerrel Pinto, profesor asistent de informatică la Universitatea din New York, specializat în robotică și învățare automată. Dreamer arată că învățarea prin consolidare profundă este capabilă să îi învețe pe roboți noi abilități într-un timp foarte scurt, spune el.

Jonathan Hurst, profesor de robotică la Oregon State University, spune că rezultatele, arată clar că „învățarea prin consolidare va fi un instrument de bază în viitorul controlului roboților".

Abordarea ar putea avea, de asemenea, un potențial uriaș pentru lucruri mai complicate, cum ar fi conducerea autonomă, care necesită simulatoare complexe și costisitoare. O nouă generație de algoritmi de învățare prin consolidare ar putea să înțeleagă foarte rapid în lumea reală cum funcționează mediul înconjurător, mai arată specialiștii.

Există, însă, și unele pericole în acest sistem. În cazul învățării prin consolidare, oamenii de știință trebuie să specifice în codul lor ce comportamente sunt bune și sunt astfel recompensate și ce comportamente sunt dezirabile. În acest caz, întoarcerea și mersul pe jos sunt acțiuni pozitive, în timp ce a nu merge este un comportament negativ.

În viitor, spun specialiștii, ar fi frumos ca robotul să înțeleagă comenzile vocale. Hafner spune că echipa dorește, de asemenea, să conecteze camere la câinele robot pentru a-i oferi simțul văzului. Acest lucru i-ar permite să navigheze în situații complexe de interior și l-ar ajuta în găsirea obiectelor, de exemplu. 

___________________________________________________________________________________________________

Urmăriți emisiunile preferate pe protvplus.ro:

Share articol: