ChatGPT u novoj ulozi: Veštačka inteligencija koja programira robote

OpenAI ChatGPT bi mogao dobiti novu primenu. Tehnološki gigant Microsoft sproveo je istraživanje kako bi proverio da li je alat veštačke inteligencije sposoban da obradi više od teksta i jednostavnih kodova. Istraživački tim u Microsoftu testirao je ChatGPT u interakciji sa robotima. Krajnji cilj je bio da se testira da li laici mogu da koriste AI bot kako bi dali uputstva robotima a da nemaju nikakvo prethodno znanje o robotskim sistemima ili programskim jezicima. Da li je ChatGPT bio na visini zadatka?

Vreme Čitanja: 4 min

chatgpt for robotics

Ilustracija: Milica Mijajlovic

Mnogi znaju za ChatGPT je kao alat veštačke inteligencije (AI) koji je sposoban da odgovara na pitanja, piše eseje i jednostavne kodove. Međutim, Microsoft je upravo dokazao da kapaciteti bota prevazilaze generisanje razumljivih tekstualnih odgovora na upite prirodnog jezika. Čuveni AI alat ne samo da može da učestvuje u interakcijama između ljudi i robota, već i da koristi podatke senzora za programiranje operacija robota. 

Nedavno je istraživački tim u Microsoftu sproveo studiju kako bi „video da li ChatGPT može da razmišlja dalje od teksta i razume fizički svet kako bi pomogao u zadacima iz oblasti robotike“. U ponedeljak, 20. februara 2023, tim je objavio naučni rad u kome se objašnjava skup principa koje jezički modeli mogu da prate kako bi obavili zadatke iz robotike. Na ovaj način, istraživači su dokazali da je ChatGPT zaista sposoban da daje robotima instrukcije, ali sa određenim ograničenjima. 

Zašto ne možemo da komuniciramo sa robotima? 

Zar ne bi bilo fantastično kada bismo mogli da komuniciramo sa robotima na ljudskom jeziku. Zamislite samo da svom kućnom robotu date uputstva da vam namesti krevet, usisa pod ili vam skuva kafu, a on  obavi sve istog trenutka. Iako ovo možda nije sasvim nemoguće, postoji značajna prepreka – ljudski jezik. 

Jezik je možda najintuitivniji način na koji se ljudi izražavaju. Međutim, to ne važi za robote. Oni nisu sposobni da razumeju i odgovore na ljudskom jeziku, barem ne još uvek. Dakle, da bismo komunicirali i kontrolisali ih, potreban nam je kôd. 

Upravo je ovo jaz koji je Mikrosoftov istraživački tim pokušao da premosti. Istraživači su ispitivali načine na koje je moguće koristiti ChatGPT, novi AI jezički model iz OpenAI-a, kako bi omogućili realnu interakciju između čoveka i robota. 

Ali zašto baš ChatGPT? 

Kao jezički model obučen da generiše tekst na osnovu interakcije sa ljudima, ChatGPT može da proizvede koherentne i gramatički ispravne odgovore na različite upite. Poznavajući njegov jezik i kapacitet kodiranja, istraživači su želeli da vide da li je u stanju da percipira fizički svet i tako pomogne sa zadacima u robotici. 

Primarni cilj je bio da se olakša interakcija između čoveka i robota, bez potrebe za učenjem programskog jezika. Naravno, ovo obično podrazumeva specifične izazove. Glavni izazov je bio podučavanje AI alata da reši probleme uzimajući u obzir zakone fizike i kontekst radnog okruženja. 

Rezultati su bili iznenađujući. Istraživački tim je otkrio da su kapaciteti ChatGPT-ja zapanjujući, jer može sam da se nosi sa mnogo stvari. Međutim, nedostaje mu nezavisnost jer su mu potrebni ljudska pomoć i nadzor. U naučnom radu, istraživački tim je detaljno opisao skup principa koji bi se mogli primeniti za vođenje jezičkih modela ka rešavanju zadataka. Ti principi obuhvataju API visokog nivoa (aplikacijski programski interfejs), specifične strukture za postavljanje dodatnih upita i povratne informacije od ljudi putem teksta. 

Kako ChatGPT može pomoći u prevazilaženju izazova robotike? 

Trenutno, interakcija sa robotima počinje sa inženjerom ili tehnički potkovanim korisnikom koji prevodi zahteve zadatka u kôd razumljiv robotu. Da bi održao interakciju ili ispravio ponašanje robota, inženjer treba da piše dodatne kodove i specifikacije. Ceo taj proces je spor jer korisnik mora da piše kod niskog nivoa, skup jer zahteva stručnjake za robotiku, i neefikasan jer zahteva više interakcija da bi se stvari obavile na adekvatan način.

chatgpt for robotics

Izvor: Microsoft

OpenAI ChatGPT otključava novi  model koji omogućava tehnički nepotkovanom korisniku da daje instrukcije, nudeći efikasne povratne informacije velikom jezičkom modelu (large language model – LLM). U isto vreme, on nadgleda performanse robota. Prateći skup principa, ChatGPT generiše kôd za scenarije koje roboti mogu da razumeju. Znanje o LLM-u se zatim primenjuje za kontrolu robota kada obavljaju gomilu različitih zadataka. 

Istraživački tim Microsofta pokazao je brojne primere da ChatGPT rešava zagonetke robotike, kao i sofisticirane radnje robota u domenu manipulacije, vazduha i navigacije.

ChatGPT u akciji  

Prilikom istraživanja, ChatGPT je dobio priliku da upravlja pravim dronom. AI alat se pokazao kao izuzetno  intuitivan interfejs zasnovan na jeziku između robota i korisnika. Kad god su uputstva bila nejasna ili dvosmislena, ChatGPT je tražio pojašnjenje. Krajnji rezultat bilo je pisanje kodnih struktura za dron, uključujući kretanje u cik-cak kako bi istražio šta je na policama.

Source: Microsoft 

Tim je takođe koristio ChatGPT da simulira industrijsku inspekciju pomoću Microsoft AirSim simulatora. Bot je precizno upravljao dronom razumevajući namere korisnika i geometrijske signale.  

Dodatni upiti za komplikovane zadatke 

Osim letenja dronom, ChatGPT je dobio priliku da upravlja rukom robota. Korišćenjem konverzacijskih povratnih informacija, istraživači su naučili bota da kombinuje prvobitno ponuđene API-je u složenije funkcije visokog nivoa koje je ChatGPT sam kodirao. Bio je u stanju da izvršava radnje kao što je slaganje blokova tako što je logički povezao stečene veštine. 

Pored toga, ChatGPT je dobio zadatak da napravi Microsoftov logo od drvenih kocki. Tom prilikom model je dao intrigantan primer povezivanja tekstualnog i fizičkog domena. Osim što je mogao da preuzme logo iz svoje interne baze znanja, takođe je bio u mogućnosti da „ilustruje” logo kao SVG kod.

Zatim je od ChatGPT-a zatraženo da kreira algoritam koji bi omogućio dronu da leti u prostoru i izbegne sudar sa različitim predmetima. Nakon što je obavešten da dron ima senzor udaljenosti ispred, bot je odmah kodirao većinu osnovnih elemenata algoritma. Ovaj zadatak je zahtevao dodatne upite od ljudi, ali je ChatGPT uspeo da stvori lokalizovana poboljšanja koda primenom povratnih informacija. 

Ulazak robota u stvarni svet 

Zbog ograničenja u interakciji, roboti su još uvek vezani za naučne laboratorije. Ovom studijom, Microsoftov istraživački tim je nastojao da koncept robotike približi široj publici. Tim je mišljenja da će manipulacija robotom zasnovana na jeziku biti od suštinskog značaja da se roboti izvedu iz laboratorije jednog dana. 

Međutim, treba napomenuti da rezultati ChatGPT-a ne bi trebalo da se primenjuje na robote bez prethodne analize. Tim poziva korisnike da iskoriste moć simulacije kako bi procenili algoritam pre nego što ih primene u stvarnom svetu. Naravno, ne može se dovoljno naglasiti koliko je preduzimanje mera predostrožnosti neophodno. 

Studija predstavlja samo deo potencijala koji otvara ukrštanje LLM-a koji rade u domenu robotike. Nadamo se da će biti još istraživanja i radova.  

Prijavi se na WebMind NJUZLETER, čeka te izbor konkretnih priča i uvida.

"Pokušao si. Propao. Nema veze. Pokušaj opet. Propadni bolje."

Prijavi se na novosti.