기자명 백진호 기자
  • 입력 2023.03.29 09:40
'드림워크'의 개요도. (사진제공=한국과학기술원)
'드림워크'의 개요도. (사진제공=한국과학기술원)

[뉴스웍스=백진호 기자] 명현 한국과학기술원(KAIST) 전기및전자공학부 교수 연구팀이 비정형 환경에도 강한 '블라인드 보행'을 지원하는 보행로봇 제어 기술을 개발했다고 29일 발표했다.

KAIST 연구팀은 사람이 수면 중 깨 깜깜한 상태에서 화장실을 갈 때 시각적인 도움 없이 보행이 가능한 것처럼 블라인드 보행이 가능해 붙은  '드림워크'기술을 개발했고, 이 기술을 적용한 로봇을 '드림워커'라고 명명했다. 해당 기술을 탑재하면 여러 형태의 사족보행로봇 드림워커를 만들 수 있다.

KAIST에 따르면 연기로 앞이 안 보이는 재난 상황에서 별도의 시각이나 촉각 센서의 도움 없이도 계단을 오르내리고, 나무뿌리 같은 울퉁불퉁한 환경에서도 넘어지지 않고 움직일 수 있다.

기존 보행로봇 제어기는 기구학이나 동역학 모델에 기초한다. 이를 모델기반제어방식이라고 하는데, 야지와 같은 비정형 환경에서 안정적인 보행을 하려면 모델의 특징 정보를 더 빠르게 얻어야 한다. 그러나 이는 주변 환경의 인지 능력에 많이 의존한다.

명현 교수 연구팀의 인공지능(AI) 학습 방법 중 하나인 심층 강화학습 기반의 제어기는 시뮬레이터로부터 얻은 환경 데이터를 통해 보행로봇의 각 모터에 적절한 제어 명령을 빠르게 계산할 수 있다. 시뮬레이션에서 학습을 거친 제어기가 실제 로봇에서 작동하는 데 별도의 튜닝 과정이 필요했다면, 연구팀의 제어기는 별도의 튜닝을 요구하지 않는다. 이에 다양한 보행로봇에 쉽게 적용될 수 있을 것으로 기대된다.

연구팀의 제어기인 드림워크는 지면과 로봇의 정보를 추정하는 상황 추정 네트워크, 제어 명령을 산출하는 정책 네트워크로 이뤄진다. 상황 추정 네트워크는 관성 정보와 관절 정보를 통해 암시적으로 지면의 정보를, 명시적으로 로봇의 상태를 추정한다. 이 정보는 정책 네트워크에 입력돼 최적의 제어 명령을 산출한다. 두 네트워크는 시뮬레이션에서 함께 학습된다.

상황 추정 네트워크는 지도학습을 통해 학습을 거친다. 정책 네트워크는 심층 강화학습방법론인 행동자-비평자 방식을 통해 학습된다. 행동자 네트워크는 주변 지형 정보를 암시적으로 추정할 수 있다. 시뮬레이션에서는 주변 지형 정보를 알 수 있는데, 지형 정보를 알고 있는 비평자 네트워크가 행동자 네트워크의 정책을 평가한다.

이 모든 학습 과정은 1시간 소요되며, 실제 로봇에는 학습된 행동자 네트워크만 탑재된다. 주변 지형을 보지 않고도, 로봇 내부의 관성 센서와 관절 각도의 측정치를 활용해 시뮬레이션에서 학습한 환경 중 어느 환경과 유사한지 상상하는 과정을 거친다. 갑자기 계단과 같은 단차를 맞이할 때 발이 단차에 닿기 전까지는 알 수 없지만, 발이 닿는 순간 빠르게 지형 정보를 예상한다. 추측한 지형 정보에 알맞은 제어 명령을 각 모터에 전달해 빠르게 적응 보행을 수행한다.

드림워커 로봇은 실험실 환경을 넘어 연석과 과속방지턱이 많은 대학 캠퍼스 환경, 나무뿌리와 자갈이 많은 야지 환경에서도 보행을 하며 지면으로부터 몸체까지 높이의 3분의 2에 해당하는 계단을 극복했다. 환경과 무관하게 초속 0.3m의 느린 속도부터 1.0m의 다소 빠른 속도까지 안정적으로 보행하는 모습을 보여줬다.

연구 결과에서는 이 마데 아스완 나렌드라 박사과정이 제1 저자로, 유병호 박사과정이 공동 저자로 참여했다. 오는 5월 말 영국 런던에서 개최되는 로보틱스 분야의 학회인 'ICRA'에 채택되며 발표 예정이다.

저작권자 © 뉴스웍스 무단전재 및 재배포 금지