서울대 연구진, AI 알고리즘 제안
서울대와 포스텍 공동연구팀이 개발한 TSMCTS 알고리즘을 사용해 로봇이 다양한 상황에서 정리정돈을 수행한 결과. 왼쪽이 정리 전, 오른쪽이 정리 후 모습이다.
서울대 제공 국내 연구팀이 테이블 위에 놓인 물체들을 카메라 한 대만으로 식별하고 효율적으로 정돈하는 인공지능(AI) 알고리즘을 개발했다.
로봇 스스로 '깔끔함'을 객관적으로 수치화하고 작업할 수 있어 청소 서비스나 제조산업 현장에 활용될 것으로 기대된다.
서울대는 오성회 전기정보공학부 교수팀이 포스텍 안혜민 교수팀과 함께 카메라 한 대만으로 물체를 식별하고 객관적인 점수에 기반해 로봇이 정리정돈하는 알고리즘 'TSMCTS'를 제안했다고 15일 밝혔다.
연구결과는 8월 11일(현지시간) 미국 전기전자학회(IEEE) 산하 로봇·자동화 학회(RAS)가 발간하는 국제학술지 'IEEE 로보틱스 앤 오토메이션 레터스(RA-L)'에 공개됐다.
AI 기반 정리정돈 기술이 아직 가정이나 사무실에서 쓰이지 못하는 이유로 정리정돈의 객관적 평가 기준 부재가 꼽힌다.
기존 연구가 공유하는 평가 기준이 없어 방법론 사이의 객관적 비교가 어려워지고 기술 발전 지체로 이어진 것이다.
이전 연구는 사전에 이미지로 제시된 배치 기준에 맞게 물건을 정돈하는 데 중점을 뒀다.
하지만 정리 서비스를 제공하는 로봇이 보편화되려면 공간과 상황에 따라 별도의 가이드라인 없이도 '알아서 깨끗하게' 치우는 능력이 필수적이다.
사람마다 물건 정리 방식과 정돈됐다고 판단하는 기준이 다르다.
연구팀은 AI에게 '깔끔하다'는 개념을 학습할 수 있다면 자율적인 정리정돈 기술 개발이 가능할 것이라는 아이디어를 발전시켰다.
연구팀은 AI 로봇이 이미지를 본 뒤 이미지 내의 깔끔한 정도를 점수화하는 '정리정돈 점수 판별기(Tidiness Discriminator)' 모델을 학습시켰다.
카페 테이블, 사무실 책상, 식탁, 욕실 등 4곳의 170종 물체를 활용한 22만4225장의 이미지로 학습한 로봇은 사전 이미지 없이도 책상 정돈 상태를 수치로 평가했다.
연구팀은 저장된 로봇 데이터만으로 학습하는 '오프라인 강화학습'과 가능한 수를 시뮬레이션해 가장 좋은 결과를 선택하는 탐색 기법인 '몬테카를로 트리 탐색(MCTS)'을 결합했다.
다양한 정리정돈 전략을 탐색하고 실행하는 MCTS 기반 계획기를 기반으로 로봇 스스로 효율적인 정리 계획을 세워 실행하는 TSMCTS 알고리즘을 완성했다.
왼쪽부터 오성회 서울대 전기정보공학부 교수, 안혜민 포스텍 전자전기공학과 교수, 기호건 서울대 전기정보공학부 연구원, 오우석 연구원, 강민재 연구원. 서울대 제공 연구팀은 시뮬레이션에서 TSMCTS 알고리즘이 탑재된 로봇을 구현해 정리정돈 실험을 진행한 결과 5개 환경, 총 750개 시나리오에서 평균 성공률 88.5%, 평균 '정리정돈 점수(Tidiness Score)' 0.901점을 달성했다.
정리정돈 점수는 0에서 1 사이로 1에 가까울수록 잘 정리된 상태다.
카페 테이블, 사무실 책상, 식탁, 욕실 등 실제 환경에서 진행한 로봇 실험에서는 총 20개 시나리오에서 평균 성공률 85%, 평균 정리정돈 점수 0.897점을 기록했다.
실험 참가자 17명에게 다양한 알고리즘 성능을 블라인드 테스트한 결과 TSMCTS가 사람과 가장 비슷한 정리정돈 능력을 보였다고 평가했다.
각 알고리즘으로 정돈한 결과는 사람들에게 보여준 후 참가자들이 만족할 때까지 직접 책상을 더 정돈하도록 했을 때 각 결과에서 물건을 얼마나 많이 옮겼는지 측정한 실험이다.
참여자들이 TSMCTS 알고리즘으로 정돈한 결과를 가장 적게 손봤다는 뜻이다.
이번 연구결과는 인간의 별도 지시 없이 로봇 스스로 정리정돈을 수행할 수 있어 가정용 청소 로봇이나 호텔 룸서비스 로봇 등에 적용될 가능성이 높다.
제조 산업 분야에서는 다양한 크기의 부품이나 제품을 깔끔하게 배열하는 키팅(kitting) 패킹 라인에 활용될 것으로 기대된다.
또 연구팀이 마련한 대규모 정리정돈 데이터셋은 연구 표준 벤치마크로 활용돼 후속 연구의 기반이 될 수 있다.
오 교수는 "로봇 스스로 정리정돈하는 AI 기술은 앞으로 서비스·가정용 로봇, 카페·레스토랑 자동화, 물류·생산 라인 등 다양한 분야에서 응용될 수 있을 것"이라며 "향후 대형 언어모델(LLM)과 결합해 물체의 기능·맥락까지 이해하는 정리정돈 기술로 발전시킬 계획"이라고 밝혔다.
<참고 자료> - doi.org/10.1109/LRA.2025.3597822
어지러운 테이블