[연구] 우홍욱 교수 연구실 (CSI연구실), EMNLP 2024 논문 게재 승인
- 소프트웨어융합대학
- 조회수451
- 2024-09-27
CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 EMNLP 2024 (The 2024 Conference on Empirical Methods in Natural Language Processing) 에 Findings 게재 승인(Accept) 되었습니다. 논문은 24년 11월 미국 플로리다에서 발표될 예정입니다.
논문 “LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensemble” 은 소프트웨어학과 신상우 (석사졸업), 이유정 (석사과정) 이 제1저자로 참여했으며, 아크릴 박외진 C박사가 공저자로 참여했습니다.
본 연구는 로봇 에이전트와 사용자간 명령형 대화에 기반하여 지시된 태스크 (Embodied Instruction-Following, EIF)를 수행할 때, 초거대언어모델 (LLM)을 활용하여 시공간적 일관성과 물리 환경에 기반한 보상(Reward)을 구성하는 CoREN(consistency-guided reward ensemble framework) 기법을 제안합니다. CoREN은 추가적인 환경 상호작용 없이 오프라인 데이터를 활용하여, LLM을 기반으로 문맥적, 구조적, 시간적 일관성을 갖춘 보상을 생성합니다. 이러한 보상들은 환경 기반 보상으로 조합되어 에이전트의 학습에 활용되며, 에이전트는 지정된 태스크에 맞는 스킬 실행 계획을 효과적으로 수립하고 수행합니다. CoREN은 홈 로봇 에이전트 테스트 환경인 VirtualHome 벤치마크의 실험을 통해, 다양한 EIF 시나리오와 동적 환경 변화에 대해 SOTA 대비 강건한 성능을 낼 수 있음을 보여주었습니다.
CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 EMNLP 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, BK21 FOUR 사업(BK21), 정보통신기획평가원, 삼성전자 지원으로 진행 중 입니다.
우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
- 다음글
- 다음글이 없습니다.