[우홍욱 교수] CSI 연구실, NeurIPS 2024 논문 게재 승인 (3편)
2024-10-07
[우홍욱 교수] CSI 연구실, NeurIPS 2024 논문 게재 승인 (3편) CSI연구실 (지도교수: 우홍욱)의 3편의 논문이 인공지능 분야 우수학회인 NeurIPS 2024 (Thirty-Eighth Annual Conference on Neural Information Processing Systems) 에 게재 승인(Accept) 되었습니다. 논문은 24년12월 캐나다 벤쿠버에서 발표될 예정입니다. 1. 논문 “LLM-based Skill Diffusion for Zero-shot Policy Adaptation” 은 소프트웨어학과 김우경 (박사과정), 이영석 (박사과정), 김주영 (학사과정) 연구원이 저자로 참여했습니다. 최근 계층적 스킬 기반 정책 학습 방법이 순차적 의사 결정 문제에 대응하는 데 인기를 얻은 반면, 해당 접근 방법은 다양한 자연어로 명시된 사용자의 요구사항에 제로샷(Zero-shot)으로 적응하는 데에는 한계가 있었습니다. 본 연구에서는 LLM의 코드 생성 능력과 손실함수로 제어 가능한 확산 모델(Diffusion Model)을 활용하여, 자연어로 명시된 컨텍스트에 제로샷 적응이 가능한 LDuS (LLM-based Skill Diffusion) 프레임워크를 제안합니다. LDuS는 도메인 변화가 심한 다중 모달리티 로봇 동작 환경에서, 기존의 모방 학습보다 우수한 적응성을 지닙니다. 2. 논문 “Exploratory Retrieval-Augmented Planning For Continual Embodied Instruction Following” 은 소프트웨어학과 유민종 (석박통합과정), 장진우 (석박통합과정) 연구원이 저자로 참여했습니다. 본 연구는 Non-stationary 물리 환경에서 하나가 아닌 여러 개의 지속적인 사용자 지시(Multiple Continuous Instruction Following)를 수행하는 임베디드 에이전트를 위한 탐색 기반 검색 증강 계획 (Exploratory Retrieval-Augmented Planning, ExRAP) 프레임워크를 제안합니다. 이 프레임워크는 최신 LLM의 추론 능력을 활용하여 에이전트가 동적이고 변화하는 환경에서 실시간으로 지시를 수행할 수 있도록 합니다. 이 과정에서 ExRAP은 환경 정보 메모리를 활용하여, 에이전트가 다중 지시의 조건을 이해하고, 이러한 조건에 맞추어 작업을 자원 효율적으로 계획하고, 물리 환경 특성에 맞추어 실행할 수 있습니다. 또한, 물리 환경과의 상호작용을 최소화하는 태스크 수행을 위하여, 정보 기반 환경 탐색을 통합적으로 수행합니다. 이를 통해, 환경 정보의 유효성을 보장하고 전체적인 에이전트의 작업 성능을 향상시킵니다. 3. 논문 “Incremental Learning of Retrievable Skills For Efficient Continual Task Adaptation” 은 소프트웨어학과 이대희 (석박통합과정), 유민종 (석박통합과정), 김우경 (박사과정), 최원제 (박사과정)연구원이 저자로 참여했습니다. 본 논문은 로봇 어플리케이션의 평생 모방학습 (Continual Imitation Learning, CiL)에서 발생하는 세 가지 주요 문제를 다룹니다: 1) long-horizon 환경에서의 전문가 데모 수집의 높은 비용과 비효율성, 2) 비정형적인 동적 환경에서의 적응력, 3) 개인정보 보호를 위한 Unlearning. 해당 연구는 프로토타입 기반 스킬 증분 학습을 통해 저수준 스킬을 이산적인 프로토타입으로 표현하고, 이를 통해 에피소드 재생 없이 행동 지식의 순방향 및 역방향 전이를 향상시키며, 비정형적인 CiL 환경에서 효율적인 작업 적응과 작업에 대한 즉각적인Unlearning을 가능하게 하는 IsCiL (Incremental skills for continual imitation learning) 프레임워크를 제안합니다. Franka-Kitchen과 Meta-World 실험을 통해 IsCiL프레임워크는 새로운 작업에 대한 적응력과 unlearning 시나리오에서의 기능적 특성을 입증하며, 기존 방법들보다 우수한 성능을 보였습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습, LLM 활용을 통해, (1) 체화형 에이전트 (Embodied Agent) (2) 평생학습 성장향 에이전트 (Lifelong Learning Agent) (3) 드론, 클라우드, 자율주행 시스템 최적화 연구를 수행하고 있습니다. 이번 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, BK21 FOUR 사업(BK21), 삼성전자 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group