-
- [연구] [이호준교수연구실] ACM CCS 2024 학술대회 논문 게재 승인 소식
- 시스템보안 연구실 (지도교수 이호준, https://sslab.skku.edu)의 임하정(박사과정), 김재윤(석박통합과정) 학생 참여 논문 "uMMU: Securing Data Confidentiality with Unobservable Memory Subsystem"이 논문이 보안분야 4대 학회 중 하나인 ACM CCS 2024에 게재 승인되어 10월에 발표될 예정입니다. 다음은 논문의 개요입니다: 현대 컴퓨팅 시스템의 메모리 계층 구조는 여러 종류의 보안 위협에 노출되어 있어 데이터 기밀성 보장이 계속해서 어려움을 겪고 있습니다. 공격자들은 다양한 강력한 공격 기법을 통해 중요 데이터를 직간접적으로 유출해왔으며, 새로운 공격들이 지속적으로 발견되고 있습니다. 안전하지 않은 언어로 작성된 프로그램에서의 메모리 안전 (Memory Safety)는 달성하기가 매우 어려워 공격으로 인한 비정상적인 메모리 접근이 직접적인 공격 경로로 사용되고 있습니다. HeartBleed와 같은 보안 사고가 이러한 공격의 대표적인 예시입니다. 최근에는 마이크로아키텍처 부채널 공격이 일반 프로그램뿐만 아니라 TEE(Trusted Execution Environment) 같은 기술로 보호된 프로그램의 데이터조차 유출 가능함을 증명하고 있습니다. 이 논문에서는 uMMU라는 새로운 프로세스 내 데이터 보호를 위한 메모리 서브시스템을 제시합니다. uMMU는 프로세서 레지스터를 관측할 수 없는 저장소로 사용하는 기법을 메모리 암호화 및 Oblivious RAM과 같은 데이터 기밀 보호 기술과 유기적으로 통합합니다. uMMU는 프로세서 아키텍처의 확장 레지스터(예: Intel x86의 AVX512)를 관측할 수 없고 주소 지정 가능한 물리 메모리로 추상화합니다. 가상 메모리 원칙을 완성하는 것은 암호화 또는 ORAM과 같은 메모리 기밀성 정책이 적용된 안전한 스왑 공간을 유지하는 메모리 관리입니다. uMMU는 민감한 데이터에 대한 데이터 기밀성 정책을 호스팅할 수 있는 범용적이고 강력한 데이터 보안 프레임워크입니다. 실험 결과에 따르면, uMMU는 민감한 데이터 보호를 위한 암호화 및 ORAM 스킴을 사용한 프로그램의 성능을 크게 향상시킵니다. MbedTLS의 민감 데이터 암호화 기반 보호에서 평균 69.93%의 성능 향상, 그리고 Memcached의 해시 테이블에서의 액세스 패턴을 숨기는 ORAM 기반 보호에서 497.84%의 성능 향상을 보였습니다. 영문 Abstract: Ensuring data confidentiality in a computing system's memory hierarchy proved to be a formidable challenge with the large attack surface. Diverse and powerful attacks threaten data confidentiality. Memory safety is notoriously hard to achieve with unsafe languages, thereby empowering adversaries with unauthorized memory accesses, as represented by the HeartBleed incident. More recently, microarchitectural side channel attacks reign as a prevalent threat against data confidentiality that affects program execution including the safeguarded ones inside TEEs. In this paper, we introduce an in-process memory subsystem called uMMU. uMMU coherently consolidates the notion of employing processor registers as unobservable storage with data confidentiality protection techniques such as memory encryption and Oblivious RAM. uMMU creates a new address space called uVirtual address space that is unobservable to adversaries. Under the abstraction created by uMMU, the processor's spacious extended registers, such as Intel x86's AVX512, are transformed into unobservable and addressable physical memory backing. Completing the principles of virtual memory abstraction is the memory management that maintains a secure swap space applied with memory confidentiality policies such as encryption or ORAM. uMMU is a versatile and powerful framework that can host data confidentiality policies on sensitive data. Our real-world evaluation indicates that uMMU significantly improves the performance of programs with encryption and ORAM schemes for sensitive data protection: an average of 69.93% improvement in encryption-based protection of sensitive data in MbedTLS, and 497.84% for ORAM-based elimination of access patterns on Memcached's hashtable.
-
- 작성일 2024-07-08
- 조회수 9496
-
- [연구] 김유성 교수 연구실 임정기 석사과정 ECCV 2024 논문 게재 승인
- CSI 연구실의 (지도교수: 김유성) 논문이 컴퓨터 비전 및 인공지능 분야의 Top-tier 학술대회인 European Conference on Computer Vision (ECCV) 2024에 게재 승인되었습니다. 논문 "Cross-Domain Semantic Segmentation on Inconsistent Taxonomy using Vision Language Models" 은 석사과정 임정기군이 저자로 참여했습니다. 비지도 도메인 적응은 (Unsupervised Domain Adaptation, UDA) 정답 레이블과 함께 주어진 소스 도메인 (예: 가상 주행 데이터) 에서 학습 후 레이블이 없는 타겟 도메인으로 (예: 실제 주행 데이터) 적응할 수 있습니다. 특히 픽셀 단위 (예: semantic segmentation) 라벨링을 수작업으로 하는데는 비용이 큰 만큼 UDA 는 매우 중요합니다. 기존의 UDA 연구는 일관된 클래스 체계를 전제로 하였으나, 실제 상황에서는 소스와 타겟 도메인 간에 클래스 차이가 존재할 수 있습니다. 이 논문에서는 비전 언어 모델 (VLMs)을 활용하여 클래스 체계가 불일치하는 상황에서도 효과적으로 도메인 적응을 수행하는 방법을 소개합니다. 제안된 방법은 기존 UDA 방법의 세그먼트 추론과 VLMs의 풍부한 의미적 지식을 결합하여 타겟 도메인의 클래스에 맞게 재라벨링합니다. 이로 인해 소스 도메인에서 존재하지 않는 클래스를 포함한 타겟 도메인으로 비지도 적응이 가능해졌으며, 다양한 벤치마크에서 일관된 성능 향상을 보여줍니다.
-
- 작성일 2024-07-04
- 조회수 9083
-
- [연구] 이진규 교수 연구실(실시간 컴퓨팅 연구실, RTCL@SKKU) ACM/IEEE DAC 2024, IEEE RTAS 2024 논문 발표
- 실시간 컴퓨팅 연구실(지도교수: 이진규)에서 작성한 논문이 ACM/IEEE DAC 2024 (the 61th Design Automation Conference)와 IEEE RTAS 2024 (30th IEEE Real-Time and Embedded Technology and Applications Symposium)에 발표되었습니다. ACM/DAC은 Design Automation 분야의 Top1 국제 학술대회(정보과학회 최우수 등급, BK21+ IF3)이고 올해는 미국 샌프란시스코에서 2024년 6월 23일~27일 개최되었며, IEEE RTAS는 실시간 시스템 분야의 Top2 국제 학술대회(정보과학회 최우수 등급, BK21+ IF2)이며 올해는 홍콩에서 2024년 5월 13일~16일 총 29편의 논문이 발표되었습니다. ACM/IEEE DAC 2024 논문은 MCU등 소형 IoT 기기에서 인공지능 응용 작업 실행에 대한 실시간성 보장을 다루고 있으며, 실시간 컴퓨팅 연구실 석사과정 강석민 학생(제1저자), 박사과정 이성태 학생(공동제1저자), 학부과정 구현우 학생이 이진규 교수의 지도하에 참여하였고, DGIST 좌훈승 교수와의 공동연구로 진행되었습니다. IEEE RTAS 2024 논문은 메모리 부족 환경에서의 인공지능 응용 작업의 실행에 대한 실시간성 보장을 다루고 있으며, DGIST 좌훈승 교수 연구팀 주도하에 이진규 교수가 참여하였습니다. ACM/IEEE DAC 2024 홈페이지 https://www.dac.com/ IEEE RTAS 2024 홈페이지 https://2024.rtas.org/ 실시간 컴퓨팅 연구실 홈페이지 https://rtclskku.github.io/website/ - 논문제목: RT-MDM: Real-Time Scheduling Framework for Multi-DNN on MCU Using External Memory - Abstract: As the application scope of DNNs executed on microcontroller units (MCUs) extends to time-critical systems, it becomes important to ensure timing guarantees for increasing demand of DNN inferences. To this end, this paper proposes RT-MDM, the first Real-Time scheduling framework for Multiple DNN tasks executed on an MCU using external memory. Identifying execution-order dependencies among segmented DNN models and memory requirements for parallel execution subject to the dependencies, we propose (i) a segment-group-based memory management policy that achieves isolated memory usage within a segment group and sharded memory usage across different segment groups, and (ii) an intra-task scheduler specialized for the proposed policy. Implementing RT-MDM on an actual system and optimizing its parameters for DNN segmentation and segment-group mapping, we demonstrate the effectiveness of RT-MDM in accommodating more DNN tasks while providing their timing guarantees. - 논문제목: RT-Swap: Addressing GPU Memory Bottlenecks for Real-Time Multi-DNN Inference - Abstract: The increasing complexity and memory demands of Deep Neural Networks (DNNs) for real-time systems pose new significant challenges, one of which is the GPU memory capacity bottleneck, where the limited physical memory inside GPUs impedes the deployment of sophisticated DNN models. This paper presents, to the best of our knowledge, the first study of addressing the GPU memory bottleneck issues, while simultaneously ensuring the timely inference of multiple DNN tasks. We propose RT-Swap, a real-time memory management framework, that enables transparent and efficient swap scheduling of memory objects, employing the relatively larger CPU memory to extend the available GPU memory capacity, without compromising timing guarantees. We have implemented RT-Swap on top of representative machine-learning frameworks, demonstrating its effectiveness in making significantly more DNN task sets schedulable at least 72% over existing approaches even when the task sets demand up to 96.2% more memory than the GPU’s physical capacity. 이진규 | jinkyu.lee@skku.edu | 실시간컴퓨팅 Lab. | https://rtclskku.github.io/website/ Title: Papers from Prof. Jinkyu Lee’s Lab. (RTCL@SKKU) published in ACM/IEEE DAC 2024 and IEEE RTAS 2024 A paper from RTCL@SKKU (Advisor: Jinkyu Lee) has been published in ACM/IEEE DAC 2024 and IEEE RTAS 2024. ACM/IEEE DAC 2024 Website https://www.dac.com/ IEEE RTAS 2024 Website https://2024.rtas.org/ Real-Time Computing Lab. Website https://rtclskku.github.io/website/ - Paper Title: RT-MDM: Real-Time Scheduling Framework for Multi-DNN on MCU Using External Memory - Abstract: As the application scope of DNNs executed on microcontroller units (MCUs) extends to time-critical systems, it becomes important to ensure timing guarantees for increasing demand of DNN inferences. To this end, this paper proposes RT-MDM, the first Real-Time scheduling framework for Multiple DNN tasks executed on an MCU using external memory. Identifying execution-order dependencies among segmented DNN models and memory requirements for parallel execution subject to the dependencies, we propose (i) a segment-group-based memory management policy that achieves isolated memory usage within a segment group and sharded memory usage across different segment groups, and (ii) an intra-task scheduler specialized for the proposed policy. Implementing RT-MDM on an actual system and optimizing its parameters for DNN segmentation and segment-group mapping, we demonstrate the effectiveness of RT-MDM in accommodating more DNN tasks while providing their timing guarantees. - Paper Title: RT-Swap: Addressing GPU Memory Bottlenecks for Real-Time Multi-DNN Inference - Abstract: The increasing complexity and memory demands of Deep Neural Networks (DNNs) for real-time systems pose new significant challenges, one of which is the GPU memory capacity bottleneck, where the limited physical memory inside GPUs impedes the deployment of sophisticated DNN models. This paper presents, to the best of our knowledge, the first study of addressing the GPU memory bottleneck issues, while simultaneously ensuring the timely inference of multiple DNN tasks. We propose RT-Swap, a real-time memory management framework, that enables transparent and efficient swap scheduling of memory objects, employing the relatively larger CPU memory to extend the available GPU memory capacity, without compromising timing guarantees. We have implemented RT-Swap on top of representative machine-learning frameworks, demonstrating its effectiveness in making significantly more DNN task sets schedulable at least 72% over existing approaches even when the task sets demand up to 96.2% more memory than the GPU’s physical capacity. Jinkyu Lee | jinkyu.lee@skku.edu | RTCL@SKKU | https://rtclskku.github.io/website/
-
- 작성일 2024-07-01
- 조회수 8818
-
- [연구] 박호건 교수 연구실 (LearnData연구실), ICLR 2024/ACL 2024 논문 게재 승인 (박사과정: 강현주, 김정훈)
- LearnData연구실 (지도교수: 박호건)의 논문이 인공지능 분야 우수학회인 International Conference on Learning Representations 2024, ACL 2024 (The 62nd Annual Meeting of the Association for Computational Linguistics) 에 Findings 게재 승인(Accept) 되었습니다. 1. 논문 “Improving Multi-hop Logical Reasoning in Knowledge Graphs with Context-Aware Query Representation Learning” 은 인공지능학과 김정훈 (박사과정)이 제1저자로 참여했으며, 소프트웨어학과 정희수 (박사과정), 미국 인디애나 대학교 장혜주 교수가 공저자로 참여했습니다. 본 논문은 GPT-4와 같은 최신 LLM도 잘 풀지 못하는 논리적 추론을 수행할 때 질의 그래프의 구조적 맥락과 관계 유도 맥락을 활용하여 성능을 향상시키는 방법인 CaQR을 제안합니다. 논리적 추론이란 복잡한 질문을 First-Order Logic(FOL) 형태의 쿼리로 표현하고 정답을 찾는 과정을 말합니다. 예를 들어 "1980년 올림픽에서 시행된 단체 종목을 하는 팀들의 이름은?"이라는 질문이 있다면, 이를 FOL 쿼리로 나타내고 답을 찾을 수 있습니다. 기존의 방법들은 쿼리의 논리적 구조나 관계 정보를 잘 활용하지 못해 정확도가 떨어지는 한계가 있었지만 CaQR은 쿼리 그래프의 구조적 맥락과 관계적 맥락을 모두 고려해 노드의 표현을 정교화함으로써 추론 성능을 높일 수 있었습니다. 여기서 구조적 맥락이란 쿼리 내 노드의 위치나 역할 같은 것을 의미하고, 관계적 맥락은 지식 그래프 내에서 노드 간의 관계를 통해 얻을 수 있는 정보를 뜻합니다. CaQR의 장점은 다양한 질의 임베딩 모델에 적용 가능하다는 점과, 실험을 통해 여러 데이터셋과 모델에서 성능 향상을 입증했다는 점입니다. 특히 어려운 유형의 쿼리에서도 향상 효과가 컸습니다.. 앞으로 CaQR과 같은 연구를 통해 논리적 추론 기술이 더욱 발전하고, 자연어로 된 복잡한 질문에도 정확한 답을 제공할 수 있게 되길 기대해 봅니다. 논문 링크: http://arxiv.org/abs/2406.07034 2. 논문 “UNR-Explainer: Counterfactual Explanations for Unsupervised Node Representation Learning Models” 은 인공지능학과 강현주 (박사과정)이 제1저자로 참여했으며, 같은 학과 한건희 (석사과정)이 공저자로 참여하였습니다. 본 논문은 그래프 신경망을 이용한 비지도 노드 표현 학습 모델을 설명하기 위한 반사실적(Counterfactual) 설명 기법인 UNR-Explainer를 제안합니다. 노드 표현 학습은 그래프의 노드를 저차원 벡터로 표현하는 방법으로, 다양한 하위 작업(링크 예측, 클러스터링, 이상 탐지 등)에 활용됩니다. 특히 k-최근접 이웃 노드가 이런 작업들의 성능에 큰 영향을 미치는데, 기존 연구들은 이를 설명하는 데 한계가 있었습니다. UNR-Explainer는 노드의 k-최근접 이웃을 크게 변화시키는 중요한 부분 그래프를 식별함으로써 모델을 설명합니다. 이는 반사실적 질문인 "만약 이 엣지들이 없었다면 노드의 k-최근접 이웃이 달라졌을까?"에 답하는 것과 같습니다. Monte Carlo Tree Search를 활용해 설명 그래프를 탐색하며, 탐색 편향을 완화하기 위해 새로운 전략을 도입했습니다. 실험 결과, 다양한 데이터셋과 모델(GraphSAGE, DGI)에서 매우 우수한 성능을 보였습니다. 향후에도 본 연구는 그래프 신경망 기반 비지도 학습의 설명 가능성을 높이고, 관련 하위 작업들을 이해하는 데 크게 기여할 것으로 기대됩니다. 논문 링크: https://openreview.net/pdf?id=0j9ZDzMPqr LearnData 연구실은 그래프, 자연어, 센서, 이미지 등 다양한 모달리티를 활용한 기계학습 및 데이터마이닝 기술 개발, 설명 가능 AI 기술 연구 등을 수행하고 있습니다. 이번 ICLR 2024, ACL 2024 논문의 연구는 인공지능대학원, 정보통신기획평가원, 한국콘텐츠진흥원 등의 지원으로 진행되었습니다. 박호건 | hogunpark@skku.edu | LearnData Lab | https://learndatalab.github.io/
-
- 작성일 2024-06-17
- 조회수 9527
-
- [연구] [박진영 교수] HLI연구실, ICML 2024 Spotlight 논문 게재 승인
- HLI연구실 (지도교수: 박진영)의 박상준 학부연구생의 논문이 인공지능 학회 ICML 2024(The Forty-first International Conference on Machine Learning) 에 Spotlight(Acceptance rate 3.5%)로 게재 승인(Accept) 되었습니다. 해당 논문은 24년 7월 오스트리아 비엔나에서 발표될 예정입니다. 본 연구 "Memoria: Resolving Fateful Forgetting Problem through Human-Inspired Memory Architecture"는 인공지능 모델을 위한 기억 시스템을 제안합니다. 인공신경망이 장기기억을 갖도록 만드는 것은 오랜 문제이며 외부 기억을 활용하는 다양한 기법이 등장했지만, 대부분 최근 정보를 단기적으로 보존하는 것에 초점을 맞추었습니다. Memoria는 인간의 뛰어난 기억 시스템에서 영감을 받아 다양한 심리학과 신경과학적 이론을 바탕으로 설계되었습니다. 실험결과는 Memoria가 정렬, 언어 모델링 및 분류와 같은 다양한 작업에서 뛰어난 성능을 보임을 입증합니다. 또한 Memoria의 기억을 분석하여 Memoria에서 인간 기억의 특성인 초두효과(primacy effect), 최신효과(recency effect) 및 시간 연속성 효과(temporal contiguity effect)가 나타남을 보였습니다. 논문: https://arxiv.org/abs/2310.03052
-
- 작성일 2024-06-17
- 조회수 9739
-
- [연구] 우사이먼성일 교수(DASH 연구실), Won PAKDD 2024 Best Paper Running-Up Award (2nd Place)
- 우사이먼성일 교수(DASH 연구실), Won PAKDD 2024 Best Paper Running-Up Award (2nd Place) 대만 타이페이에서 5월 7일부터 10일까지 열린 PAKDD 2024 (BK CS IF=1)에서 DASH 연구실(지도교수: 우사이먼성일)의 Bin M. Le 박사과정학생과 우사이먼성일교수의 "SEE: Spherical Embedding Expansion for Improving Deep Metric Learning" 논문이 Best Paper Running-Up Award (2nd Place) 수상하였습니다. 이번 PAKDD 2024는 전 세계에서 submit된 720편의 우수한 논문들 중에서 엄격한 심사 과정을 거쳐, 최종적으로 단 4편의 논문이 Best Paper로 선정되었습니다. 논문링크: https://link.springer.com/chapter/10.1007/978-981-97-2253-2_11 https://pakdd2024.org/award24awardpakdd24/ DASH Lab won the Best Paper Running-Up Award (2nd Best Paper) at PAKDD 2024 in Taiwan Binh M. Le and Simon S. Woo’s paper, “SEE: Spherical Embedding Expansion for Improving Deep Metric Learning,” received the the Best Paper Running-Up Award (2nd best paper) in PAKDD 2024 (BK CS IF=1), held in Taipei in May 2024. Here is the background information about the award: “This year, PAKDD received 720 excellent submissions, and the selection process was competitive, rigorous, and thorough with over 500 PC and 100 SPC members. An award committee was formed by a chair and four committee members from different countries. There are only one Best Paper Award, two Best Paper Running-Up Awards, and one Best Student Paper Award.” Paper Link: https://link.springer.com/chapter/10.1007/978-981-97-2253-2_11
-
- 작성일 2024-06-07
- 조회수 9536
-
- [연구] SecAI 연구실(구형준 교수), IEEE Symposium on Security and Privacy 2024 (S&P '24), Distinguished Paper Award 수상
- SecAI 연구실 (지도교수 구형준, https://sslab.skku.edu)와 고려대학교 해킹대응기술 연구실 (지도교수 김휘강, https://ocslab.hksecurity.net/)이 공동연구한 "BENZENE: A Practical Root Cause Analysis System with an Under-Constrained State Mutation" 논문이 보안 분야 최고 컨퍼런스 중 하나인 IEEE Symposium on Security and Privacy 2024 (S&P '24) 학회에서 Distinguished Paper Award (학술 대회에서 발표된 논문 중 특히 뛰어난 성과를 인정받은 논문에게 수여되는 상)를 수상하였다. Distinguished Paper Award는 S&P '24에서 발표된 261편의 논문 중 9편 (~3%)에 수여되었다. 논문 요약: 퍼징은 랜덤으로 입력값을 생성해 소프트웨어가 의도하지 않은 행위를 하는지 확인해서 버그를 찾는 기술이다. 특히 보안 취약점을 찾는데 자주 활용되고 있는데, 마이크로소프트와 구글같은 회사에서도 퍼징을 활용해 자사의 제품을 테스트한다. 종종 보안 취약점을 통해 프로그램의 비정상적인 동작을 유발하는 입력값을 크래시(crash)라고 한다. 본 논문은 크래시가 주어졌을 경우 근본 원인을 분석 (root cause analysis)하기 위해 크래시 기반의 통계적 디버깅을 이용해 효율적으로 자동화하는 방식을 소개한다. 특히 이 논문에서는 완화된 조건 하에 상태변이 (under-constrained state mutation)라는 새로운 기법을 소개하고, 기존 접근방식에 비해 평균 30배 이상 더 적은 메모리로 평균 4배 이상 더 높은 성능을 낼 수 있는 Benzene이라는 시스템을 설계했다.
-
- 작성일 2024-05-29
- 조회수 9548
-
- [연구] 우홍욱 교수 연구실 (CSI연구실), ACL 2024 논문 게재 승인
- CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 ACL 2024 (The 62nd Annual Meeting of the Association for Computational Linguistics) 에 Findings 게재 승인(Accept) 되었습니다. 논문은 24년 8월 태국 방콕에서 발표될 예정입니다. 논문 “Semantic Skill Grounding for Embodied Instruction-Following in Cross-Domain Environments” 은 소프트웨어학과 신상우 (석사과정), 김승현 (석사과정) 이 제1저자로 참여했으며, LG AI연구원 이문태 랩장, 장영수 연구원이 공저자로 참여했습니다. 본 연구는 로봇 에이전트와 사용자간 명령형 대화에 기반하여 지시된 태스크 (Embodied Instruction-Following, EIF)를 수행할 때, 초거대언어모델 (LLM)을 활용하여, 지시된 태스크 수행에 필요한 스킬의 실행 방법을 타켓 환경에 맞추어 최적 변환하는 SemGro (Semantic Skill Grounding) 기법을 제안합니다. SemGro는 특정 물리적 환경 특성에 최적화된 (Long-horizon rich-semantic) 스킬부터 환경에 관계 없이 실행할 수 있는 일반화된 (Short-horizon low-semantic) 스킬을 계층적으로 관리하는 스킬 데이터베이스를 사전에 구성하고, 이를 태스크 수행시 실시간 참조하여, 지시된 태스크에 필요하면서 타켓 환경에 맞추어 실행가능한 스킬 실행 계획을 찾아내고 최적화합니다. SemGro는 홈 로봇 에이전트 테스트 환경인 VirtualHome 벤치마크의 실험을 통해, 다양한 EIF 시나리오와 동적 환경 변화에 대해 SOTA 대비 강건한 성능을 낼 수 있음을 보여주었습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 ACL 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-05-28
- 조회수 9605
-
- [연구] 우홍욱 교수 연구실 (CSI연구실), ICML 2024 논문 게재 승인
- 우홍욱 교수 연구실 (CSI연구실), ICML 2024 논문 게재 승인 CSI연구실 (지도교수: 우홍욱)의 논문이 인공지능 분야 우수학회인 ICML 2024 (The Forty-first International Conference on Machine Learning) 에 게재 승인(Accept) 되었습니다. 논문은 24년 7월 오스트리아 비엔나에서 발표될 예정입니다. 논문 “Embodied CoT Distillation From LLM To Off-the-shelf Agents” 은 소프트웨어학과 최원제 (박사과정), 김우경 (박사과정), 유민종 (석박사통합과정) 연구원이 저자로 참여했습니다. 본 연구는 로봇이나 자율주행 차량과 같은 임바디드 (Embodied) 인공지능 에이전트를 위한 초거대언어모델 (LLM) 기반 정책 학습 (Policy Learning) 프레임워크 DEDER 를 제시합니다. DEDER를 통해 LLM의 임바디드 추론 능력을 CoT (Chain of Thoughts) 단계별로 분해하고 (Decomposition), 추출하여 (Distillation), 제한된 리소스를 갖는 off-the-shelf 디바이스와 소형 언어모델 (sLM)만을 사용하는 효율적인 에이전트 정책으로 재구성합니다. 본 연구에서는 DEDER를 통해 개발한 에이전트 정책이 임바디드 에이전트 시뮬레이션 환경인 ALFRED에서 다양한 제한된 리소스 조건과 태스크 시나리오에 대해 높은 성능을 내는 것을 확인했습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 ICML 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, 삼성전자의 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-05-16
- 조회수 10270
-
- [연구] 우홍욱 교수 연구실 (CSI연구실), IJCAI 2024 논문 게재 승인
- 우홍욱 교수 연구실 (CSI연구실), IJCAI 2024 논문 게재 승인 CSI연구실 (지도교수: 우홍욱)의 논문 2편이 인공지능 분야 우수학회인 IJCAI 2024 (the 33rd International Joint Conference on Artificial Intelligence) 에 게재 승인(Accept) 되었습니다. 논문은 24년 8월 제주에서 발표될 예정입니다. 1.논문 “Offline Policy Learning Via Skill-step Abstraction For Long-Horizon Goal-Conditioned Tasks” 은 김동훈 (인공지능학과 석사졸업), 유민종 (소프트웨어학과 석박사통합과정) 연구원이 저자로 참여했습니다. 2.논문 “Pareto Inverse Reinforcement Learning for Diverse Expert Policy Generation” 은 김우경 (소프트웨어학과 박사과정), 유민종 (소프트웨어학과 석박사통합과정) 연구원이 저자로 참여했습니다. 1.Offline Policy Learning Via Skill-step Abstraction For Long-Horizon Goal-Conditioned Tasks 본 연구는 로봇이나 자율주행과 같은 자동화/지능형 에이전트 개발에 활용되는 목적 조건 강화학습 정책 학습 (Goal-Conditioned Policy Learning) 기법의 기존 제한점인 Long-horizon 태스크 (장기 목적 구조에 따라 보상 시그널이 적어서 학습이 어려운 경우)를 해결하는 효율적인 스킬 기반 정책 학습 (Skill-based Goal-Conditioned Policy Learning) 프레임워크를 제안합니다. 로봇 스킬은 오프라인 데이터셋에서부터 학습되며, 이러한 오프라인 학습 과정에서 스킬 수준의 추상화된 환경 모델 (Skill-step Abstract)과 목적 조건 정책을 동시에 반복 학습하여 정책의 성능을 높입니다. 또한, 프레임워크는 정책 네트워크 구조를 모듈화하여, 오프라인에서 학습된 환경 모델과의 차이가 발생하는 실제 타켓 환경에 빠른 적응이 가능한 파라미터 효율적인 학습 구조를 지원합니다. 2.Pareto Inverse Reinforcement Learning for Diverse Expert Policy Generation 최근 데이터 기반의 오프라인 강화학습과 모방학습이 순차적 의사 결정 문제에 대응하는 데 인기를 얻은 반면, 이러한 접근 기술은 제한된 전문가 데이터셋이 주어질 때, 파레토 최적 정책 (Pareto-optimal Policy set : 다중 목적 함수에 대한 최적 정책들)을 학습하는 것을 고려하지는 않았습니다. 본 연구에서는 역강화학습 (IRL, Inverse Reinforcement Learning)을 적용하여 각 전문가가 다른 최적화 선호도를 가지는 다중 목적에 대한 정책 집합을 점진적으로 생성하는 ParIRL 프레임워크를 제안합니다. ParIRL은 CARLA 자율주행과 같은 다양한 다중 목적 제어 작업에서 SOTA IRL 알고리즘 보다 높은 성능을 내는 것을 실험을 통해 입증하였습니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 연구 등을 수행하고 있습니다. 이번 IJCAI 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원, ICT명품인재양성사업, 삼성전자 삼성리서치의 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2024-05-02
- 조회수 9974







