-
- [연구] 우홍욱 교수 연구실(CSI연구실), AAAI 2024 논문 게재 승인 (3편)
- CSI연구실 (지도교수: 우홍욱)의 논문 3편이 인공지능 분야 우수학회인 AAAI 2024 (The 38th Annual AAAI Conference on Artificial Intelligence) 에 게재 승인(Accept) 되었습니다. 이번 논문은 24년 2월 캐나다 밴쿠버에서 발표될 예정입니다. 1. 논문 “SemTra: A Semantic Skill Translator for Cross-domain Zero-shot Policy Adaptation” 은 소프트웨어학과 신상우 (석사과정), 유민종 (박사과정), 이정우 (학부과정) 연구원이 저자로 참여했습니다. 본 연구는 로봇과 같은 체화형 에이전트 (Embodied Agent)가 주위 환경 변화에 추가 학습 없이 빠르게 대응할 수 있는 Zero-Shot 적응 기술에 관한 것으로, 비전, 센서, 사용자 명령어 등 멀티모달 데이터를 의미론적으로 해석 가능한 스킬 (Sematic Skill)로 변환하고, 이러한 스킬을 환경에 최적화하여 연속된 액션으로 실행하는 SemTra (Semantic Skill Translator) 프레임워크를 제시합니다. SemTra는 암묵적 행동 패턴을 사전 훈련된 언어모델을 통해 실행가능한 스킬(Skill, 연속된 행동 패턴)로 변환하는 연구 결과로, Meta-World, Franka Kitchen, RLBench, CARLA와 같은 로봇과 자율주행 환경에서 테스트되어 높은 성능을 보였습니다. 2. 논문 “Risk-Conditioned Reinforcement Learning: A Generalized Approach for Adapting to Varying Risk Measures” 은 소프트웨어학과 유광표 (박사과정)와 인공지능학과 박진우 (석사과정) 연구원이 저자로 참여했습니다. 본 연구는 금융, 로봇, 자율주행 등 위험이 내포된 중요한 의사결정이 요구되는 응용 분야에서 사용될 수 있는 위험 조건형 강화학습 모델 (Risk Conditioned Reinforcement Learning)을 제안합니다. 특히, 하나의 학습된 강화학습 모델을 통해 동적으로 변경되는 다양한 선호 리스크 수준에 대응할 수 있도록, 최초로 이종 리스크 측정 지표에 대한 단일한 표현이 가능한 Weighted Value-at-Risk (WV@R) 기반의 강화학습 모델 구조를 구현하며, 이를 통해 리스크 관리에 중점을 두는 여러 응용 분야에서 강화학습 기반의 의사 결정을 유연하게 처리합니다. 3. 논문 “Robust Policy Learning via Offline Skill Diffusion” 은 소프트웨어학과 김우경 (박사과정), 유민종 (박사과정) 연구원이 저자로 참여했습니다. 본 연구에서는 Diffusion 모델을 사용하여 데이터셋의 한정된 스킬에서 확장된 다양한 체화형 에이전트 스킬 (Embodied Agent Skill)을 생성하는 새로운 오프라인 학습 프레임워크인 DuSkill (Offline Skill Diffusion Model)을 제시합니다. DuSkill 프레임워크는 오프라인에서 학습된 스킬의 다양성을 증진시켜, 다중 태스크와 이종 환경 도메인에 대한 정책 학습 (RL Policy Learning) 절차를 가속화하고, 학습된 정책의 강건성을 향상합니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 등 Embodied Agent 분야 연구를 수행하고 있습니다. 이번 AAAI 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원의 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2023-12-12
- 조회수 1153
-
- [연구] 이진규 교수 연구실(실시간 컴퓨팅 연구실, RTCL@SKKU) IEEE RTSS 2023 논문 발표
- 실시간 컴퓨팅 연구실(지도교수: 이진규)에서 작성한 논문이 IEEE RTSS 2023 (the 44th IEEE Real-Time Systems Symposium)에 발표되었습니다. IEEE RTSS는 매년 30편 내외의 논문만이 발표되는 실시간 시스템 분야의 Top1 국제 학술대회(BK21+ IF4)이며, 올해는 대만 타이페이에서 2023년 12월 5일~8일 총 32편의 논문이 발표되었습니다. 해당 논문은 실시간 시스템 분야에서의 최초의 Blockchain 논문이며, 실시간 컴퓨팅 연구실의 박사과정 이승훈 학생(제1저자), 석사과정 강석민, 조승연 학생, 학부과정 구현우 학생이 이진규 교수의 지도하에 참여하였고, 소프트웨어학과 황성재 교수님과의 공동연구로 진행되었습니다. 이로써 이진규 교수는 2012년부터 2023년까지 12년 연속 IEEE RTSS에 논문을 게재하는 업적을 이루었습니다(12년간 주저자 14편, 공저자 5편) IEEE RTSS 2023 홈페이지 http://2023.rtss.org/ 실시간 컴퓨팅 연구실 홈페이지 https://rtclskku.github.io/website/ - 논문제목: RT-Blockchain: Achieving Time-Predictable Transactions - 연구주제: Blockchain transaction들의 타이밍 보장을 위한 scheduling framework 개발 - Abstract: Although blockchain technology is being increasingly utilized across various fields, the challenge of providing timing guarantees for transactions remains unmet, which is an obstacle in implementing blockchain solutions for time-sensitive applications such as high-frequency trading and real-time payments. In this paper, we propose the first solution to achieve a timing guarantee on blockchain. To this end, we raise and address two issues for timely transactions on a blockchain: (a) architectural support, and (b) real-time scheduling principles spe- cialized for blockchain. For (a), we modify an existing blockchain network, offering an interface to preferentially select the transactions with the earliest deadlines. We then extend the blockchain network to provide the flexibility of the number of generated blocks at a single block time. Under such architectural supports, we achieve (b) with three steps. First, to resolve a discrepancy between a periodic request of a transaction-generating node and the corresponding arrival on a block-generating node, we translate the former into the latter, which eases the modeling of the transaction load imposed on the blockchain network. Second, we derive a schedulability condition of the modeled transaction load, which guarantees no missed deadline for all transactions under a work-conserving deadline-based scheduling policy. Last, we develop a lazy scheduling policy and its condition, which reduces the number of generated blocks without compromising the degree of timing guarantees for the work-conserving policy. By implementing RT-blockchain on top of an existing open- source blockchain project, we demonstrate the effectiveness of the proposed scheduling principles with architectural supports in not only ensuring timely transactions but also reducing the number of generating blocks. 이진규 | jinkyu.lee@skku.edu | 실시간컴퓨팅 Lab. | https://rtclskku.github.io/website/
-
- 작성일 2023-12-11
- 조회수 1184
-
- [연구] 이호준교수 연구실, 학술대회 (USENIX SEC) 게재승인 소식
- 시스템보안 연구실 (지도교수 이호준, https://sslab.skku.edu)의 조규원(박사과정), 김종윤(박사과정), Dinh Duy Kha(박사과정), 임하정(박사과정) 의 "RustSan: Retrofitting AddressSanitizer for Efficient Sanitization of Rust" 논문이 보안분야 4대 학회 중 하나인 USENIX Security Symposium 2024에 게재 승인되어 2024년 8월에 발표될 예정입니다. 오늘날 Rust는 C/C++과 비슷한 성능을 가지면서도 안전한 시스템 프로그래밍 언어로 주목받고 있습니다. 그러나 unsafe Rust라는 기능의 존재와 이를 활용하는 많은 프로그램들로 인하여 아직 여전히 메모리 버그가 발생할 수 있기에, 따라서 퍼징과 같은 소프트웨어 테스팅 기법들이 여전히 필요합니다. 본 논문에서는 메모리 버그 탐지의 state-of-the-art 기술인 Address Sanitizer(ASan)가 C/C++에 초점을 맞추어 설계되어 있고, Rust의 특징을 전혀 반영하지 못하여 불필요한 높은 성능 오버헤드가 발생한다는 문제점을 설명합니다. 이 논문에서는 Rust의 특징들을 반영해 표준 탐지기술인 ASan을 최적화하고 불필요한 오버헤드를 제거하는 RustSan이라는 소프트웨어 메모리 오류 탐지기술 (Sanitizer)을 제시합니다. RustSan은 이를 위하여 Rust 코드의 더 정확한 분석을 위해 Rust MIR/HIR과 LLVM IR 병행을 분석하는 Cross-IR Analysis를 도입했으며, ASan의 shadow memory scheme의 binary한 탐지 기능을 확장하여, Rust에 적합한 tri-state 탐지 기능을 도입했습니다. RustSan은 총 57개의 Rust 프로그램들에 대하여 탐지 능력과 런타임 성능을 검증하였습니다. 테스트된 31개의 CVE부여 취약점을 모두 성능저하를 획기적으로 줄이면서 탐지하는데 성공하였고, 성능은 기존 표준기술 ASan대비 일반 프로그램 벤치마크 20종에서 평균 63.3%, Fuzzing 벤치마크에서 평균 23.52%/최고 57.08%의 성능향상을 보여주었습니다. RustSan은 최초의 Rust언어특화 메모리 오류 탐지기술로, 앞으로 Rust프로그램의 메모리 오류 검출을 훨씬 효율적으로 할수 있는 방향을 제시하였습니다. 영문 Abstract: Rust is gaining traction as a safe systems programming language with its strong type and memory safety guarantees. However, Rust’s guarantees are not infallible. The use of unsafe Rust, a subvariant of Rust, allows the programmer to temporarily escape the strict Rust language semantics to trade security for flexibility. Memory errors within unsafe blocks in Rust have far-reaching ramifications for the program’s safety. As a result, the conventional dynamic memory error detection (e.g., fuzzing) has been adapted as a common practice for Rust and proved its effectiveness through a trophy case ofdiscovered CVEs. RustSan is a retrofitted design of AddressSanitizer(ASan) for efficient dynamic memory error detection of Rust programs. Our observation is that a significant portion of instrumented memory access sites in a Rust program compiled with ASan is redundant, as the Rust security guarantees can still be valid at the site. RustSan identifies and instruments the sites that definitely or may undermine Rust security guarantees while lifting instrumentation on safe sites. To this end, RustSan employs a cross-IR program analysis for accurate tracking of unsafe sites and also extends ASan’s shadow memory scheme for checking non-uniform memory access validation necessary for Rust. We conduct a comprehensive evaluation of RustSan in terms of detection capability and performance using 57 Rust crates. RustSan successfully detected all 31 tested cases of CVE-issued memory errors. Also, RustSan shows an average of 62.3% performance increase against ASan in general benchmarks that involved 20 Rust crates. In the fuzzing experiment with 6 crates, RustSan marked an average of 23.52%, and up to 57.08% of performance improvement.
-
- 작성일 2023-12-11
- 조회수 884
-
- [연구] 이호준 교수 연구실, ACM CCS 2023 학술대회 수상소식
- 시스템보안 연구실 (지도교수 이호준, https://sslab.skku.edu)의 Dinh Kha(박사과정), 조규원(박사과정), 노태현(석사과정) 학생의 "Capacity: Cryptographically-Enforced In-process Capabilities for Modern ARM Architectures" 논문이 보안 분야 4대 학회 중 하나인 ACM Conference on Computer and Comunnications Security (CCS) 2023 학회에서 Distinguished Paper Award를 수상하였다. Distinguished Paper Ward는 CCS 23에서 발표된 235편의 논문 중 17편에 수여되었다. 논문 요약: 본 논문에서 제시한 Capacity 프레임워크는 기존 운영체제 접근제어 기능을 ARM의 새로운 하드웨어 기능인 Pointer Authentication과 Memory Tagging Extension을 통해 확장하여 Capability기만의 접근제어를 구현한다. Capacity는 프로세스 리소스에 대한 Reference 타입들인 메모리 포인터와 file descriptor를 하드웨어적으로 각 도메인의 키를 통해 서명하고, 모든 사용에 대해 검증한다. Capability 철학에 기반하여 서명된 Reference의 보안을 유지하는 장치들이 강건하게 구현되어 보안성이 높으며, 실제 NGINX, OpenSSH등의 프로그램들에 적용하여 그 실용성 및 성능 검증을 마친 연구이다.
-
- 작성일 2023-12-11
- 조회수 891
-
- [연구] 데이터 지능 및 학습 연구실 (지도교수: 이종욱), SIGIR, CIKM, EMNLP 2023 논문 7편 게재
- 데이터 지능 및 학습(Data Intelligence and Learning, DIAL) 연구실은 세계 최고 권위 정보검색 학회인 SIGIR 2023에 총 3편의 논문이 최종 게재 승인되었으며, 지난 7월 23일 스페인 마드리드에서 논문을 발표하였습니다. 지난 10월 21일에는 세계 최고 권위 데이터마이닝 학회인 CIKM 2023에 총 2편의 논문이 최종 게재 승인되어 영국 버밍엄에서 논문을 발표하였습니다. 또한, 세계 최고 권위 자연어처리 학회인 EMNLP 2023에 총 2편의 논문이 최종 게재 승인되었으며, 오는 12월에 싱가포르에서 논문을 발표할 예정입니다. [논문 목록] 1. It’s Enough: Relaxing Diagonal Constraints in Linear Autoencoders for Recommendation (SIGIR'23) 2. uCTRL: Unbiased Contrastive Representation Learning via Alignment and Uniformity for Collaborative Filtering (SIGIR'23) 3. ConQueR: Contextualized Query Reduction using Search Logs (SIGIR'23) 4. Forgetting-aware Linear Bias for Attentive Knowledge Tracing (CIKM'23) 5. Toward a Better Understanding of Loss Functions for Collaborative Filtering (CIKM'23) 6. GLEN: Generative Retrieval via Lexical Index Learning (EMNLP'23) 7. It Ain't Over: A Multi-aspect Diverse Math Word Problem Dataset (EMNLP'23) 연구 1: Jaewan Moon, Hye-young Kim, and Jongwuk Lee, “It’s Enough: Relaxing Diagonal Constraints in Linear Autoencoders for Recommendation”, 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2023 본 연구는 선형 오토인코더 (linear autoencoder) 기반 추천 시스템에서의 대각 제약조건 (diagonal constraint)에 대한 이론적 분석을 수행하고, 대각 제약조건을 완화한 relaxed linear autoencoders (RLAE)를 제안합니다. 선형 오토인코더 모델은 L2 정규화 (L2 regularization) 및 대각 성분 제거 제약조건 (zero-diagonal constraint)을 사용한 볼록 최적화 (convex optimization)를 통해 항목 간 가중치 행렬을 학습합니다. 본 논문은 선형 오토인코더 모델에서 두 가지 제약 조건의 특성을 이론적으로 이해하는 것을 목표로 합니다. 특이값 분해(singular value decomposition, SVD)와 주성분 분석(principal component analysis, PCA)을 활용한 가중치 행렬에 대한 분석을 통해 L2 정규화가 높은 순위의 주성분의 효과를 촉진한다는 사실을 밝힙니다. 반면, 대각선 성분 제거 제약조건은 순위가 낮은 주성분의 영향을 감소시켜 인기 없는 항목의 성능 저하로 이어질 수 있음을 보였습니다. 이러한 분석 결과로부터 영감을 얻어 대각선 부등식 제약 조건을 사용하는 간단하면서도 효과적인 선형 오토인코더 모델인 Relaxed Linear AutoEncoder (RLAE)와 Relaxed Denoising Linear AutoEncoder (RDLAE)를 제안합니다. 또한 대각 제약조건의 정도를 조정하는 제안 방법은 기존 선형 모델을 일반화한 형태임에 대한 증명을 제공합니다. 실험 결과는 6개의 벤치마크 데이터 세트에서 우리의 모델이 최첨단 선형 및 비선형 모델과 비슷하거나 더 우수하다는 것을 보여줍니다. 이는 대각 제약조건에 대한 이론적 통찰력을 뒷받침하며, 특히 인기도가 낮은 항목과 인기도 편향을 제거한 평가 (unbiased evaluation)에서 상당한 성능 향상이 발생됨을 확인하였습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/sigir2023_itsenough 연구 2: Jae-woong Lee, Seongmin Park, Mincheol Yoon, and Jongwuk Lee, “uCTRL: Unbiased Contrastive Representation Learning via Alignment and Uniformity for Collaborative Filtering”, 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR, short paper), 2023 본 연구는 추천 시스템에서 암묵적 피드백(e.g., 클릭 등)을 이용하여 학습할 때, 암묵적 피드백이 주로 인기있는 사용자와 항목에 편향되어 있어서 이로 인해 사용자와 항목의 표현(representation)이 실제 사용자와 항목의 선호도와 다르게 학습되는 문제를 해결한 논문입니다. 이 연구에서 우리는 기존의 추천에서 편향을 제거하는 연구들이 (i) 더 나은 표현 학습을 위해 널리 사용되는 대조 손실 함수(contrastive loss)를 고려하지 않는다는 것과 (ii) 편향 제거 시, 사용자와 항목을 모두 고려하지 않는다는 것을 지적하고 이를 보완하였습니다. 이 연구에서 우리는 Unbiased ConTrastive Representation Learning (uCTRL)을 제안합니다. 먼저, 기존에 추천 시스템에서 대조 손실 함수를 이용한 모델인 DirectAU 에서 영감을 받아, 대조적인 표현 학습을 정렬(alignment)과 균일성(uniformity) 두 가지 손실 함수로 나타냅니다. 정렬 함수는 사용자-항목 상호작용에 대해 사용자와 항목의 표현을 비슷하게 합니다. 균일성 함수는 각 사용자 및 항목 분포를 균등하게 나타냅니다. 우리는 정렬 함수가 사용자와 항목의 인기도에 편향되어 있다는 것을 확인하였으며, 편향을 추정한 뒤에 이를 이용하여 편향을 제거하는 방법인 IPW(inverse propensity weighting)를 이용하여 편향을 제거합니다. 추가적으로 우리는 IPW에서 사용되는 사용자와 항목을 모두 고려하여 편향을 추정하는 새로운 방법을 개발하여 하였습니다. 우리의 실험 결과는 제안된 uCTRL이 네 개의 벤치마크 데이터셋(MovieLens 1M, Gowalla, Yelp 및 Yahoo! R3)에서 최신 편향제거 모델보다 우수한 성능을 보인다는 것을 보여주었습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_uctrl 연구 3: Hye-young Kim*, Minjin Choi*, Sunkyung Lee, Eunseong Choi, Young-In Song, and Jongwuk Lee, “ConQueR: Contextualized Query Reduction using Search Logs”, 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR, short paper), 2023 본 연구는 사전학습된 언어 모델(Pre-trained language model)을 활용한 질의 축약 모델을 제안합니다. 질의 축약이란 사용자가 너무 긴 질의(검색어)를 입력하여 사용자의 의도에 맞는 적절한 결과를 얻지 못하였을 때, 질의에서 불필요한 단어를 제거하여 원하는 검색 결과를 찾는 방법을 의미합니다. 제안 모델 ConQueR는 (i)핵심 용어 추출과 (ii) 하위 질의 선택의 두 가지 관점에서 이를 해결합니다. 핵심 용어 추출 방법은 단어 수준에서 기존 질의의 핵심 용어를 추출하고 하위 질의 선택 방법은 주어진 하위 질의가 기존 질의의 올바른 축약인지 문장 수준에서 결정합니다. 두가지 관점은 서로 다른 레벨에서 작동하여 상호보완적인 관계를 가졌기 때문에 제안 모델 ConQueR는 최종적으로 이를 결합하여 올바른 축약을 얻습니다. 더불어 검색 로그에서 빈번하게 발생할 수 있는 잘못된 샘플을 처리하기 위해 truncated loss 학습 방식을 도입하여 학습이 원활히 이루어지도록 설계하였습니다. 실제 검색 엔진에서 수집한 검색 로그 데이터에 대한 성능 실험과 만족도 조사를 통해, 제안 모델이 효과적으로 질의 축약을 수행하였음을 입증하였습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_conquer 연구 4: Yoonjin Im*, Eunseong Choi*, Heejin Kook, and Jongwuk Lee, “Forgetting-aware Linear Bias for Attentive Knowledge Tracing”, The 32nd ACM International Conference on Information and Knowledge Management (CIKM, short paper), 2023 지식 추적은 학습자의 순차적인 과거 문제 풀이 기록을 기반으로 새로운 목표 문제의 정오답을 예측하는 과업을 통해 숙련도를 모델링합니다. 학습자의 숙련도를 정확히 예측하기 위해서는 문제 간의 상관관계와 학습자의 특성(예: 망각 행동)을 학습하는 것이 중요합니다. 따라서 일부 집중 메카니즘(attention mechanism) 기반의 지식 추적 모델들은 절대적 위치 정보(absolute position embeddings) 대신 상대적 시간 간격 편향(relative time interval bias)을 도입하여 학습자의 망각 행동(forgetting behavior)을 모델링했습니다. 이는 현재 시점에서 오래된 문제 풀이 기록일수록 모델의 집중도를 낮춤으로써 망각 행동을 구현합니다. 하지만 기존 방법론들은 문제 풀이 기록이 길어질수록 망각 행동 모델링의 효과가 줄어드는 문제가 나타납니다. 본 연구에서는 일반화된 수식 분석을 통해 기존의 상대적 시간 간격 편향 계산에 문제 간의 상관관계가 불필요하게 개입된다고 판단하고, 이를 해결하기 위해 서로를 분리할 수 있는 선형 편향 기반의 FoLiBi (Forgetting aware Linear Bias for Attentive Knowledge Tracing)를 제안합니다. 제안하는 방법론은 기존의 집중 메카니즘 기반의 지식 추적 모델에 쉽게 적용될 수 있으며, 간단한 방법임에도 불구하고 4개의 벤치마크 데이터 세트에서 최신 지식추적 모델에 비해 최대 2.58%까지 일관되게 AUC를 개선했습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_folibi 연구 5: Seongmin Park, Mincheol Yoon, Jae-woong Lee, Hogun Park, and Jongwuk Lee, “Toward a Better Understanding of Loss Functions for Collaborative Filtering”, The 32nd ACM International Conference on Information and Knowledge Management (CIKM), 2023 본 연구는 추천 시스템의 한 축인 협업 필터링(Collaborative filtering)에서 사용하는 다양한 손실 함수(Loss function) 간의 수식적인 관계를 분석하고, 이 관계를 기반으로 새로운 손실함수를 제안합니다. 협업 필터링은 최신 추천 시스템에서 핵심적인 기술이며, 협업 필터링 모델의 학습 과정은 일반적으로 상호작용 인코더, 손실 함수, 네거티브 샘플링의 세 가지 구성 요소로 이루어집니다. 기존의 많은 연구에서 정교한 상호작용 인코더를 설계하기 위해 다양한 협업 필터링 모델을 제안했지만, 최근 연구에서는 단순히 손실 함수를 교체하는 것만으로도 큰 성능 향상을 달성할 수 있음을 보여주고 있습니다. 이 논문에서는 기존 손실 함수 간의 관계를 분석하여, 기존의 손실 함수들을 정렬(Alignment) 및 균일(Unifomrity)으로 해석할 수 있음을 밝혀냈습니다. (i) 정렬은 사용자와 항목 표현을 일치시키고, (ii) 균일은 사용자와 항목 분포를 분산시키는 역할을 합니다. 이 분석에서 영감을 얻어 데이터셋의 고유한 패턴을 고려하여 정렬과 균일성의 설계를 개선하는 새로운 손실 함수(Margin-aware Alignment and Weighted Uniformity, MAWU)를 제안합니다. (i) Margin-aware Alignment(MA)는 사용자/아이템별 인기도 편향을 완화하고, (ii) Weighted Uniformity(WU)는 데이터셋의 고유한 특성을 반영하기 위해 사용자 및 항목 균일성을 조정합니다. 실험 결과, MAWU를 탑재한 MF와 LightGCN은 세 가지 벤치마크 데이터셋에서 다양한 손실 함수를 사용하는 최신 협업 필터링 모델과 비슷하거나 더 우수한 것으로 나타났습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_mawu 연구 6: Sunkyung Lee*, Minjin Choi*, Jongwuk Lee (* : equal contribution), “GLEN: Generative Retrieval via Lexical Index Learning”, The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2023 (To appear) 본 연구는 어휘 색인 학습을 통한 새로운 생성 검색 모델 GLEN (Generative retrieval model via LExical INdex Learning)을 제안합니다. 생성 검색(Generative retrieval)은 문서 검색의 새로운 패러다임으로, 질의에 대한 관련 문서의 식별자를 직접 생성하는 것을 목표로 합니다. 그러나, 기존 생성 검색 연구들은 두 가지 주요한 한계를 가집니다. 첫 번째는 문서의 식별자 생성이 기존의 자연어 생성과 의미적으로 많이 다르지만 이를 고려하지 않는다는 점입니다. 두 번째는 학습 시 식별자 생성만을 집중하지만, 추론 시 비슷한 문서 간의 순위를 매겨야 함으로 인해 발생하는 학습-추론 불일치입니다. 이를 극복하기 위해, 본 연구는 어휘 색인(lexical index)을 동적으로 학습하는 새로운 생성 검색 방법론을 제안합니다. 제안 방법론은 2단계 인덱스 학습 전략(two-phase lexical index learning)을 통해 (i) 키워드 기반의 고정된 문서 식별자를 생성하는 추가 사전 학습 단계를 수행하며, (ii) 동적 문서 식별자를 질의 및 문서 간의 관련성을 통해 학습하도록 합니다. 실험 결과, 제안 모델 GLEN이 NQ320k, MS MARCO, BEIR 등 다양한 벤치마크 데이터셋에서 기존의 생성 검색 모델 또는 전통적인 검색 모델 대비 최상 또는 경쟁력 있는 성능을 달성한다는 것을 증명하였습니다. 코드는 https://github.com/skleee/GLEN 에서 확인할 수 있습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_glen 연구 7: Jiwoo Kim, Youngbin Kim, Ilwoong Baek, JinYeong Bak, Jongwuk Lee, “It Ain't Over: A Multi-aspect Diverse Math Word Problem Dataset”, The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2023 (To appear) 본 연구는 LLM(Large Language Model)의 수학적 추론 능력을 분석하고, 이를 개선하기 위한 새로운 10K 데이터셋 DMath (Diverse Math Word Problems)를 제안합니다. 수학 문장형 문제 (MWP, Math Word Problem) 과제는 자연어 모델에게 자연어 문장에 대한 깊은 이해와 논리적 추론을 요구하는 복잡하고 흥미로운 과제이자 자연어 모델의 추론 능력을 평가하기 위해 주로 사용되어 온 과제입니다. 최근 들어 거대 언어 모델(LLM)이 등장하면서 기존 수학 문장형 문제 벤치마크에서 높은 성능을 거두었으며, 이를 통해 LLM이 좋은 수학적 추론 능력을 가지고 있다고 알려져 있습니다. 그러나 이는 제한적인 벤치마크로 인한 결과로 본 논문에서는 기존 벤치마크의 낮은 다양성을 지적하며 이를 높여야 함을 보입니다. 본 논문은 수학 문장형 문제 데이터셋이 가져야 하는 다양성을 총 네 가지로 정의합니다. 이는 추론 유형(problem types), 어휘 사용 패턴(lexical usage patterns), 언어(languages), 그리고 중간 풀이 과정(intermediate solution forms)입니다. 추론 유형을 정의하기 위해 본 연구는 미국과 한국의 수학 교육 과정을 참고하였고, 산술 연산(arithmetic calculation), 비교(comparison), 상관관계(correspondence), 도형(geometry), 확률(possibility)로 정의하였습니다. 이전 연구들은 산술 연산에 집중하였기 때문에 다른 유형의 수학적 추론 능력에 대해 LLM이 어떤 결과를 내보이는지 알려진 바가 적었습니다. 본 연구의 실험 결과 LLM의 추론 능력은 추론 유형에 따라 많은 차이를 보입니다. 어휘 사용 패턴, 언어, 중간 풀이 과정에 대해서도 높은 다양성을 추구하였고, 이러한 특징으로 인해 DMath는 이전 연구들보다 더 도전적인 데이터셋이라고 볼 수 있습니다. 또한 데이터를 구성하고 구축하는 과정에서 43명의 사람들이 참여했으며, 정교한 검증을 통해 높은 품질을 추구하였습니다. 높은 다양성으로 인해 DMath는 LLM의 다양한 추론 능력을 검사하고 평가하는데 도움이 될 수 있습니다. 관련 데이터는 https://github.com/JiwooKimAR/dmath 에서 확인하실 수 있습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_dmath
-
- 작성일 2023-11-26
- 조회수 1156
-
- [연구] 김형식 교수 연구실(보안공학연구실, SecLab), IEEE Symposium on Security and Privacy (S&P) 2024 논문 게재 승인
- 보안공학 연구실 (지도교수: 김형식, https://seclab.skku.edu)의 오상학(박사과정), 이기호(석사과정), 박선혜(석사과정) 학생과 김형식 교수가 진행한 "Poisoned ChatGPT Finds Work for Idle Hands: Exploring Developers' Coding Practices with Insecure Suggestions from Poisoned AI Models"논문이 컴퓨터 보안 분야에서 최우수 학술대회(IF=4)인 IEEE Symposium on Security and Privacy (S&P) 2024에 게재 승인되었습니다. 본 연구는 미국 테네시 대학교의 김두원 교수님과 공동 연구로 진행되었습니다. 본 논문은 ChatGPT 혹은 GitHub Copilot과 같은 AI 코딩 어시스턴트 툴에서 발생할 수 있는 공격인 포이즈닝 공격에 대한 개발자들의 인식을 분석하고, 더 나아가 실제 개발자들이 포이즈닝 공격을 접했을 때 이를 어떻게 대처하는지에 대한 개발자들의 코딩 패턴을 분석한 연구입니다. 이를 위해, 실제 소프트웨어 개발자들을 모집하여 온라인 사용자 스터디와 In-lab 스터디를 진행하였으며, In-lab 스터디에서는 일반 개발자와 보안 지식이 있는 개발자를 각각 모집하여 실험을 진행하였습니다. 주요 결과로, IntelliCode와 같은 형태의 AI 코딩 어시스턴트 툴을 사용하거나 툴이 없는 환경일 때보다, ChatGPT와 같은 형태의 툴을 사용하는 환경에서 포이즈닝 공격을 통해 취약한 코드가 개발자에서 제안되었을 때, 개발자들이 좀더 취약한 코드를 생성하는 경향을 보이는 결과를 보였습니다. Abstract. AI-powered coding assistant tools (e.g., ChatGPT, Copilot, and IntelliCode) have revolutionized the software engineering ecosystem. However, prior work has demonstrated that these tools are vulnerable to poisoning attacks. In a poisoning attack, an attacker intentionally injects maliciously-crafted insecure code snippets into training datasets to manipulate these tools. The poisoned tools can suggest insecure code to developers, resulting in vulnerabilities in their products that attackers can exploit. However, it is still little understood whether such poisoning attacks against the tools would be practical in real-world settings and how developers address the poisoning attacks during software development. To better understand the feasibility of poisoning attacks against AI-powered coding assistant tools, we designed two user studies: an online survey and an in-lab study. The online survey was conducted with 241 software developers. The survey results showed developers widely adopted these tools to enhance coding speed, eliminate repetition, and gain boilerplate code. However, the survey also found developers may misplace trust in these tools because they overlooked the risk of poisoning attacks. The in-lab study was conducted with 30 professional developers. The developers were asked to complete three programming tasks with a representative type of AI-powered coding assistant tool like ChatGPT or IntelliCode running on Visual Studio Code. The in-lab study results showed that developers using a poisoned ChatGPT-like tool were more prone to including insecure code than those using an IntelliCode-like tool or no tool. This demonstrates the strong influence of these tools on the security of generated code. Our study results highlight the need for education and improved coding practices to address new security issues introduced by AI-powered coding assistant tools.
-
- 작성일 2023-10-31
- 조회수 1729
-
- [연구] 우사이먼성일 교수 DASH 연구실, CIKM 2023 국제 학술대회 논문 3편 게재 승인 및 이상탐지 관련 워크숍 개최
- DASH 연구실 박은주 소프트웨어학과 박사과정, Binh M. Le 소프트웨어학과 박사과정, 소프트웨어학과 융합보안대학원 조범상 석사과정, 이상용 인공지능대학원 석사과정, 백승연 인공지능대학원 석사과정, 김지원 인공지능대학원 석사과정의 논문 3편이 인공지능 및 정보검색 분야의 top-tier 국제학술대회인 CIKM (Conference on Information and Knowledge Management) 2023에 최종 논문 게재가 승인되어 10월에 발표될 예정입니다. 1.호주 CSIRO Data61과 Deepfake 관련 연구 2.신분증 진위 분류를 위한 데이터셋 관련 연구 3.Machine Unlearning 연구 또한, DASH 연구실 우사이먼성일 교수님이 주축이 되어 제 1회 위성 및 무인비행체의 이상탐지에 관한 워크샵이 CIKM 2023에서 개최됩니다. 1. Beomsang Cho, Binh M. Le, Jiwon Kim, Simon S. Woo , Shahroz Tariq, Alsharif Abuadbba, and Kristen Moore , “Toward Understanding of Deepfake Videos in the Wild”, Proceedings of the 32nd ACM International Conference on Information & Knowledge Management. 2023. 본 연구는 최근 증가하는 Deepfake 문제를 다루며, 기존 Dataset이 최신 기술을 충분히 반영하지 못하는 한계를 극복하기 위한 목적으로 시작되었습니다. 우리는 RWDF-23이라는 최신 Deepfake Dataset을 제안합니다. RWDF-23은 Reddit, Youtube, TikTok, Bilibili등에서 수집한 2,000개의 Deepfake 비디오로 구성되며, 4가지의 다른 언어를 대상으로 수집하였습니다. 이를 통하여 이전 Dataset의 범위를 확장하고, 현재 온라인 플랫폼에서 얼마나 많은 최신 Deepfake 기술들이 사용되고 있는지 분석하며 Deepfake를 제작하는 사람들의 분석뿐만 아니라 시청자들의 의견과 상호 작용 데이터를 수집하여 Deepfake를 시청하는 사람들의 상호작용 방식을 조사합니다. 이러한 풍부한 정보를 고려하여 계속해서 진화하는 Deepfake와 현실 온라인 플랫폼에 미치는 영향에 대한 포괄적인 이해를 제공합니다. Deepfakes have become a growing concern in recent years, prompting researchers to develop benchmark datasets and detection algorithms to tackle the issue. However, existing datasets suffer from significant drawbacks that hamper their effectiveness. Notably, these datasets fail to encompass the latest deepfake videos produced by state-of-the-art methods that are being shared across various platforms. This limitation impedes the ability to keep pace with the rapid evolution of generative AI techniques employed in real-world deepfake production. Our contributions in this IRB-approved study are to bridge this knowledge gap from current real-world deepfakes by providing in-depth analysis. We first present the largest and most diverse and recent deepfake dataset (RWDF-23) collected from the wild to date, consisting of 2,000 deepfake videos collected from 4 platforms targeting 4 different languages span created from 21 countries: Reddit, YouTube, TikTok, and Bilibili. By expanding the dataset’s scope beyond the previous research, we capture a broader range of real-world deepfake content, reflecting the ever-evolving landscape of online platforms. Also, we conduct a comprehensive analysis encompassing various aspects of deepfakes, including creators, manipulation strategies, purposes, and real-world content production methods. This allows us to gain valuable insights into the nuances and characteristics of deepfakes in different contexts. Lastly, in addition to the video content, we also collect viewer comments and interactions, enabling us to explore the engagements of internet users with deepfake content. By considering this rich contextual information, we aim to provide a holistic understanding of the evolving deepfake phenomenon and its impact on online platforms. 2. Eun-Ju Park, Seung-Yeon Back, Jeongho Kim, and Simon S. Woo, ”KID34K: A Dataset for Online Identity Card Fraud Detection”, Proceedings of the 32nd ACM International Conference on Information & Knowledge Management. 2023. 본 연구에서는 모바일 신분증 검증 시스템의 보안 강화를 위한 데이터셋을 제공합니다. 최근 모바일 플랫폼에서의 본인인증절차는 신분증을 기반으로 진행되고 있는데, 비대면 금융거래가 증가함에 따라 금융거래의 당사자가 신분증 명의자임을 증명하는 절차도 중요해지고 있습니다. 그러나, 현재의 시스템은 금융거래 이용자가 제출하는 사진이 본인의 신분증을 직접 찍는 것인지, 아니면 모니터나 종이에 출력한 다른 사람의 신분증 사진을 찍은 것인지 구별하지 않습니다. 본 연구는 이러한 신분증 검증 시스템의 안정성 강화라는 측면과, 또한 신분증의 개인정보 유출을 막기위한 측면 두 가지를 고려한 신분증 이미지 데이터셋을 제공합니다. Though digital financial systems have provided users with convenient and accessible services, such as supporting banking or payment services anywhere, it is necessary to have robust security to protect against identity misuse. Thus, online digital identity (ID) verification plays a crucial role in securing financial services on mobile platforms. One of the most widely employed techniques for digital ID verification is that mobile applications request users to take and upload a picture of their own ID cards. However, this approach has vulnerabilities where someone takes pictures of the ID cards belonging to another person displayed on a screen, or printed on paper to be verified as the ID card owner. To mitigate the risks associated with fraudulent ID card verification, we present a novel dataset for classifying cases where the ID card images that users upload to the verification system are genuine or digitally represented. Our dataset is replicas designed to resemble real ID cards, making it available while avoiding privacy issues. Through extensive experiments, we demonstrate that our dataset is effective for detecting digitally represented ID card images, not only in our replica dataset but also in the dataset consisting of real ID cards. 3. Sanyong Lee and Simon Woo, “UNDO: Effective and Accurate Unlearning Method for Deep Neural Networks”, Proceedings of the 32nd ACM International Conference on Information & Knowledge Management. 2023. 본 연구에서는 간단하면서 효과적인 machine unlearning 기법 UNDO를 제안합니다. 이 기법은 학습된 모델에서 한 클래스의 정보를 지우기 위해 두 스텝으로 이뤄져있습니다. 먼저 coarse-grained level로서, 잊으려고 하는 데이터에 다른 레이블을 부여하여 한 에폭(epoch)만 짧게 학습하므로서 결정 경계를 허뭅니다. 그런 다음 fine-grained level로서, 앞선 단계에서 차마 잊지 못한 데이터를 잊으면서, 남길 데이터에 대한 부작용을 개선하기 위한 학습을 합니다. 이때 남길 데이터는 학습에 사용하지 않은 소량만 사용하여 학습 속도를 빠르게 합니다. 다양한 실험을 통하여 본 논문에서 제안하는 UNDO는 기존 machine unlearning 기법들 보다 빠르고 효과적임을 보여줍니다. Machine learning has evolved through extensive data usage, including personal and private information. Regulations like GDPR highlight the "Right to be forgotten" for user and data privacy. Research in machine unlearning aims to remove specific data from pre-trained models. We introduce a novel two-step unlearning method, UNDO. First, we selectively disrupt the decision boundary of forgetting data at the coarse-grained level. However, this can also inadvertently affect the decision boundary of other remaining data, lowering the overall performance of the classification task. Hence, we subsequently repair and refine the decision boundary for each class at the fine-grained level by introducing a loss to maintain the overall performance while completely removing the class. Our approach is validated through experiments on two datasets, outperforming other methods in effectiveness and efficiency. 4. The 1st International Workshop on Anomaly and Novelty detection in Satellite and Drones systems (ANSD '23) 제 1회 위성 및 무인비행체의 이상탐지에 관한 워크샵이 CIKM 2023에서 개최됩니다. 본 워크샵은 우사이먼성일 성균관대 교수, Shahroz Tariq CSIRO’s Data61 소속, 신유진 가톨릭대 교수, 정대원 한국항공우주연구원 소속이 주축이 되어 무인비행체의 시계열 및 이미지 데이터에 대한 이상을 탐지하는 것과 관련된 내용을 주제로 합니다. The workshop on Anomaly and Novelty Detection in Drones and Satellite data at CIKM 2023 aims to bring together researchers, practitioners, and industry experts to discuss the latest advancements and challenges in detecting anomalies and novelties in drone and satellite data. With the increasing availability of such data, the workshop seeks to explore the potential of machine learning and data mining techniques to enable the timely and accurate detection of unexpected events or changes. The workshop will include presentations of research papers, keynote talks, panel discussions, and poster sessions, with a focus on promoting interdisciplinary collaboration and fostering new ideas for tackling real-world problems. 문의사항이나 질문은 DASH Lab(https://dash.skku.edu)의 우사이먼교수(swoo@g.skku.edu)에게 연락부탁드립니다.
-
- 작성일 2023-09-18
- 조회수 1387
-
- [연구] 엄영익 교수 연구실(분산컴퓨팅연구실, DCLab.), SOSP 2023 논문 게재 승인
- 분산컴퓨팅연구실의 엄영익 교수님과 이태형 박사과정의 논문 “MEMTIS: Efficient Memory Tiering with Dynamic Page Classification and Page Size Determination”이 The 29th ACM Symposium on Operating Systems Principles (SOSP 2023) 학회에 게재 승인되었습니다. SOSP 학회는 컴퓨터 시스템 분야의 연구자, 개발자, 프로그래머를 위한 세계 최고의 학회입니다(BK21+ Computer Science 분야 최우수국제학술대회 인정IF=4). 본 논문은 최신 데이터센터 및 클라우드 컴퓨팅 환경에서 요구하는 대용량 메모리 시스템을 효과적으로 구축하는 방법을 제안합니다. 엄영익 교수님 연구팀은 DRAM과 차세대 하드웨어인 NVM(Non-Volatile Memory), CXL Memory 장치를 활용하는 새로운 계층형 메모리 시스템, MEMTIS를 제안하였습니다. MEMTIS는 자체적인 고성능 메모리 페이지 관리 기법을 바탕으로 최신의 계층형 메모리 시스템 대비 최대 169% 높은 성능을 보여줍니다. 본 연구는 엄영익교수님 연구팀과 미국의 Virginia Tech 소속 민창우 교수 연구팀 간의 국제 공동 연구로 수행 되었습니다. 또한, 이번 SOSP 논문 게재를 통해 분산컴퓨팅연구실은 국내 연구실로는 처음으로 SOSP에 두 편 이상의 논문(SOSP 2021 FragPicker, SOSP2023 MEMTIS)을 게재하게 되었습니다. 또한, 엄영익 교수님 연구팀은 올해에만 ASPLOS, MobiCom에 이어 세 번째 top-tier conference 논문을 게재하게 됩니다. [SOSP 2023] The 29th ACM Symposium on Operating Systems Principles, October 23-26, 2023 https://sosp2023.mpi-sws.org/ [논문 정보] MEMTIS: Efficient Memory Tiering with Dynamic Page Classification and Page Size Determination Taehyung Lee, Sumit Kumar Monga, Changwoo Min, Young Ik Eom 29th Symposium on Operating Systems Principles (SOSP 2023) Abstract: The evergrowing memory demand fueled by datacenter workloads is the driving force behind new memory technology innovations (e.g., NVM, CXL). Tiered memory system is a promising solution which harnesses such multiple memory types with varying capacity, latency, and cost characteristics in an effort to reduce server hardware costs while fulfilling memory demand. Prior works on memory tiering make suboptimal (often pathological) page placement decisions because they rely on various heuristics and static thresholds without considering overall memory access distribution. Also, deciding the appropriate page size for an application is difficult as huge pages are not always beneficial as a result of skewed accesses within them. We present Memtis, a tiered memory system that adopts an informed decision-making for page placement and page size determination. Memtis leverages access distribution of allocated pages to optimally approximate the hot data set to the fast tier capacity. Moreover, Memtis dynamically determines the page size that allows applications to use huge pages while avoiding their drawbacks by detecting inefficient use of fast tier memory and splintering them if necessary. Our evaluation shows that Memtis outperforms state-of-the-art tiering systems by up to 169.0% and their best by up to 33.6%. 분산컴퓨팅연구실: http://dclab.skku.ac.kr/xe/
-
- 작성일 2023-08-09
- 조회수 1836
-
- [연구] 시스템보안연구실(지도교수: 이호준), ACM CCS 2023에 논문 게재 승인
- 시스템보안 연구실 (지도교수 이호준, https://sslab.skku.edu)의 Dinh Kha(박사과정), 조규원(박사과정), 노태현(석사과정) 학생의 "Capacity: Cryptographically-Enforced In-process Capabilities for Modern ARM Architectures" 논문이 보안 분야 4대 학회 중 하나인 ACM Conference on Computer and Comunnications Security (CCS) 2023에 게재 승인되어 11월에 발표될 예정입니다. 오늘 날의 소프트웨어는 코드 베이스의 크기 및 복잡성 그리고 지속적인 변화로 인하여 취약성을 제거하기가 매우 어려워 많은 보안 사고의 원인이 되고 있습니다. 특히나 소프트웨어의 여러 구성 요소들이 하나의 주소공간에 위치하는 monolithic한 형태를 가진 경우가 많아, 단 한 개의 취약점으로도 프로그램의 전 부분이 위험해지는 문제를 가지고 있습니다. 이를 보완하기 위한 기술로써, 프로그램을 여러 개의 도메인으로 격리하여 각 도메인의 취약성의 위험성을 제안하는 기법인 In-Process Isolation (IPI)가 널리 연구되고 있습니다. 제안된 Capacity는 기존 운영체제 접근제어 기능을 ARM의 새로운 하드웨어 기능인 Pointer Authentication과 Memory Tagging Extension을 통해 확장하여 Capability기만의 접근제어를 구현합니다. Capacity는 프로세스 리소스에 대한 Reference 타입들인 메모리 포인터와 file descriptor를 하드웨어적으로 각 도메인의 키를 통해 서명하고, 모든 사용에 대해 검증함으로써 Capability 시스템을 구현합니다. Capability 철학에 기반하여 서명된 Reference의 보안을 유지하는 장치들이 강건하게 구현되어 보안성이 높으며, 실제 NGINX, OpenSSH등의 프로그램들에 적용하여 그 실용성 및 성능 검증을 마쳤습니다.
-
- 작성일 2023-07-26
- 조회수 1624
-
- [연구] 이지형 교수 연구실(IISLab), ICCV 2023 논문 게재 승인
- 정보 및 지능 시스템 연구실(지도교수:이지형) 노순철 (2022년 인공지능학과 석사 졸업)의 논문 " Simple and Effective Out-of-Distribution Detection via Cosine-based Softmax Loss "가 인공지능 및 컴퓨터 비전 분야의 최우수 국제 학술대회(BK21 CS IF=4)인 International Conference on Computer Vision (ICCV 2023)에 게재 승인되었습니다. " Simple and Effective Out-of-Distribution Detection via Cosine-based Softmax Loss " 논문에서는 out-of-distribution(OOD) 감지를 위한 간단하고 효과적인 방법을 제안합니다. 기존 OOD 감지에서는 추가적인 데이터, Input processing 혹은 높은 연산 비용을 요구하는 경우가 많으며, 사용자가 직접 설정해줘야하는 hypher-parameter가 존재하는 점을 문제로 제기하였습니다. 이는 Cosine- based Softmax Loss로 훈련된 분류 모델에서 feature norm과 Mahalanobis 거리를 결합한 간단하면서도 효과적인 OOD 감지 방법을 제안합니다. 이는 추가 데이터를 사용하지 않아 실용적이며, Input processing을 사용하는 것보다 3배 빠른 속도를 보여줍니다. [Abstract] Deep learning models need to detect out-of-distribution (OOD) data in the inference stage because they are trained to estimate the train distribution and infer the data sampled from the distribution. Many methods have been proposed, but they have some limitations, such as requiring additional data, input processing, or high computational cost. Moreover, most methods have hyperparameters to be set by users, which have a significant impact on the detection rate. We propose a simple and effective OOD detection method by combining the feature norm and the Mahalanobis distance obtained from classification models trained with the cosine- based softmax loss. Our method is practical because it does not use additional data for training, is about three times faster when inferencing than the methods using the input processing, and is easy to apply because it does not have any hyperparameters for OOD detection. We confirm that our method is superior to or at least comparable to state- of-the-art OOD detection methods through the experiments.
-
- 작성일 2023-07-25
- 조회수 2859