-
- [연구] [구형준/황성재 교수] SecAI/SoftSec 연구실, ACM International Conference on the Foundations of Software Engineering (FSE 2024) 논문 게재
- SecAI 연구실 (지도교수 구형준, https://secai.skku.edu)과 SoftSec 연구실 (지도교수 황성재, https://softsec.skku.edu)의 엄하은 학생 (석사과정), 김도희 학생 (석사과정), 임소리 학생 (학부과정)의 "R2I: A Relative Readability Metric for Decompiled Code" 논문이 소프트웨어 엔지니어링 분야 최우수 학회 (IF=4)인 ACM International Conference on the Foundations of Software Engineering (FSE 2024)에 게재 승인되어 2024년 7월에 발표될 예정입니다. 디컴파일러는 기계어를 사람이 이해하기 쉬운 코드로 변환해 주는 도구로 바이너리 역공학에 핵심적인 역할을 합니다. 디컴파일 코드의 가독성은 바이너리에 대한 이해도를 향상시키고 효율적인 분석을 가능하게 합니다. Hex-rays, Ghidra와 같은 디컴파일러들은 디컴파일된 코드의 가독성 향상을 위해 노력하고 있지만, 디컴파일 코드의 가독성을 측정하는 메트릭은 부족하며, 기존 연구는 대부분 소스 코드의 가독성에 중점을 두고 있습니다. (디컴파일 코드는 주석이나 의미 있는 변수명이 없고, 문법적 오류나 low-level expression 등이 포함되어 있어 소스 코드 메트릭을 적용하는 것은 적절하지 않습니다.) 본 논문에서는 디컴파일 코드의 가독성을 상대적으로 평가할 수 있도록 최초의 디컴파일러 전용 가독성 메트릭인 R2I (Readability Relative Index)을 제안합니다. R2I 메트릭은 디컴파일 코드에서 AST (Abstract Syntax Tree)를 추출한 후 이를 기반으로 사전에 정의한 31개의 특성 (feature)에 가중치 (weight)를 적용해 상대적인 가독성 점수를 계산합니다. 디컴파일 코드 특성은 기존 디컴파일러의 가독성 향상을 위한 방식과 이전 소스 코드 가독성 연구를 참고하여 31가지를 선별했습니다. 또한, 코딩 스타일이나 선호도에 따라 주관적일 수 있는 특성의 경우 설문 조사를 통해 가중치를 조정했습니다. R2I의 효용성과 실용성을 검증하기 위해 여섯 가지 디컴파일러 결과를 대상으로 5,305개의 함수에 R2I 점수를 계산하고, 디컴파일러 사용 경험과 개발 경험이 있는 사람을 모집하여 설문 조사를 진행해 설문 조사의 결과와 R2I의 결과가 일치함을 보였습니다. Abstract. Decompilation is a process of converting a low-level machine code snippet back into a high-level programming language such as C. It serves as a basis to aid reverse engineers in comprehending the contextual semantics of the code. In this respect, commercial decompilers like Hex-Rays have made significant strides in improving the readability of decompiled code over time. While previous work has proposed the metrics for assessing the readability of source code, including identifiers, variable names, function names, and comments, those metrics are unsuitable for measuring the readability of decompiled code primarily due to i) the lack of rich semantic information in the source and ii) the presence of erroneous syntax or inappropriate expressions. In response, to the best of our knowledge, this work first introduces R2I, the Relative Readability Index, a specialized metric tailored to evaluate decompiled code in a relative context quantitatively. In essence, R2I can be computed by i) taking code snippets across different decompilers as input and ii) extracting pre-defined features from an abstract syntax tree. For the robustness of R2I, we thoroughly investigate the enhancement efforts made by existing decompilers and academic research to promote code readability, identifying 31 features to yield a reliable index collectively. Besides, we conducted a user survey to capture subjective factors such as one’s coding styles and preferences. Our empirical experiments demonstrate that R2I is a versatile metric capable of representing the relative quality of decompiled code (e.g., obfuscation, decompiler updates) and being well aligned with human perception in our survey.
-
- 작성일 2024-01-25
- 조회수 881
-
- [연구] Seclab (김형식 교수 연구실) AAAI 2024 논문 게재 승인
- Seclab (지도교수: 김형식)의 논문 1편이 인공지능 분야의 우수 학술대회인 AAAI Conference on Artificial Intelligence 2024 (AAAI-24)에 게재 승인되었습니다. 본 연구에는 Dash Lab(지도교수:우사이먼성일)의 우사이먼성일 교수가 참여 하였습니다. 본 과제는 네이버 클라우드의 지원 하에 진행되었습니다. 논문 #1: Blind-Touch: Homomorphic Encryption-Based Distributed Neural Network Inference for Privacy-Preserving Fingerprint Authentication (전자전기컴퓨터공학과 박사과정 최현민, 데이터사이언스융합학과 부교수 우사이먼성일) “Blind-Touch: Homomorphic Encryption-Based Distributed Neural Network Inference for Privacy-Preserving Fingerprint Authentication” 논문은 동형암호를 활용해 지문인증시 프라이버시를 보호할 수 있습니다. 동형암호는 암호화된 상태에서 연산이 가능한 암호화 기술로, 동형암호를 사용하면 복호화 과정 없이 수학적 연산이 가능하여 각종 통계연산이나 머신러닝 연산들을 프라이버시 유출 없이 제공할 수 있습니다. 하지만, 동형암호의 연산 속도는 평문 연산에 비해 매우 느리며 (약 수백~수천 배 이상), 암호문의 사이즈가 같은 보안강도의 공개키 암호인 RSA 등과 비교해서 수백배 이상 크기 때문에 동형암호를 효율적으로 사용하기 위해서는 성능 면에서 최적화가 가능한 알고리즘들을 고안해야 합니다. 이 논문에서는 지문인증에 필요한 유사도 매칭 알고리즘을 동형암호로 구현하며, 다음과 같은 기여도를 가집니다. 첫 번째로, FC-Layer의 선형성을 활용한 연산의 최적화를 통해 유사도 연산 시간을 획기적으로 줄였으며, 둘째로 Compression method라는 기술을 통해 여러 개의 Output ciphertext를 하나의 Ciphertext로 압축하여 통신 비용을 줄였습니다. 세번째로 서버 클러스터 구성을 적용하여 등록된 지문의 갯수가 증가해도 전체 연산 속도는 일정하게 유지할 수 있도록 서버의 양적 확장을 제공합니다. 제안된 연구는 최신 결과에 준하는 인증 성능 (PolyU Fingerprint Dataset 기준, AUC:97.5%, EER: 2.5%)을 확보하였으며, 5,000건의 지문 데이터를 0.65초 이내로 인증이 가능하며 동형암호 기반 지문인식의 기존 연구들과 비교하여 인증 속도 면에서 우수한 성능을 보여줍니다. 예로, 최신 동형암호가 적용된 지문인증 알고리즘인 DeepPrint 보다 6.786배 낮은 인증 시간을 소요합니다. [논문 #1 정보] Blind-Touch: Homomorphic Encryption-Based Distributed Neural Network Inference for Privacy-Preserving Fingerprint Authentication Fingerprint authentication is a popular security mechanism for smartphones and laptops. However, its adoption in web and cloud environments has been limited due to privacy concerns over storing and processing biometric data on servers. This paper introduces Blind-Touch, a novel machine learning-based fingerprint authentication system leveraging homomorphic encryption to address these privacy concerns. Homomorphic encryption allows computations on encrypted data without decrypting. Thus, Blind-Touch can keep fingerprint data encrypted on the server while performing machine learning operations. Blind-Touch combines three strategies to efficiently utilize homomorphic encryption in machine learning: (1) It optimizes the feature vector for a distributed architecture, processing the first fully connected layer (FC-16) in plaintext on the client side and the subsequent layer (FC-1) post-encryption on the server, thereby minimizing encrypted computations; (2) It employs a homomorphic encryption-compatible data compression technique capable of handling 8,192 authentication results concurrently; and (3) It utilizes a clustered server architecture to simultaneously process authentication results, thereby enhancing scalability with increasing user numbers. Blind-Touch achieves high accuracy on two benchmark fingerprint datasets, with a 93.6% F1-score for the PolyU dataset and a 98.2% F1-score for the SOKOTO dataset. Moreover, Blind-Touch can match a fingerprint among 5,000 in about 0.65 seconds. With its privacy-focused design, high accuracy, and efficiency, Blind-Touch is a promising alternative to conventional fingerprint authentication for web and cloud applications.
-
- 작성일 2024-01-25
- 조회수 769
-
- [교수동정] 인공지능대학원 이지형 교수, 과학기술정보통신부 장관상 수상
- 인공지능대학원 이지형 교수, 과학기술정보통신부 장관상 수상 인공지능학과 이지형 교수가 지난 12월 31일(일) 2023년 디지털인재양성 업무 발전에 기여한 우수한 공로를 인정받아 과학기술정보통신부 장관상을 수상하였다. 이지형 교수는 국내 최초로 인공지능대학원지원사업 과제 선정 및 책임을 맡아 현재 연평균 150여 명의 인공지능분야 석·박사급 고급인력을 양성하고 있다. 인공지능대학원은 특정 분야의 특정 문제 해결을 위한 AI가 아닌 다양한 작업환경에서 상황정보를 통합분석(Multi-modal)하여 실시간(Expeditive) 능동적(Generative)으로 대처(Actionable)하는 인공지능(AI)인 Mega AI 구현을 목표로 교육, 연구, 산학협력, 국제화 등 다방면의 프로그램을 통하여 사업을 선도적으로 운영해 나가고 있다. 한편, 이지형 교수는 2024년도 4단계 BK21사업(미래인재양성사업 교육연구단)에도 선정되어 2024년부터 2027년까지 지속성장 미래컴퓨팅을 위한 SW 미래인재양성을 위한 교육, 연구 운영에도 착수할 예정이다.
-
- 작성일 2024-01-17
- 조회수 497
-
- [연구] 신동군 교수 연구실, AAAI Conference on Artificial Intelligence 2024 (AAAI-24)에 논문 1편 게재 승인
- Intelligent Embedded Systems Laboratory (지도교수: 신동군)의 논문 1편이 인공지능 분야의 우수 학술대회인 AAAI Conference on Artificial Intelligence 2024 (AAAI-24)에 게재 승인되었습니다 논문 #1: Proxyformer: Nystrom-Based Linear Transformer with Trainable Proxy Tokens (인공지능학과 석사과정 이상호, 전기전자컴퓨터공학과 박사과정 이하윤) "Proxyformer: Nystrom-Based Linear Transformer with Trainable Proxy Tokens" 논문은 selfattention 연산의 복잡도 문제에 초점을 맞추고 있습니다.. 이 논문에서는 기존 self-attention 연산 의 입력 시퀀스 길이 n에 대한 2차 복잡도를 해결하기 위해, Nystrom 방법과 신경 메모리(neural memory)를 통합하여 확장된 Nystrom attention 방식을 제안합니다. 첫째로 Nystrom 방법의 랜드 마크로 활용되는 학습 가능한 proxy token을 도입함으로써, attention 연산의 복잡도를 제곱에서 선형으로 줄이며, 입력 시퀀스를 고려한 랜드마크를 효과적으로 생성할 수 있도록 하였습니다. 둘 째로, 랜드마크 간 대조 학습(Contrastive Learning) 적용함으로써 최소한의 랜드마크를 사용하여 attention 맵을 효과적으로 복원할 수 있도록 학습하였습니다. 셋째로, 분해된 attention 행렬에 적 합한 dropout 방법을 개발하여, proxy token들이 효과적으로 학습되는 정규화를 가능하게 하였습 니다. 제안된 Proxyformer는 최소한의 proxy token으로 attention 맵을 효과적으로 근사할 수 있 게 되었으며, 이는 LRA 벤치마크에서 기존 기법들에 비해 우수한 성능을 보여주며 기존 selfattention 방식에 비해 4096 길이의 입력 시퀀스에서 3.8배 높은 처리량과 0.08배 낮은 메모리 사 용량을 달성하는 결과를 보여주었습니다. [논문 #1 정보] Proxyformer: Nystrom-Based Linear Transformer with Trainable Proxy Tokens Sangho Lee, Hayun Lee, Dongkun Shin Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI), 2024 Transformer-based models have demonstrated remarkable performance in various domains, including natural language processing, image processing and generative modeling. The most significant contributor to the successful performance of Transformer models is the self-attention mechanism, which allows for a comprehensive understanding of the interactions between tokens in the input sequence. However, there is a well-known scalability issue, the quadratic dependency of self-attention operations on the input sequence length n, making the handling of lengthy sequences challenging. To address this limitation, there has been a surge of research on efficient transformers, aiming to alleviate the quadratic dependency on the input sequence length. Among these, the Nyströmformer, which utilizes the Nyström method to decompose the attention matrix, achieves superior performance in both accuracy and throughput. However, its landmark selection exhibits redundancy, and the model incurs computational overhead when calculating the pseudo-inverse matrix. We propose a novel Nyström method-based transformer, called Proxyformer. Unlike the traditional approach of selecting landmarks from input tokens, the Proxyformer utilizes trainable neural memory, called proxy tokens, for landmarks. By integrating contrastive learning, input injection, and a specialized dropout for the decomposed matrix, Proxyformer achieves top-tier performance for long sequence tasks in the Long Range Arena benchmark.
-
- 작성일 2023-12-22
- 조회수 1128
-
- [학생실적] 인공지능융합전공 얼간이·RMDP 팀, 제 1회 수도권 대학교 인공지능(SCAICO) 연합 경진대회 금상·특별상 수상
- 인공지능융합전공 얼간이(김명섭, 이수형, 조정환)·RMDP(김수민, 김현서, 장우혁), 제 1회 수도권 대학교 인공지능(SCAICO) 연합 경진대회서 금상·특별상 수상 우리 대학 글로벌융합학부 인공지능융합전공 김명섭, 이수형, 조정환 학우(이하 얼간이 팀), 김수민, 김현서, 장우혁(이하 RMDP팀)이 지난 11월 19일(일) 세종대학교 대양 AI센터에서 진행된 2023년 제 1회 수도권 대학 인공지능 연합 경진대회에서 각각 금상(2등), 특별상(SKT 특별상)을 수상했다. <수도권 대학 인공지능 연합 경진대회(Seoul Central Artificial Intelligence Competion, S.C.A.I.C.O)>는 본교 SW중심대학사업단, 세종대학교 SW-AI중심대학추진단, 가톨릭대학교 LINC3.0사업단, 가톨릭대학교 디지털전환ICC, 건국대학교 SW중심대학사업단, 경희대학교 SW중심대학사업단, 인하대학교 SW중심대학사업단이 주관하고, 각 대학 유관학과 학생회가 주최하고 3M, SK telecom, DEVOCEAN이 후원해 본교를 비롯한 수도권 8개 대학 총 13개 팀이 각 대학별 내부 예선을 거쳐 참여했다. SK Devocean 김상기 팀장, 얼간이팀(인공지능융합전공 22학번 이수형, 20학번 김명섭, 22학번 조정환) 이번 대회는 2023년 인공지능 관련 키워트(트렌드 코리아 2023)를 활용한 성과물 제작을 주제로 진행되었다. 금상(2등)을 수상한 얼간이팀에게는 1,000,000원의 상금과 상장이 SKT 특별상을 수상한 RMDP팀에게는 500,000원의 상금과 상장이 수여되었다. 대상(1등)은 경희대학교 KHAI 팀, 은상(3등)은 세종대학교 흑설탕팀이 수상의 영광을 차지했다. 특히나 이번 대회는 각 학과 학생회가 행사를 기획 및 주최해, 학문적 교류에 앞장섰다는 데에 큰 의미가 있다.
-
- 작성일 2023-12-15
- 조회수 713
-
- [연구] 허재필 교수 연구실, AAAI 2024 논문 4편 게재 승인
- 허재필 교수 연구실, AAAI 2024 논문 4편 게재 승인 비주얼컴퓨팅연구실 (지도교수: 허재필)의 논문 4편이 인공지능 분야의 우수 학술대회인 AAAI Conference on Artificial Intelligence 2024 (AAAI-24)에 게재 승인되었습니다. 논문 #1: “Towards Squeezing-Averse Virtual Try-On via Sequential Deformation” (인공지능학과 박사과정 심상헌, 인공지능학과 석사과정 정지우) 논문 #2: "Noise-free Optimization in Early Training Steps for Image Super-Resolution" (인공지능학과 박사과정 이민규) 논문 #3: “VLCounter: Text-aware Visual Representation for Zero-Shot Object Counting” (인공지능학과 석사과정 강승구, 인공지능학과 박사과정 문원준, 인공지능학과 석사졸업 김의연) 논문 #4: “Task-disruptive Background Suppression for Few-Shot Segmentation” (소프트웨어학과/기계공학부 학사과정 박수호, 인공지능학과 박사과정 이수빈, 인공지능학과 박사과정 현상익, 인공지능학과 박사과정 성현석) "Towards Squeezing-Averse Virtual Try-On via Sequential Deformation" 논문에서는 고해상도 가상시착 영상생성 분야에서의 시각적 품질 저하 문제를 다루고 있습니다. 구체적으로, 그림 1(a)의 위쪽 행에서 볼 수 있듯이, 소매 부분에서 옷의 텍스쳐가 압착되는 문제가 있었습니다. 이 문제의 주요 원인은 해당 분야에서 필수적으로 사용되는 두 가지 손실 함수인 TV (Total Variation loss) 손실과 적대적 손실 (adversarial loss) 사이의 기울기 충돌 때문입니다. TV 손실은 와핑된 옷 마스크에서 소매와 몸통 사이의 경계를 분리하는 것을 목표로 하는 반면, 적대적 손실은 둘 사이의 결합을 목표로 합니다. 이러한 반대되는 목표는 잘못된 기울기를 계단식 외관 흐름 추정(Cascaded appearance flow estimation)으로 피드백하여 소매 압착 아티팩트를 발생시킵니다. 이를 해결하기 위해, 해당 논문에서는 네트워크의 레이어 간 연결의 관점으로 접근하였습니다. 구체적으로, 기존 계단식 외관 흐름 추정이 잔류 연결 (residual connection) 구조로 연결되어 적대적 손실 함수의 영향을 많이 받기 때문에 소매 압착이 발생한다고 진단하였고, 이를 줄이기 위해 계단식 외관 흐름 간의 순차적 연결 (sequential connection) 구조를 네트워크의 마지막 레이어에 도입하였습니다. 한편, 그림 1(a)의 아래쪽 행은 허리 주변의 다른 유형의 압착 아티팩트를 보여줍니다. 이를 해결하기 위해, 본 연구에서는 옷을 와핑할 때, 우선 내어 입는 스타일 (tucked-out shirts style)로 와핑한 후, 초기 와핑 결과에서 텍스쳐를 부분적으로 삭제할 것을 제안하고 이를 위한 연산을 구현하였습니다. 제안된 기술은 두 유형의 아티팩트를 성공적으로 해결하는 것을 확인하였습니다. “Noise-free Optimization in Early Training Steps for Image Super-Resolution” 논문에서는 이미지 초해상화 문제에서의 기존 학습 방법론과 지식 전이(Knowledge Distillation)의 한계점을 다루고 있습니다. 구체적으로, 하나의 고해상도 이미지를 두 개의 핵심 요소인 최적 평균(optimal centroid)과 잠재 노이즈(inherent noise)로 분리 및 분석했습니다. 이를 통해, 학습 데이터의 잠재 노이즈가 초반 학습의 불안정성을 유도하는 것을 확인했습니다. 해당 문제를 해결하기 위해, Mixup 기술과 기학습된 네트워크를 활용하여 학습 과정에서 잠재 노이즈를 제거하여 보다 안정적인 학습 기술을 제안했습니다. 제안된 기술은 Fidelity-oriented single image super-resolution 분야에서 여러 모델에 걸쳐 일관된 성능 향상을 가져오는것을 확인했습니다. "VLCounter: Text-aware Visual Representation for Zero-Shot Object Counting" 논문에서는 이미지에서 텍스트로 지정된 객체의 개수를 세는 문제를 다루고 있습니다. 해당 논문은 선행 연구의 two-stage 방법은 방대한 연산량과 에러 전파의 가능성이라는 문제를 제기하였습니다. 앞선 문제의 해결을 위해 one-stage baseline인 VLBase와 세 주요 기술로 확장된 VLCounter를 제안합니다. 첫째로, 기학습된 거대 모델인 CLIP을 재학습하는 대신 Visual Prompt Tuning(VPT)을 도입하였습니다. 추가로, VPT의 학습 가능한 토큰에 텍스트 정보를 추가하여 해당하는 개체가 강조된 이미지 피쳐를 얻게 합니다. 둘째로, 객체 영역의 전체가 아닌 중요한 부분만을 강조하는 유사도 맵을 얻기 위해 미세 조정이 이루어졌습니다. 이로써 모델은 객체 중심의 활성화를 높일 수 있습니다. 셋째로, 모델의 일반화 능력 향상과 정확한 객체 위치 파악을 위해 이미지 인코더 피쳐를 디코딩에 통합하고 앞선 유사도 맵을 피쳐에 곱하여 객체 영역에 집중합니다. 제안된 기술은 기존 방법의 성능을 크게 상회할 뿐만 아니라, 가벼운 모델로 학습 및 추론 속도를 2배 향상시켰습니다. “Task-disruptive Background Suppression for Few-shot Segmentation” 논문에서는 적은 수의 이미지(Support)와 마스크를 참고하여 새로운 이미지(Query)안의 물체를 찾아내는 few-shot segmentation문제에서 Support의 배경을 효율적으로 다루기 위한 방법을 다루고 있습니다. 기존 모델에서는 segmentation을 하기 위해서 Support와 Query를 비교하는데, 각각의 배경을 비교할 경우 다음과 같은 문제점이 있습니다. 첫번째로, Support와 Query의 배경이 많이 다를 경우 이는 모델이 segmentation을 하는데 방해가 될 수 있습니다. 두번째로, Support의 배경에 segmentation하고자 하는 물체와 비슷한 물체가 있는 경우도 방해가 될 수 있습니다. 따라서 본 논문은 방해가 될 수 있는 이 두 가지 배경의 요소를 Query-relevant score와 Target-relevant score를 통해 제거하였습니다. 따라서 결과적으로 Query의 배경과 관련된 Support의 배경만 남도록 하여 Support의 배경을 더욱 효율적으로 참고하도록 하였습니다. 제안된 방법은 여러 Few-shot Segmentation 모델에서 성능 향상이 있는 것을 확인했습니다. [논문 #1 정보] Towards Squeezing-Averse Virtual Try-On via Sequential Deformation Sang-Heon Shim, Jiwoo Chung, and Jae-Pil Heo Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI), 2024 Abstract: In this paper, we first investigate a visual quality degradation problem observed in recent high-resolution virtual try-on approach. The tendency is empirically found that the textures of clothes are squeezed at the sleeve, as visualized in the upper row of Fig.1(a). A main reason for the issue arises from a gradient conflict between two popular losses, the Total Variation (TV) and adversarial losses. Specifically, the TV loss aims to disconnect boundaries between the sleeve and torso in a warped clothing mask, whereas the adversarial loss aims to combine between them. Such contrary objectives feedback the misaligned gradients to a cascaded appearance flow estimation, resulting in undesirable squeezing artifacts. To reduce this, we propose a Sequential Deformation (SD-VITON) that disentangles the appearance flow prediction layers into TV objective-dominant (TVOB) layers and a task-coexistence (TACO) layer. Specifically, we coarsely fit the clothes onto a human body via the TVOB layers, and then keep on refining via the TACO layer. In addition, the bottom row of Fig.1(a) shows a different type of squeezing artifacts around the waist. To address it, we further propose that we first warp the clothes into a tucked-out shirts style, and then partially erase the texture from the warped clothes without hurting the smoothness of the appearance flows. Experimental results show that our SD-VITON successfully resolves both types of artifacts and outperforms the baseline methods. [논문 #2 정보] Noise-free Optimization in Early Training Steps for Image Super-Resolution MinKyu Lee and Jae-Pil Heo Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI), 2024 Abstract: Recent deep-learning-based single image super-resolution (SISR) methods have shown impressive performance whereas typical methods train their networks by minimizing the pixel-wise distance with respect to a given high-resolution (HR) image. However, despite the basic training scheme being the predominant choice, its use in the context of ill-posed inverse problems has not been thoroughly investigated. In this work, we aim to provide a better comprehension of the underlying constituent by decomposing target HR images into two subcomponents: (1) the optimal centroid which is the expectation over multiple potential HR images, and (2) the inherent noise defined as the residual between the HR image and the centroid. Our findings show that the current training scheme cannot capture the ill-posed nature of SISR and becomes vulnerable to the inherent noise term, especially during early training steps. To tackle this issue, we propose a novel optimization method that can effectively remove the inherent noise term in the early steps of vanilla training by estimating the optimal centroid and directly optimizing toward the estimation. Experimental results show that the proposed method can effectively enhance the stability of vanilla training, leading to overall performance gain. [논문 #3 정보] VLCounter: Text-aware Visual Representation for Zero-Shot Object Counting Seunggu Kang, WonJun Moon, Euiyeon Kim, and Jae-Pil Heo Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI), 2024 Abstract Zero-Shot Object Counting (ZSOC) aims to count referred instances of arbitrary classes in a query image without human-annotated exemplars. To deal with ZSOC, preceding studies proposed a two-stage pipeline: discovering exemplars and counting. However, there remains a challenge of vulnerability to error propagation of the sequentially designed two-stage process. In this work, we propose an one-stage baseline, Visual-Language Baseline (VLBase), exploring the implicit association of the semantic-patch embeddings of CLIP. Subsequently, we extend the VLBase to Visual-language Counter (VLCounter) by incorporating three modules devised to tailor VLBase for object counting. First, we introduce Semantic-conditioned Prompt Tuning (SPT) within the image encoder to acquire target-highlighted representations. Second, Learnable Affine Transformation (LAT) is employed to translate the semantic-patch similarity map to be appropriate for the counting task. Lastly, we transfer the layer-wisely encoded features to the decoder through Segment-aware Skip Connection (SaSC) to keep the generalization capability for unseen classes. Through extensive experiments on FSC147, CARPK, and PUCPR+, we demonstrate the benefits of our end-to-end framework, VLCounter. [논문 #4 정보] Task-disruptive Background Suppression for Few-Shot Segmentation Suho Park, SuBeen Lee, Sangeek Hyun, Hyun Seok Seong, and Jae-Pil Heo Thirty-Eighth AAAI Conference on Artificial Intelligence (AAAI), 2024 Abstract Few-shot segmentation aims to accurately segment novel target objects within query images using only a limited number of annotated support images. The recent works exploit support background as well as its foreground to precisely compute the dense correlations between query and support. However, they overlook the characteristics of the background that generally contains various types of objects. In this paper, we highlight this characteristic of background which can bring problematic cases as follows: (1) when the query and support backgrounds are dissimilar and (2) when objects in the support background are similar to the target object in the query. Without any consideration of the above cases, adopting the entire support background leads to a misprediction of the query foreground as background. To address this issue, we propose Task-disruptive Background Suppression (TBS), a module to suppress those disruptive support background features based on two spatial-wise scores: query-relevant and target-relevant scores. The former aims to mitigate the impact of unshared features solely existing in the support background, while the latter is to reduce the influence of target-similar support background features. Based on these two scores, we define a query background relevant score which captures the similarity between the backgrounds of the query and the support, and utilize it to scale support background features to adaptively restrict the impact of disruptive support backgrounds. Our proposed method achieves state-of-the-art performance on PASCAL and COCO datasets on 1-shot segmentation.
-
- 작성일 2023-12-15
- 조회수 1071
-
- [연구] 우홍욱 교수 연구실(CSI연구실), AAAI 2024 논문 게재 승인 (3편)
- CSI연구실 (지도교수: 우홍욱)의 논문 3편이 인공지능 분야 우수학회인 AAAI 2024 (The 38th Annual AAAI Conference on Artificial Intelligence) 에 게재 승인(Accept) 되었습니다. 이번 논문은 24년 2월 캐나다 밴쿠버에서 발표될 예정입니다. 1. 논문 “SemTra: A Semantic Skill Translator for Cross-domain Zero-shot Policy Adaptation” 은 소프트웨어학과 신상우 (석사과정), 유민종 (박사과정), 이정우 (학부과정) 연구원이 저자로 참여했습니다. 본 연구는 로봇과 같은 체화형 에이전트 (Embodied Agent)가 주위 환경 변화에 추가 학습 없이 빠르게 대응할 수 있는 Zero-Shot 적응 기술에 관한 것으로, 비전, 센서, 사용자 명령어 등 멀티모달 데이터를 의미론적으로 해석 가능한 스킬 (Sematic Skill)로 변환하고, 이러한 스킬을 환경에 최적화하여 연속된 액션으로 실행하는 SemTra (Semantic Skill Translator) 프레임워크를 제시합니다. SemTra는 암묵적 행동 패턴을 사전 훈련된 언어모델을 통해 실행가능한 스킬(Skill, 연속된 행동 패턴)로 변환하는 연구 결과로, Meta-World, Franka Kitchen, RLBench, CARLA와 같은 로봇과 자율주행 환경에서 테스트되어 높은 성능을 보였습니다. 2. 논문 “Risk-Conditioned Reinforcement Learning: A Generalized Approach for Adapting to Varying Risk Measures” 은 소프트웨어학과 유광표 (박사과정)와 인공지능학과 박진우 (석사과정) 연구원이 저자로 참여했습니다. 본 연구는 금융, 로봇, 자율주행 등 위험이 내포된 중요한 의사결정이 요구되는 응용 분야에서 사용될 수 있는 위험 조건형 강화학습 모델 (Risk Conditioned Reinforcement Learning)을 제안합니다. 특히, 하나의 학습된 강화학습 모델을 통해 동적으로 변경되는 다양한 선호 리스크 수준에 대응할 수 있도록, 최초로 이종 리스크 측정 지표에 대한 단일한 표현이 가능한 Weighted Value-at-Risk (WV@R) 기반의 강화학습 모델 구조를 구현하며, 이를 통해 리스크 관리에 중점을 두는 여러 응용 분야에서 강화학습 기반의 의사 결정을 유연하게 처리합니다. 3. 논문 “Robust Policy Learning via Offline Skill Diffusion” 은 소프트웨어학과 김우경 (박사과정), 유민종 (박사과정) 연구원이 저자로 참여했습니다. 본 연구에서는 Diffusion 모델을 사용하여 데이터셋의 한정된 스킬에서 확장된 다양한 체화형 에이전트 스킬 (Embodied Agent Skill)을 생성하는 새로운 오프라인 학습 프레임워크인 DuSkill (Offline Skill Diffusion Model)을 제시합니다. DuSkill 프레임워크는 오프라인에서 학습된 스킬의 다양성을 증진시켜, 다중 태스크와 이종 환경 도메인에 대한 정책 학습 (RL Policy Learning) 절차를 가속화하고, 학습된 정책의 강건성을 향상합니다. CSI 연구실은 머신러닝, 강화학습, 자기지도학습을 활용하여 네트워크, 클라우드 시스템 최적화 연구와 로봇, 드론 자율주행 등 Embodied Agent 분야 연구를 수행하고 있습니다. 이번 AAAI 2024 논문의 연구는 사람중심인공지능 핵심원천기술사업 (IITP), 한국연구재단 개인기초사업 (NRF), 인공지능대학원의 지원으로 진행 중 입니다. 우홍욱 | hwoo@skku.edu | CSI Lab | https://sites.google.com/view/csi-agent-group
-
- 작성일 2023-12-12
- 조회수 1073
-
- [연구] 이진규 교수 연구실(실시간 컴퓨팅 연구실, RTCL@SKKU) IEEE RTSS 2023 논문 발표
- 실시간 컴퓨팅 연구실(지도교수: 이진규)에서 작성한 논문이 IEEE RTSS 2023 (the 44th IEEE Real-Time Systems Symposium)에 발표되었습니다. IEEE RTSS는 매년 30편 내외의 논문만이 발표되는 실시간 시스템 분야의 Top1 국제 학술대회(BK21+ IF4)이며, 올해는 대만 타이페이에서 2023년 12월 5일~8일 총 32편의 논문이 발표되었습니다. 해당 논문은 실시간 시스템 분야에서의 최초의 Blockchain 논문이며, 실시간 컴퓨팅 연구실의 박사과정 이승훈 학생(제1저자), 석사과정 강석민, 조승연 학생, 학부과정 구현우 학생이 이진규 교수의 지도하에 참여하였고, 소프트웨어학과 황성재 교수님과의 공동연구로 진행되었습니다. 이로써 이진규 교수는 2012년부터 2023년까지 12년 연속 IEEE RTSS에 논문을 게재하는 업적을 이루었습니다(12년간 주저자 14편, 공저자 5편) IEEE RTSS 2023 홈페이지 http://2023.rtss.org/ 실시간 컴퓨팅 연구실 홈페이지 https://rtclskku.github.io/website/ - 논문제목: RT-Blockchain: Achieving Time-Predictable Transactions - 연구주제: Blockchain transaction들의 타이밍 보장을 위한 scheduling framework 개발 - Abstract: Although blockchain technology is being increasingly utilized across various fields, the challenge of providing timing guarantees for transactions remains unmet, which is an obstacle in implementing blockchain solutions for time-sensitive applications such as high-frequency trading and real-time payments. In this paper, we propose the first solution to achieve a timing guarantee on blockchain. To this end, we raise and address two issues for timely transactions on a blockchain: (a) architectural support, and (b) real-time scheduling principles spe- cialized for blockchain. For (a), we modify an existing blockchain network, offering an interface to preferentially select the transactions with the earliest deadlines. We then extend the blockchain network to provide the flexibility of the number of generated blocks at a single block time. Under such architectural supports, we achieve (b) with three steps. First, to resolve a discrepancy between a periodic request of a transaction-generating node and the corresponding arrival on a block-generating node, we translate the former into the latter, which eases the modeling of the transaction load imposed on the blockchain network. Second, we derive a schedulability condition of the modeled transaction load, which guarantees no missed deadline for all transactions under a work-conserving deadline-based scheduling policy. Last, we develop a lazy scheduling policy and its condition, which reduces the number of generated blocks without compromising the degree of timing guarantees for the work-conserving policy. By implementing RT-blockchain on top of an existing open- source blockchain project, we demonstrate the effectiveness of the proposed scheduling principles with architectural supports in not only ensuring timely transactions but also reducing the number of generating blocks. 이진규 | jinkyu.lee@skku.edu | 실시간컴퓨팅 Lab. | https://rtclskku.github.io/website/
-
- 작성일 2023-12-11
- 조회수 1092
-
- [연구] 이호준교수 연구실, 학술대회 (USENIX SEC) 게재승인 소식
- 시스템보안 연구실 (지도교수 이호준, https://sslab.skku.edu)의 조규원(박사과정), 김종윤(박사과정), Dinh Duy Kha(박사과정), 임하정(박사과정) 의 "RustSan: Retrofitting AddressSanitizer for Efficient Sanitization of Rust" 논문이 보안분야 4대 학회 중 하나인 USENIX Security Symposium 2024에 게재 승인되어 2024년 8월에 발표될 예정입니다. 오늘날 Rust는 C/C++과 비슷한 성능을 가지면서도 안전한 시스템 프로그래밍 언어로 주목받고 있습니다. 그러나 unsafe Rust라는 기능의 존재와 이를 활용하는 많은 프로그램들로 인하여 아직 여전히 메모리 버그가 발생할 수 있기에, 따라서 퍼징과 같은 소프트웨어 테스팅 기법들이 여전히 필요합니다. 본 논문에서는 메모리 버그 탐지의 state-of-the-art 기술인 Address Sanitizer(ASan)가 C/C++에 초점을 맞추어 설계되어 있고, Rust의 특징을 전혀 반영하지 못하여 불필요한 높은 성능 오버헤드가 발생한다는 문제점을 설명합니다. 이 논문에서는 Rust의 특징들을 반영해 표준 탐지기술인 ASan을 최적화하고 불필요한 오버헤드를 제거하는 RustSan이라는 소프트웨어 메모리 오류 탐지기술 (Sanitizer)을 제시합니다. RustSan은 이를 위하여 Rust 코드의 더 정확한 분석을 위해 Rust MIR/HIR과 LLVM IR 병행을 분석하는 Cross-IR Analysis를 도입했으며, ASan의 shadow memory scheme의 binary한 탐지 기능을 확장하여, Rust에 적합한 tri-state 탐지 기능을 도입했습니다. RustSan은 총 57개의 Rust 프로그램들에 대하여 탐지 능력과 런타임 성능을 검증하였습니다. 테스트된 31개의 CVE부여 취약점을 모두 성능저하를 획기적으로 줄이면서 탐지하는데 성공하였고, 성능은 기존 표준기술 ASan대비 일반 프로그램 벤치마크 20종에서 평균 63.3%, Fuzzing 벤치마크에서 평균 23.52%/최고 57.08%의 성능향상을 보여주었습니다. RustSan은 최초의 Rust언어특화 메모리 오류 탐지기술로, 앞으로 Rust프로그램의 메모리 오류 검출을 훨씬 효율적으로 할수 있는 방향을 제시하였습니다. 영문 Abstract: Rust is gaining traction as a safe systems programming language with its strong type and memory safety guarantees. However, Rust’s guarantees are not infallible. The use of unsafe Rust, a subvariant of Rust, allows the programmer to temporarily escape the strict Rust language semantics to trade security for flexibility. Memory errors within unsafe blocks in Rust have far-reaching ramifications for the program’s safety. As a result, the conventional dynamic memory error detection (e.g., fuzzing) has been adapted as a common practice for Rust and proved its effectiveness through a trophy case ofdiscovered CVEs. RustSan is a retrofitted design of AddressSanitizer(ASan) for efficient dynamic memory error detection of Rust programs. Our observation is that a significant portion of instrumented memory access sites in a Rust program compiled with ASan is redundant, as the Rust security guarantees can still be valid at the site. RustSan identifies and instruments the sites that definitely or may undermine Rust security guarantees while lifting instrumentation on safe sites. To this end, RustSan employs a cross-IR program analysis for accurate tracking of unsafe sites and also extends ASan’s shadow memory scheme for checking non-uniform memory access validation necessary for Rust. We conduct a comprehensive evaluation of RustSan in terms of detection capability and performance using 57 Rust crates. RustSan successfully detected all 31 tested cases of CVE-issued memory errors. Also, RustSan shows an average of 62.3% performance increase against ASan in general benchmarks that involved 20 Rust crates. In the fuzzing experiment with 6 crates, RustSan marked an average of 23.52%, and up to 57.08% of performance improvement.
-
- 작성일 2023-12-11
- 조회수 838