-
- [연구] 허재필 교수 연구실, CVPR 2022 논문 2편 게재 승인
- 비주얼컴퓨팅연구실(지도교수: 허재필)의 논문 2편이 컴퓨터 비전 및 인공지능 분야의 Top-tier 학술대회인 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2022에 게재 승인되었습니다. 논문 #1: “Local Attention Pyramid for Scene Image Generation” (인공지능학과 박사과정 심상헌, 인공지능학과 박사과정 현상익, 인공지능학과 박사과정 배대현) 논문 #2: “Task Discrepancy Maximization for Fine-grained Few-Shot Classification” (인공지능학과 석사과정 이수빈, 인공지능학과 석사과정 문원준) “Local Attention Pyramid for Scene Image Generation” 에서는 장면 영상 생성(scene image generation)에서 물체 별 품질 불균형 문제(class-wise visual quality imbalance issue)가 발생한다는 것을 확인하였으며, 이를 완화하기 위해서 새로운 네트워크 모듈을 제안하였습니다. 제안하는 모듈은 장면 영상의 특징인 여러 물체가 전체 영상에 산재해 있다는 점에 착안하여, 생성모델이 여러 로컬 영역들(local regions)에 높은 주의 점수(attention score)를 계산하도록 설계하였습니다. 본 연구에서는 제안된 기법을 이미지 생성분야의 여러 선행 연구들에 적용하였으며, 일관되게 이미지 생성 품질이 향상됨을 확인하였습니다. “Task Discrepancy Maximization for Fine-grained Few-Shot Classification” 에서는 Fine-grained few-shot classification의 성능향상을 위한 모듈(Task Discrepancy Maximization, TDM)을 제시하였습니다. Few-shot classification은 기존에 학습하지 않았던 카테고리를 적은 수의 라벨링 데이터로 학습하는 분야입니다. 제안하는 모듈은 라벨링 된 데이터(Support-set)을 이용하여 각 카테고리별 차별적인 특징을 예측하고 강조하는 서브모듈(Support Attention Module, SAM)과 분류해야 하는 데이터(Query-set)을 이용하여 분류 대상과 관련 있는 특징을 강조하는 서브모듈(Query Attention Module, QAM)로 구성되어 있습니다. 제안된 모듈은 기존 방법들의 성능을 모두 향상시켰으며 Fine-grained few-shot classification 분야에서 가장 높은 성능을 달성하였습니다. [논문 #1 정보] Local Attention Pyramid for Scene Image Generation Sang-Heon Shim, Sangeek Hyun, DaeHyun Bae, and Jae-Pil Heo IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2022 Abstract: In this paper, we first investigate the class-wise visual quality imbalance problem of scene images generated by GANs. The tendency is empirically found that the class-wise visual qualities are highly correlated with the dominance of object classes in the training data in terms of their scales and appearance frequencies. Specifically, the synthesized qualities of small and less frequent object classes tend to be low. To address this, we propose a novel attention module, Local Attention Pyramid (LAP) module tailored for scene image synthesis, that encourages GANs to generate diverse object classes in a high quality by explicit spread of high attention scores to local regions, since objects in scene images are scattered over the entire images. Moreover, our LAP assigns attention scores in a multiple scale to reflect the scale diversity of various objects. The experimental evaluations on three different datasets show consistent improvements in Frechet Inception Distance (FID) and Frechet Segmentation Distance (FSD) over the state-of-the-art baselines. Furthermore, we apply our LAP module to various GANs methods to demonstrate a wide applicability of our LAP module. [논문 #2 정보] Task Discrepancy Maximization for Fine-grained Few-Shot Classification SuBeen Lee, WonJun Moon, and Jae-Pil Heo IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2022 [Oral presentation] Abstract: Recognizing discriminative details such as eyes and beaks is important for distinguishing fine-grained classes since they have similar overall appearances. In this regard, we introduce Task Discrepancy Maximization (TDM), a simple module for fine-grained few-shot classification. Our objective is to localize the class-wise discriminative regions by highlighting channels encoding distinct information of the class. Specifically, TDM learns task-specific channel weights based on two novel components: Support Attention Module (SAM) and Query Attention Module (QAM). SAM produces a support weight to represent channel-wise discriminative power for each class. Still, since the SAM is basically only based on the labeled support sets, it can be vulnerable to bias toward such support set. Therefore, we propose QAM which complements SAM by yielding a query weight that grants more weight to object-relevant channels for a given query image. By combining these two weights, a class-wise task-specific channel weight is defined. The weights are then applied to produce task-adaptive feature maps more focusing on the discriminative details. Our experiments validate the effectiveness of TDM and its complementary benefits with prior methods in fine-grained few-shot classification.
-
- 작성일 2022-03-31
- 조회수 1409
-
- [연구] 이상원 교수 연구실 (안미진 석박통합과정 학생), SIGMOD 2022 국제학술대회 논문 게재 승인
- VLDB 연구실(지도교수: 이상원)의 안미진(소프트웨어플랫폼학과 석박과정)의 “Avoiding Read Stalls on Flash Storage” 논문이 ACM International Conference on Management of Data (SIGMOD) 2022에 게재 승인되었습니다. SIGMOD은 데이터베이스 분야의 Top-tier 학술대회이며, 2022년에는 미국 필라델피아에서 개최됩니다. 본 연구에서는 버퍼 관리자와 플래시 저장장치 간의 새로운 I/O 아키텍처로 Write-After-Read (WAR) 프로토콜을 제안합니다. 페이지 miss 시 사용 가능한 버퍼 프레임이 없을 때, WAR는 LRU tail의 dirty 페이지를 별도의 DRAM 공간으로 일시적으로 복사하고 miss 페이지를 stall 없이 저장장치에서 읽어옵니다. 복사된 dirty 페이지들은 저장장치에 비동기적으로 write 됩니다. 이러한 방식으로 read/write 간 리소스 충돌을 해결하고 read stall을 방지함으로써, WAR 프로토콜 기반의 DBMS 엔진은 더 많은 read 및 write I/O를 병렬로 실행하여 CPU와 저장장치의 성능을 잘 활용할 수 있습니다. 결과적으로 WAR는 기존 대비 트랜잭션 처리량을 2.9배까지 증가시키고, 트랜잭션 응답 시간을 70%까지 감소시킵니다.
-
- 작성일 2022-03-10
- 조회수 1296
-
- [연구] 이지형 교수 연구실 (김누리 석박통합과정 학생), CVPR 2022 국제학술대회 논문 게재 승인
- 정보 및 지능 시스템 연구실(지도교수: 이지형)의 김누리(전자전기컴퓨터공학과 석박과정)의 “Propagation Regularizer for Semi-supervised Learning with Extremely Scarce Labeled Samples” 논문이 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2022에 게재 승인되었습니다. CVPR은 컴퓨터 비전 및 인공지능 분야의 Top-tier 학술대회이며, 2022년에는 미국 뉴올리언스에서 개최됩니다. 본 연구에서는 기존 준지도 학습(Semi-Supervised Learning, SSL)에서 레이블 데이터가 클래스 당 1~2개밖에 없는 상황에서 성능 향상을 위한 Regularization 방법과 모델 선택 방법을 제안합니다. 레이블 데이터가 매우 부족한 상황에서 SSL은 학습 과정에서 확증 편향(Confirmation bias) 문제가 심각하게 나타난다는 것을 확인했으며, 이를 완화하기 위해서 언레이블 데이터에 대한 pseudo-label의 엔트로피를 최대화하는 Regularization을 제안합니다. 또한 레이블 데이터가 매우 부족한 상황에서 SSL은 확증 편향으로 인하여 학습 과정이 매우 불안정함을 확인했으며, 이러한 상황에서 검증 데이터를 추가로 활용하지 않고 최적의 모델을 선택하기 위한 방법을 제안합니다. 제안된 Regularization 방법과 모델 선택 방법을 통해 CIFAR-10, CIFAR-100, SVHN 데이터에서 기존 방식 대비 8.9%에서 120.2%까지 향상된 성능을 달성하였습니다
-
- 작성일 2022-03-10
- 조회수 1238
-
- [연구] 고영중 교수 자연어처리연구실, DSTC10 Track 3 우승
- 자연어처리연구실 손동철 석사과정(소프트웨어학과), 장영재 학부연구생이 Dialogue System Track Challenge 10(DSTC10)의 Track 3 SIMMC 2.0: Situated Interactive Multimodal Conversational AI에 참가하여 Sub-task#1 Multimodal Disambiguation과 Sub-task#3 Multimodal Dialog State Tracking에서 1위를 차지했습니다. 자연어처리 연구실은 Track 3 이외에도 Track 2 Knowledge-grounded Task-oriented Dialogue Modeling on Spoken Conversations의 두 sub-track에 참가하여 각각 5위와 4위를 차지했습니다. DSTC는 2013년 대화 상태 추적(Dialogue state tracking) task를 해결하는 대회로 시작했고, 2016년 대화시스템으로 그 대상을 확장하여 2021년 10번째 대회가 개최되었습니다. 1위를 차지한 Track 3는 이미지와 텍스트 대화 데이터를 모두 활용하여 대화시스템을 구축하는 task로 4개의 sub-task들로 이루어져 있습니다. 1위를 차지한 첫 번째 sub-task는 사용자 발화의 모호함을 판별하는 task이고, 세 번째 sub-task는 사용자가 원하는 상품에 대한 조건을 추적하는 task입니다. Track 2는 지식 정보를 활용한 대화시스템을 구축하는 task를 해결하는 track으로 대화를 추적하는 sub-track 1(Dialogue State Tracking)과 사용자 발화에 대해 지식 정보를 포함한 응답을 생성하는 sub-track 2(Task-oriented Conversational Modeling with Unstructured Knowledge Access)로 이루어져 있습니다. DSTC10은 AAAI 2022 학술대회의 Workshop에서 논문이 발표된다.
-
- 작성일 2022-02-23
- 조회수 1165
-
- [연구] 우사이먼성일 교수 연구실(DASH Lab)의 The Web Conference (WWW) 논문 2편 게재 승인
- Data-driven AI Security HCI(DASH Lab) 연구실 학생 1) 이상엽 (소프트웨어학과 석박과정 연구원), 안재주 (소프트웨어학과 융합보안트랙 석사과정 연구원)과 우사이먼성일 (교신저자)의 논문 “BZNet: Unsupervised Multi-scale Branch Zooming Network for Detecting Low-quality Deepfake Videos”과 2)소프트웨어학과 Shahroz Tariq (소프트웨어학과 박사과정 연구원), 전소원 학생(소프트웨어학과 석사과정 연구원), 우사이먼성일 교수(교신저자)의 “Am I a Real or Fake Celebrity? Evaluating Face Recognition and Verification APIs under Deepfake Impersonation Attack” 논문 2편이 웹/데이터 마이닝 분야 최우수 학회The Web Conference (WWW) 2022 ( https://www2022.thewebconf.org/) (BK IF=4)에 게재 승인되었고, 2022년 4월 프랑스 리옹/온라인으로 발표될 예정입니다. 논문1. “BZNet: Unsupervised Multi-scale Branch Zooming Network for Detecting Low-quality Deepfake Videos” 특정 대상을 모방하는 딥페이크 생성 기법의 발전으로 사회는 가짜 뉴스나 잘못된 정보 전파에 취약해졌지만 최근 활발한 연구를 통해 다양한 딥페이크 탐지 기법들이 연구되었습니다. 하지만, 최근 SNS나 웹에 실제 배포되는 딥페이크 동영상은 저장공간 확보를 위해 저화질 비디오로 압축되어 기존의 탐지 기법의 성능을 저하시킵니다. 이를 해결하기 위해 본 연구에서는 Unsupervised Super-resolution (SR) 기법과 multi-scale 이미지를 동시에 학습하는 모델인 Branch Zooming Network (BZNet)을 개발하여 저화질 딥페이크 동영상을 탐지하였습니다. 탐지 모델 학습 시 학습용 고화질 딥페이크 동영상을 사용하지 않고 저화질 동영상만을 사용했다는 점에서 새로운 유형의 딥페이크의 저화질 배포 동영상만 존재하는 현실이 잘 반영되었다고 평가됩니다. 세부적으로, 본 논문에서는 저화질 딥페이크 탐지모델 BZNet을 두 단계로 나누어 학습을 진행합니다. 첫번째 단계는 주어진 저화질 딥페이크 이미지의 퀄리티를 N개의 고화질 이미지 크기로 높여주는 Unsupervised SR N개 모듈들을 학습합니다. 두번째 단계에서는 학습된 모듈을 활용하여 생성한 각기 다른 N개 이미지들을 활용하여 CNN기반 모델을 학습합니다. 이때, 여러 화질 이미지를 화질별로 나누어 학습하는 것이 아닌, 한 모델에 동시 입력으로 사용하여 학습하는 방법을 제안하였습니다. 저화질 딥페이크 영상을 다양한 화질의 이미지로 변환 후 multi-scale 학습법을 통해 저화질 딥페이크의 화질 변화 특징 추출 능력을 극대화할 수 있었고, 최신 탐지 모델과 비교하여 그 중 가장 높은 성능을 낼 수 있었습니다. 뿐만 아니라, 기존의 CNN기반 모델에 본 연구에서 개발한 Branch Zooming Module을 적용하여 저화질 이미지에 대한 분류 성능을 높임으로써, 이후 저화질 이미지 분류 문제 해결에 대한 가능성을 보였습니다 논문2. “Am I a Real or Fake Celebrity? Evaluating Face Recognition and Verification APIs under Deepfake Impersonation Attack” 본 연구에서는 딥페이크를 활용한 사칭 공격 (Deepfake Impersonation Attack)에 대한 얼굴 인식 API 와 오픈소스 툴들의 취약성을 시험합니다. 마이크로소프트, 아마존, 네이버 등에서 제공하는 영리 목적의 얼굴 인식 웹 서비스는 높은 정확도를 자랑하며, 다양한 멀티미디어 어플리케이션에 활용되고 있으나, 이러한 얼굴 인식 웹 서비스는 정교한 ‘딥페이크’ 기술의 발전으로 자연스레 누구나 빠르게 사칭 공격을 수행 가능한 환경에 노출되었습니다. 이에 본 연구에서는, 얼굴 인식 웹 서비스와 오픈소스 툴 중에서도 ‘유명인 얼굴 인식’ 서비스를 대상으로 딥페이크 사칭 공격을 수행한 결과, Targeted Attack (TA)의 경우 78.0%의 높은 공격 성공률을 보였습니다. 또한 본 연구에서는 적대적 훈련 기법을 사용하여 Targeted Attack 공격 성공률을 1.26%까지 감소시키는 딥페이크 사칭 공격 완화 전략을 제안하였습니다.
-
- 작성일 2022-02-03
- 조회수 1136
-
- [연구] 소프트웨어학과 이종욱 교수 한국정보과학회 “젊은 과학자상” 수상
- 한국정보과학회는 강원도 평창에서 열린 올해 한국소프트웨어 종합학술대회에서 “6회 젊은 과학자상” 수상자로 성균관대 소프트웨어학과 이종욱 교수를 선정하였다. “젊은 과학자상”은 정보과학 발전에 공로가 인정되고 연구 개발 실적이 뛰어나며 발전 잠재력이 우수한 만40세 이하의 연구자에게 IEEE-CS와 공동으로 수여하는 상이다. 이종욱 교수는 데이터마이닝, 데이터베이스 및 인공지능 분야에서 우수한 학술 업적을 높이 평가받아 수상자로 선정되었다. 한국정보과학회는 1973년 설립되었으며, 현재 일반회원 39,000여명, 특별회원 156기관, 단체회원 278개 기관이 등록되었으며, 컴퓨터 분야에서 국내 최대 규모의 학회이다.
-
- 작성일 2022-01-05
- 조회수 1167
-
- [연구] 우사이먼교수 (DASH) 연구실, 인공지능 그랜드 챌린지 2년 연속 수상 (1, 2, 3단계)
- 데이터 기반 융합 보안 연구실(DASH LAB, 지도교수: 우사이먼성일, 소프트웨어학과/융합보안트랙 안재주 석사과정, 인공지능학과 이한빈, 김정호, 김진범 석사과정)은 과학기술정보통신부가 주최하고 정보통신기획평가원이 주관하는 2021 인공지능 그랜드 챌린지 4차 3단계 대회 Track 1(행동인지)에서 1위를 수상하여 2년 연속 수상이라는 쾌거를 달성하였다. 인공지능 그랜드 챌린지 대회는 제시된 문제를 해결하기 위해 참가자들이 개발한 알고리즘을 가지고 실력을 겨루는 도전·경쟁형 연구개발(R&D) 경진대회이다. 이번 4차 3단계 대회는 ‘인공지능 기술을 활용하여 빠르고 정확하게 도움이 필요한 사람을 탐지하라’는 주제로 작년 11월 12일부터 동월 14일까지 온라인으로 진행되었다. 지난 2020년에 개최된 1단계 및 2단계 대회에서도 각각 1위, 3위의 성적을 거둔 데 이어 금번 대회에서도 1위의 성적을 거둬 과학기술정보통신부 장관상을 수상하였다. 본 대회에서는 제한된 컴퓨팅 파워에서 빠르고 정확하게 이상 행동을 보이는 사람을 탐지하는 것을 목표로 한다. 속도와 성능의 트레이드-오프를 극복하기 위해 본 연구실에서는 강력한 후처리 알고리즘을 사용하여 큰 모델로도 실시간 처리를 가능하도록 하였다. 더불어 최근 본 연구실에서 NeurIPS 2021 Datasets & Benchmarks Track에 발표한 VFP290K 데이터셋을 활용하여(VFP290K: A Large-Scale Benchmark Dataset for Vision-based Fallen Person Detection | OpenReview) 훈련된 모델은 본 챌린지에서도 뛰어난 성능을 보였다. 한편, DASH 연구실은 세계 최고 권위의 인공지능 학회인 AAAI, ICML, KDD, NeuralPS, WWW 및 CIKM 등에 논문이 게재되어 우수한 연구 성과를 지속해서 만들어내고 있다. 출처: http://www.aitimes.com/news/articleView.html?idxno=141936 https://www.yna.co.kr/view/AKR20211208151200017?input=1195m
-
- 작성일 2022-01-05
- 조회수 1087
-
- [연구] 이진규 교수, IEEE RTSS에 10년 연속 논문 게재
- 이진규 교수는 지난 12월 7일~12월 10일에 열린 IEEE RTSS (Real-Time Systems Symposium)에 아래의 논문을 교신저자로 게재 하였습니다. IEEE RTSS는 매년 30여편의 논문만이 발표되는 실시간 시스템 분야 Top 1 국제학술대회이며, 이진규 교수는 이로써 2012년부터 2021년 까지 10년 연속 IEEE RTSS에 논문을 게재하는 업적을 이루었습니다. (10년간 주저자 10편, 공저자 5편) http://2021.rtss.org/ [논문정보] - LaLaRAND: Flexible Layer-by-Layer CPU/GPU Scheduling for Real-Time DNN Task - Woosung Kang, Kilho Lee, Jinkyu Lee, Insik Shin and Hoon Sung Chwa - Deep neural networks (DNNs) have shown remarkable success in various machine-learning (ML) tasks useful for many safety-critical, real-time embedded systems. The foremost design goal for enabling DNN execution on real-time embedded systems is to provide worst-case timing guarantees with limited computing resources. Yet, the state-of-the-art ML frameworks hardly leverage heterogeneous computing resources (i.e., CPU, GPU) to improve the schedulability of real-time DNN tasks due to several factors, which include a coarse-grained resource allocation model (one-resource-per-task), the asymmetric nature of DNN execution on CPU and GPU, and lack of schedulabilityaware CPU/GPU allocation scheme. This paper presents, to the best of our knowledge, the first study of addressing the above three major barriers and examining their cooperative effect on schedulability improvement. In this paper, we propose LaLaRAND, a real-time layer-level DNN scheduling framework, that enables flexible CPU/GPU scheduling of individual DNN layers by tightly coupling CPU-friendly quantization with fine-grained CPU/GPU allocation schemes (one-resource-per-layer) while mitigating accuracy loss without compromising timing guarantees. We have implemented and evaluated LaLaRAND on top of the state-of-theart ML framework to demonstrate its effectiveness in making more DNN task sets schedulable by 56% and 80% over an existing approach and a baseline (vanilla PyTorch), respectively, with only up to -0.4% of performance (inference accuracy) difference.
-
- 작성일 2021-12-13
- 조회수 1206
-
- [연구] 차수영 교수, ICSE 2022 논문 게재 승인
- 소프트웨어학과 차수영 교수(제1저자)의 논문이 소프트웨어 공학 분야의 최상위 국제 학술대회인 ICSE 2022 (The 44th International Conference on Software Engineering)에 게재 승인되었습니다. 본 논문 “SymTuner: Maximizing the Power of Symbolic Execution by Adaptively Tuning External Parameters”은 2022년 5월 미국 피츠버그에서 발표될 예정입니다. 본 논문의 목표는 기호 실행(Symbolic Execution) 도구들의 수많은 외부 파라미터들을 사람의 개입 없이 자동으로 조정하는 것입니다. 이 목표를 달성하기 위해, 본 논문은 기호 실행기의 행동을 관찰하고 파라미터 값의 샘플링 확률을 적절히 업데이트해주는 학습 알고리즘을 제안했습니다. 그 결과, 본 연구는 최신 오픈-소스 C 프로젝트들에서 기존 기술들보다 더 높은 코드 커버리지와 많은 오류들을 검출하는데 성공했습니다. [논문 정보] - “SymTuner: Maximizing the Power of Symbolic Execution by Adaptively Tuning External Parameters” - Sooyoung Cha, Myungho Lee, Seokhyun Lee, and Hakjoo Oh - The 44th International Conference on Software Engineering (ICSE 2022) - Abstract: We present SymTuner, a novel technique to automatically tune external parameters of symbolic execution. Practical symbolic execution tools have important external parameters (e.g., symbolic arguments, seed input) that critically affect their performance. Due to the huge parameter space, however, manually customizing those parameters is notoriously difficult even for experts. As a consequence, symbolic execution tools have typically been used in a suboptimal manner that, for example, simply relies on the default parameter settings of the tools and loses the opportunity for better performance. In this paper, we aim to change this situation by automatically configuring symbolic execution parameters. With SymTuner that takes parameter spaces to be tuned, symbolic executors are run without manual parameter configurations; instead, appropriate parameter values are learned and adjusted during symbolic execution. To achieve this, we present a learning algorithm that observes the behavior of symbolic execution and accordingly updates the sampling probability of each parameter space. We evaluated SymTuner with KLEE on 12 open-source C programs. The results show that SymTuner increases branch coverage of KLEE by 55% on average and finds 8 more bugs than KLEE with its default parameters over the latest releases of the programs. 차수영 | sooyoung.cha@skku.edu | 소프트웨어 분석 연구실 | http://sal.skku.edu/
-
- 작성일 2021-12-08
- 조회수 1343