-
- [일반] 역사와 전통, 창조와 혁신이 어우러진‘성대다움’의 공간, 성균관대 SW중심대학사업단, 솦ː콤 개소 NEW
- 성균관대학교(총장 유지범)는 28일 자연과학캠퍼스 삼성학술정보관에서 SW중심대학사업단(이은석단장, 소프트웨어융합대학장 겸) 사업공간 이전에 따른 소프트웨어콤플렉스(Software Complex, 이하 솦ː콤) 현판 제막식 및 개소식을 가졌다고 밝혔다. 개소식이 진행된 솦:콤존(zone)은 성균관대학교의 자연과학캠퍼스와 인문사회과학캠퍼스를 아우르는 SWㆍAI 인력양성을 위한 SW중심대학 첨단공간으로 총 1,206.4㎡ 면적에 학생들의 연구개발 능력 함양을 위한 솦ː공방 인의예지(仁義禮智) 세미나실과 솦ː공방 격물치지(格物致知) 프로그램 전용실 등 탄력적 공간으로 구성되었다. 이번 개소식에는 유지범총장을 비롯하여 김재현부총장, 최재붕부총장, 대학 교무위원(학장 및 처장단), 학내 유관부서 등이 참석한 가운데, 솦ː콤 현판 제막 및 개소 기념식, 공간 소개 등으로 이뤄졌다. 유지범 총장은 “솦ː콤은 역사와 전통 위에 창조적이고 미래지향적인 협업과 혁신전략이 어우러진‘성대다움’을 보여주는 공간으로 솦ː콤 개소를 진심으로 기쁘게 생각한다”라며 “SW·AI를 비롯한 여러 분야의 학문을 융합하는 학습을 통해 복합적인 사고와 자기주도적 학습을 통해 미래 지향적인, 성균관대가 지향하는 존경받는 글로벌 대학의 토대를 마련하기 위해 노력하겠다”고 말했다. 이어 이은석단장은 “솦ː콤은 SW중심대학사업에서 추진중인 SW기초 교육 및 인재양성을 위한 단계별 프로그램과 산·학 협력의 결과물을 한 자리에서 볼 수 있는 복합공간으로 학제간, 학역간 다양한 문화와 정보를 융합해 끊임없이 새로운 가치를 창출할 수 있다”며 “학생들을 위한 참된 교육, 결과물의 공개와 공유를 통한 사회적 기여가 가능한 나눔을 실천하는 대학이 되도록 최선을 다하겠다”고 강조했다. 성균관대학교 SW중심대학사업단 솦:콤 현판 제막 및 개소 기념식 성균관대학교 SW중심대학사업단 솦:콤 현판 제막 및 개소 기념식 솦ː콤 공간별 소개는 SW중심대학사업단 조형민부단장의 설명과 함께 프로그램 전용공간별 ▲자율주행 자동차 시범주행 및 알고리즘(S-car 한상훈, 강민석), ▲구글 스터디 워크샵 및 스킬업 패스(GDSC 이건희), ▲온라인명륜당, 킹고코인, 오픈소스데이터 관리시스템(SSA 류수현, 유혜진, 유광호), ▲실감형이미지콘텐츠 및 게임제작(MAV 유지훈), ▲아르스 일렉트로니카(Ars-Eletronica) 출품작(컬텍 박지혜) 등 학생들의 소개로 진행되었다. 성균관대학교 SW중심대학사업단 구성원 솦:콤존 기념촬영 [사진제공: 성균관대학교] 가장 많은 관심을 받은 솦ː콤 미디어갤러리는 실감형이미지콘텐츠 작품- GLOBAL SKKU, 명화, Convergence-, Ars-Eletronica 학생 작품 및 실시간 자연과학캠퍼스 영상으로 구성되었다. 콘텐츠들 대부분은 SW중심대학사업단과 MOU를 맺고 있는 ㈜상화와 프라임파노라마가 함께 했으며, 학생들의 실감형이미지콘텐츠와 메타버스, AR, VR에 대한 산업계의 최신 트랜드 자문 및 비교과 프로그램 등을 차년도에도 계속 추진할 예정이다. 성균관대학교 SW중심대학사업단 공간은 ▲2015년 SW중심대학 사업 1단계 선정 이후 반도체관 6층 SOScom(SungKyun OpenSource Complex)으로 1세대 사업공간이 구축되었으며, ▲2021년 2단계 재선정 후 2022년 솦ː콤 1.5세대 리모델링 공간으로 조성되었다. 이후 성균관대 자연과학캠퍼스의 랜드마크인 삼성학술정보관 2층에 ▲2023년 솦:콤존으로 2세대 사업공간으로 구축되었으며 미래 인재양성을 위한 대학 교육의 질적 혁신과 학생 지원 강화를 위해 과학기술정보통신부-IITP의 SW중심대학사업과 교육부의 대학혁신지원사업의 연계로 조성되었다. 성균관대학교 SW중심대학사업단 솦:콤존 주요 공간 VR 및 메타포트 상세 확인 (https://skb.skku.edu/swuniv/VR.do) 출처 : 교수신문(http://www.kyosu.net)
-
- 작성일 2023-11-29
- 조회수 200
-
- [연구] 데이터 지능 및 학습 연구실 (지도교수: 이종욱), SIGIR, CIKM, EMNLP 2023 논문 7편 게재 NEW
- 데이터 지능 및 학습(Data Intelligence and Learning, DIAL) 연구실은 세계 최고 권위 정보검색 학회인 SIGIR 2023에 총 3편의 논문이 최종 게재 승인되었으며, 지난 7월 23일 스페인 마드리드에서 논문을 발표하였습니다. 지난 10월 21일에는 세계 최고 권위 데이터마이닝 학회인 CIKM 2023에 총 2편의 논문이 최종 게재 승인되어 영국 버밍엄에서 논문을 발표하였습니다. 또한, 세계 최고 권위 자연어처리 학회인 EMNLP 2023에 총 2편의 논문이 최종 게재 승인되었으며, 오는 12월에 싱가포르에서 논문을 발표할 예정입니다. [논문 목록] 1. It’s Enough: Relaxing Diagonal Constraints in Linear Autoencoders for Recommendation (SIGIR'23) 2. uCTRL: Unbiased Contrastive Representation Learning via Alignment and Uniformity for Collaborative Filtering (SIGIR'23) 3. ConQueR: Contextualized Query Reduction using Search Logs (SIGIR'23) 4. Forgetting-aware Linear Bias for Attentive Knowledge Tracing (CIKM'23) 5. Toward a Better Understanding of Loss Functions for Collaborative Filtering (CIKM'23) 6. GLEN: Generative Retrieval via Lexical Index Learning (EMNLP'23) 7. It Ain't Over: A Multi-aspect Diverse Math Word Problem Dataset (EMNLP'23) 연구 1: Jaewan Moon, Hye-young Kim, and Jongwuk Lee, “It’s Enough: Relaxing Diagonal Constraints in Linear Autoencoders for Recommendation”, 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2023 본 연구는 선형 오토인코더 (linear autoencoder) 기반 추천 시스템에서의 대각 제약조건 (diagonal constraint)에 대한 이론적 분석을 수행하고, 대각 제약조건을 완화한 relaxed linear autoencoders (RLAE)를 제안합니다. 선형 오토인코더 모델은 L2 정규화 (L2 regularization) 및 대각 성분 제거 제약조건 (zero-diagonal constraint)을 사용한 볼록 최적화 (convex optimization)를 통해 항목 간 가중치 행렬을 학습합니다. 본 논문은 선형 오토인코더 모델에서 두 가지 제약 조건의 특성을 이론적으로 이해하는 것을 목표로 합니다. 특이값 분해(singular value decomposition, SVD)와 주성분 분석(principal component analysis, PCA)을 활용한 가중치 행렬에 대한 분석을 통해 L2 정규화가 높은 순위의 주성분의 효과를 촉진한다는 사실을 밝힙니다. 반면, 대각선 성분 제거 제약조건은 순위가 낮은 주성분의 영향을 감소시켜 인기 없는 항목의 성능 저하로 이어질 수 있음을 보였습니다. 이러한 분석 결과로부터 영감을 얻어 대각선 부등식 제약 조건을 사용하는 간단하면서도 효과적인 선형 오토인코더 모델인 Relaxed Linear AutoEncoder (RLAE)와 Relaxed Denoising Linear AutoEncoder (RDLAE)를 제안합니다. 또한 대각 제약조건의 정도를 조정하는 제안 방법은 기존 선형 모델을 일반화한 형태임에 대한 증명을 제공합니다. 실험 결과는 6개의 벤치마크 데이터 세트에서 우리의 모델이 최첨단 선형 및 비선형 모델과 비슷하거나 더 우수하다는 것을 보여줍니다. 이는 대각 제약조건에 대한 이론적 통찰력을 뒷받침하며, 특히 인기도가 낮은 항목과 인기도 편향을 제거한 평가 (unbiased evaluation)에서 상당한 성능 향상이 발생됨을 확인하였습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/sigir2023_itsenough 연구 2: Jae-woong Lee, Seongmin Park, Mincheol Yoon, and Jongwuk Lee, “uCTRL: Unbiased Contrastive Representation Learning via Alignment and Uniformity for Collaborative Filtering”, 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR, short paper), 2023 본 연구는 추천 시스템에서 암묵적 피드백(e.g., 클릭 등)을 이용하여 학습할 때, 암묵적 피드백이 주로 인기있는 사용자와 항목에 편향되어 있어서 이로 인해 사용자와 항목의 표현(representation)이 실제 사용자와 항목의 선호도와 다르게 학습되는 문제를 해결한 논문입니다. 이 연구에서 우리는 기존의 추천에서 편향을 제거하는 연구들이 (i) 더 나은 표현 학습을 위해 널리 사용되는 대조 손실 함수(contrastive loss)를 고려하지 않는다는 것과 (ii) 편향 제거 시, 사용자와 항목을 모두 고려하지 않는다는 것을 지적하고 이를 보완하였습니다. 이 연구에서 우리는 Unbiased ConTrastive Representation Learning (uCTRL)을 제안합니다. 먼저, 기존에 추천 시스템에서 대조 손실 함수를 이용한 모델인 DirectAU 에서 영감을 받아, 대조적인 표현 학습을 정렬(alignment)과 균일성(uniformity) 두 가지 손실 함수로 나타냅니다. 정렬 함수는 사용자-항목 상호작용에 대해 사용자와 항목의 표현을 비슷하게 합니다. 균일성 함수는 각 사용자 및 항목 분포를 균등하게 나타냅니다. 우리는 정렬 함수가 사용자와 항목의 인기도에 편향되어 있다는 것을 확인하였으며, 편향을 추정한 뒤에 이를 이용하여 편향을 제거하는 방법인 IPW(inverse propensity weighting)를 이용하여 편향을 제거합니다. 추가적으로 우리는 IPW에서 사용되는 사용자와 항목을 모두 고려하여 편향을 추정하는 새로운 방법을 개발하여 하였습니다. 우리의 실험 결과는 제안된 uCTRL이 네 개의 벤치마크 데이터셋(MovieLens 1M, Gowalla, Yelp 및 Yahoo! R3)에서 최신 편향제거 모델보다 우수한 성능을 보인다는 것을 보여주었습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_uctrl 연구 3: Hye-young Kim*, Minjin Choi*, Sunkyung Lee, Eunseong Choi, Young-In Song, and Jongwuk Lee, “ConQueR: Contextualized Query Reduction using Search Logs”, 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR, short paper), 2023 본 연구는 사전학습된 언어 모델(Pre-trained language model)을 활용한 질의 축약 모델을 제안합니다. 질의 축약이란 사용자가 너무 긴 질의(검색어)를 입력하여 사용자의 의도에 맞는 적절한 결과를 얻지 못하였을 때, 질의에서 불필요한 단어를 제거하여 원하는 검색 결과를 찾는 방법을 의미합니다. 제안 모델 ConQueR는 (i)핵심 용어 추출과 (ii) 하위 질의 선택의 두 가지 관점에서 이를 해결합니다. 핵심 용어 추출 방법은 단어 수준에서 기존 질의의 핵심 용어를 추출하고 하위 질의 선택 방법은 주어진 하위 질의가 기존 질의의 올바른 축약인지 문장 수준에서 결정합니다. 두가지 관점은 서로 다른 레벨에서 작동하여 상호보완적인 관계를 가졌기 때문에 제안 모델 ConQueR는 최종적으로 이를 결합하여 올바른 축약을 얻습니다. 더불어 검색 로그에서 빈번하게 발생할 수 있는 잘못된 샘플을 처리하기 위해 truncated loss 학습 방식을 도입하여 학습이 원활히 이루어지도록 설계하였습니다. 실제 검색 엔진에서 수집한 검색 로그 데이터에 대한 성능 실험과 만족도 조사를 통해, 제안 모델이 효과적으로 질의 축약을 수행하였음을 입증하였습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_conquer 연구 4: Yoonjin Im*, Eunseong Choi*, Heejin Kook, and Jongwuk Lee, “Forgetting-aware Linear Bias for Attentive Knowledge Tracing”, The 32nd ACM International Conference on Information and Knowledge Management (CIKM, short paper), 2023 지식 추적은 학습자의 순차적인 과거 문제 풀이 기록을 기반으로 새로운 목표 문제의 정오답을 예측하는 과업을 통해 숙련도를 모델링합니다. 학습자의 숙련도를 정확히 예측하기 위해서는 문제 간의 상관관계와 학습자의 특성(예: 망각 행동)을 학습하는 것이 중요합니다. 따라서 일부 집중 메카니즘(attention mechanism) 기반의 지식 추적 모델들은 절대적 위치 정보(absolute position embeddings) 대신 상대적 시간 간격 편향(relative time interval bias)을 도입하여 학습자의 망각 행동(forgetting behavior)을 모델링했습니다. 이는 현재 시점에서 오래된 문제 풀이 기록일수록 모델의 집중도를 낮춤으로써 망각 행동을 구현합니다. 하지만 기존 방법론들은 문제 풀이 기록이 길어질수록 망각 행동 모델링의 효과가 줄어드는 문제가 나타납니다. 본 연구에서는 일반화된 수식 분석을 통해 기존의 상대적 시간 간격 편향 계산에 문제 간의 상관관계가 불필요하게 개입된다고 판단하고, 이를 해결하기 위해 서로를 분리할 수 있는 선형 편향 기반의 FoLiBi (Forgetting aware Linear Bias for Attentive Knowledge Tracing)를 제안합니다. 제안하는 방법론은 기존의 집중 메카니즘 기반의 지식 추적 모델에 쉽게 적용될 수 있으며, 간단한 방법임에도 불구하고 4개의 벤치마크 데이터 세트에서 최신 지식추적 모델에 비해 최대 2.58%까지 일관되게 AUC를 개선했습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_folibi 연구 5: Seongmin Park, Mincheol Yoon, Jae-woong Lee, Hogun Park, and Jongwuk Lee, “Toward a Better Understanding of Loss Functions for Collaborative Filtering”, The 32nd ACM International Conference on Information and Knowledge Management (CIKM), 2023 본 연구는 추천 시스템의 한 축인 협업 필터링(Collaborative filtering)에서 사용하는 다양한 손실 함수(Loss function) 간의 수식적인 관계를 분석하고, 이 관계를 기반으로 새로운 손실함수를 제안합니다. 협업 필터링은 최신 추천 시스템에서 핵심적인 기술이며, 협업 필터링 모델의 학습 과정은 일반적으로 상호작용 인코더, 손실 함수, 네거티브 샘플링의 세 가지 구성 요소로 이루어집니다. 기존의 많은 연구에서 정교한 상호작용 인코더를 설계하기 위해 다양한 협업 필터링 모델을 제안했지만, 최근 연구에서는 단순히 손실 함수를 교체하는 것만으로도 큰 성능 향상을 달성할 수 있음을 보여주고 있습니다. 이 논문에서는 기존 손실 함수 간의 관계를 분석하여, 기존의 손실 함수들을 정렬(Alignment) 및 균일(Unifomrity)으로 해석할 수 있음을 밝혀냈습니다. (i) 정렬은 사용자와 항목 표현을 일치시키고, (ii) 균일은 사용자와 항목 분포를 분산시키는 역할을 합니다. 이 분석에서 영감을 얻어 데이터셋의 고유한 패턴을 고려하여 정렬과 균일성의 설계를 개선하는 새로운 손실 함수(Margin-aware Alignment and Weighted Uniformity, MAWU)를 제안합니다. (i) Margin-aware Alignment(MA)는 사용자/아이템별 인기도 편향을 완화하고, (ii) Weighted Uniformity(WU)는 데이터셋의 고유한 특성을 반영하기 위해 사용자 및 항목 균일성을 조정합니다. 실험 결과, MAWU를 탑재한 MF와 LightGCN은 세 가지 벤치마크 데이터셋에서 다양한 손실 함수를 사용하는 최신 협업 필터링 모델과 비슷하거나 더 우수한 것으로 나타났습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_mawu 연구 6: Sunkyung Lee*, Minjin Choi*, Jongwuk Lee (* : equal contribution), “GLEN: Generative Retrieval via Lexical Index Learning”, The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2023 (To appear) 본 연구는 어휘 색인 학습을 통한 새로운 생성 검색 모델 GLEN (Generative retrieval model via LExical INdex Learning)을 제안합니다. 생성 검색(Generative retrieval)은 문서 검색의 새로운 패러다임으로, 질의에 대한 관련 문서의 식별자를 직접 생성하는 것을 목표로 합니다. 그러나, 기존 생성 검색 연구들은 두 가지 주요한 한계를 가집니다. 첫 번째는 문서의 식별자 생성이 기존의 자연어 생성과 의미적으로 많이 다르지만 이를 고려하지 않는다는 점입니다. 두 번째는 학습 시 식별자 생성만을 집중하지만, 추론 시 비슷한 문서 간의 순위를 매겨야 함으로 인해 발생하는 학습-추론 불일치입니다. 이를 극복하기 위해, 본 연구는 어휘 색인(lexical index)을 동적으로 학습하는 새로운 생성 검색 방법론을 제안합니다. 제안 방법론은 2단계 인덱스 학습 전략(two-phase lexical index learning)을 통해 (i) 키워드 기반의 고정된 문서 식별자를 생성하는 추가 사전 학습 단계를 수행하며, (ii) 동적 문서 식별자를 질의 및 문서 간의 관련성을 통해 학습하도록 합니다. 실험 결과, 제안 모델 GLEN이 NQ320k, MS MARCO, BEIR 등 다양한 벤치마크 데이터셋에서 기존의 생성 검색 모델 또는 전통적인 검색 모델 대비 최상 또는 경쟁력 있는 성능을 달성한다는 것을 증명하였습니다. 코드는 https://github.com/skleee/GLEN 에서 확인할 수 있습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_glen 연구 7: Jiwoo Kim, Youngbin Kim, Ilwoong Baek, JinYeong Bak, Jongwuk Lee, “It Ain't Over: A Multi-aspect Diverse Math Word Problem Dataset”, The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2023 (To appear) 본 연구는 LLM(Large Language Model)의 수학적 추론 능력을 분석하고, 이를 개선하기 위한 새로운 10K 데이터셋 DMath (Diverse Math Word Problems)를 제안합니다. 수학 문장형 문제 (MWP, Math Word Problem) 과제는 자연어 모델에게 자연어 문장에 대한 깊은 이해와 논리적 추론을 요구하는 복잡하고 흥미로운 과제이자 자연어 모델의 추론 능력을 평가하기 위해 주로 사용되어 온 과제입니다. 최근 들어 거대 언어 모델(LLM)이 등장하면서 기존 수학 문장형 문제 벤치마크에서 높은 성능을 거두었으며, 이를 통해 LLM이 좋은 수학적 추론 능력을 가지고 있다고 알려져 있습니다. 그러나 이는 제한적인 벤치마크로 인한 결과로 본 논문에서는 기존 벤치마크의 낮은 다양성을 지적하며 이를 높여야 함을 보입니다. 본 논문은 수학 문장형 문제 데이터셋이 가져야 하는 다양성을 총 네 가지로 정의합니다. 이는 추론 유형(problem types), 어휘 사용 패턴(lexical usage patterns), 언어(languages), 그리고 중간 풀이 과정(intermediate solution forms)입니다. 추론 유형을 정의하기 위해 본 연구는 미국과 한국의 수학 교육 과정을 참고하였고, 산술 연산(arithmetic calculation), 비교(comparison), 상관관계(correspondence), 도형(geometry), 확률(possibility)로 정의하였습니다. 이전 연구들은 산술 연산에 집중하였기 때문에 다른 유형의 수학적 추론 능력에 대해 LLM이 어떤 결과를 내보이는지 알려진 바가 적었습니다. 본 연구의 실험 결과 LLM의 추론 능력은 추론 유형에 따라 많은 차이를 보입니다. 어휘 사용 패턴, 언어, 중간 풀이 과정에 대해서도 높은 다양성을 추구하였고, 이러한 특징으로 인해 DMath는 이전 연구들보다 더 도전적인 데이터셋이라고 볼 수 있습니다. 또한 데이터를 구성하고 구축하는 과정에서 43명의 사람들이 참여했으며, 정교한 검증을 통해 높은 품질을 추구하였습니다. 높은 다양성으로 인해 DMath는 LLM의 다양한 추론 능력을 검사하고 평가하는데 도움이 될 수 있습니다. 관련 데이터는 https://github.com/JiwooKimAR/dmath 에서 확인하실 수 있습니다. 본 논문에 관한 자세한 내용을 알고 싶으시다면, 다음 주소를 참고해주세요. URL: https://dial.skku.edu/blog/2023_dmath
-
- 작성일 2023-11-26
- 조회수 327
-
- [학생실적] 우사이먼성일 교수 연구실, 2023 창업경진대회 최우수상, 우수상 수상
- 소프트웨어학과 DASHLab. 융합보안트랙 조범상(석사과정), 이강준(석박통합과정), 우사이먼성일 교수 팀이 성균관대학교 창업지원단에서 주최한 2023 SIS 실험실 창업경진대회에서 新유형 범죄 예방 Deepfake 탐지 기술창업을 진행하여 우수상(3등) 수상하였다. 2023 SIS 실험실 창업경진대회는 경기청년창업포럼축제에서 함께 주최되어 경기도, 수원특례시, 창업진흥원, 과학기술사업화진흥원 등에서 후원되어 청년창업의 활성화를 통하여 지역경제성장을 위해 실시되었다. 본 대회는 성균관대학교 및 국민대학교 대학원생을 대상으로 8주간의 기간과 1박2일동안의 창업캠프를 진행하였으며 엄격한 심사를 통과한 최종 8팀이 선발되었으며 최종 우수상(3등)을 수상하였다. 또한, 소프트웨어학과 Dash Lab. 조범상(석사과정), 이강준(석박통합과정), 우사이먼성일 교수 팀이 성균관대학교 창업지원단에서 주최한 2023 SKKU 대학원생 창업경진대회에서 최우수상(2등)을 수상하였다. 2023 SKKU 대학생,대학원생 창업경진대회는 성균관대학교 창업지원단에서 주최되어 대학생, 대학원생 창업을 활성화하여 창업에 대한 의욕과 관심을 고취하고 기술 및 아이디어 기반의 창업문화를 확산을 위해 실시되었다. 이번 대회는 치열한 경쟁을 통하여 최종 선발된 11팀 중 최우수상(2등)을 수상하는 쾌거를 이룩하였다.
-
- 작성일 2023-11-21
- 조회수 273
-
- [학생실적] 글로벌융합학부, 아르스 일렉트로니카 페스티벌 참가
- 글로벌융합학부, 아르스 일렉트로니카 페스티벌 참가 ▲ (왼쪽부터)김지섭(컬텍18), 이지민(컬텍19), 이수민(컬텍20), 박지혜(컬텍20), 홍은지(컬텍/소비자학20), 박준하(컬텍/영상19), 조용민(컬텍/영상18) 세계적으로 높은 명성을 자랑하는 국제 미디어 아트 페스티벌, 아르스 일렉트로니카(ARS electronica)가 지난 9월 6일부터 10일까지 오스트리아 린츠에서 개최되었다. 그리고 이번 행사에서 우리 대학 글로벌융합학부 컬처앤테크놀로지융합전공 학생들이 빛나는 활약을 펼치며 세계의 주목을 받았다. 아르스 일렉트로니카는 기술과 예술의 경계에서 새로운 창작물을 탄생시키는 아티스트와 연구자들의 정상회담으로 불린다. 우리 대학 학생들은 페스티벌에 참여하여 독창적인 작품들로 국제 무대를 물들였다. 학생들이 선보인 작품들은 현대적인 기술, 가상현실, 인공지능, 전통문화, 음악, 영상의 융합으로 탄생한 여러 형태의 미디어 아트였다. 이러한 다양한 작품들은 방문자들로부터 높은 관심과 찬사를 받으며 페스티벌의 하이라이트로 꼽히기도 했다. 한편, 학생들 사이에서는 이번 참가를 통한 경험과 네트워킹의 기회가 앞으로의 예술 활동에 큰 영향을 미칠 것으로 기대하고 있다. 페스티벌에 참가한 한 학생은 “이번 아르스 일렉트로니카 참가는 예술가로서의 인생에서 잊지 못할 순간이 될 것”이라며 “세계의 다양한 아티스트들과의 교류를 통해 받은 영감과 피드백은 앞으로의 작품 활동에 큰 도움이 될 것”이라고 밝혔다. 김장현 글로벌융합학부장은 이번 참가에 대해 “글로벌한 무대에서 우리 학생들의 능력을 증명할 수 있던 소중한 기회였다. 그들의 뛰어난 재능과 노력을 통해 세계적인 인정을 받을 수 있어 감사하다”고 전했다. 글로벌융합학부 학생들은 이번 아르스 일렉트로니카에서 얻은 경험과 자신감을 바탕으로 국내외의 다양한 무대에서 더욱 활발하게 활동을 이어나갈 것으로 기대된다.
-
- 작성일 2023-10-31
- 조회수 402
-
- [연구] 김형식 교수 연구실(보안공학연구실, SecLab), IEEE Symposium on Security and Privacy (S&P) 2024 논문 게재 승인
- 보안공학 연구실 (지도교수: 김형식, https://seclab.skku.edu)의 오상학(박사과정), 이기호(석사과정), 박선혜(석사과정) 학생과 김형식 교수가 진행한 "Poisoned ChatGPT Finds Work for Idle Hands: Exploring Developers' Coding Practices with Insecure Suggestions from Poisoned AI Models"논문이 컴퓨터 보안 분야에서 최우수 학술대회(IF=4)인 IEEE Symposium on Security and Privacy (S&P) 2024에 게재 승인되었습니다. 본 연구는 미국 테네시 대학교의 김두원 교수님과 공동 연구로 진행되었습니다. 본 논문은 ChatGPT 혹은 GitHub Copilot과 같은 AI 코딩 어시스턴트 툴에서 발생할 수 있는 공격인 포이즈닝 공격에 대한 개발자들의 인식을 분석하고, 더 나아가 실제 개발자들이 포이즈닝 공격을 접했을 때 이를 어떻게 대처하는지에 대한 개발자들의 코딩 패턴을 분석한 연구입니다. 이를 위해, 실제 소프트웨어 개발자들을 모집하여 온라인 사용자 스터디와 In-lab 스터디를 진행하였으며, In-lab 스터디에서는 일반 개발자와 보안 지식이 있는 개발자를 각각 모집하여 실험을 진행하였습니다. 주요 결과로, IntelliCode와 같은 형태의 AI 코딩 어시스턴트 툴을 사용하거나 툴이 없는 환경일 때보다, ChatGPT와 같은 형태의 툴을 사용하는 환경에서 포이즈닝 공격을 통해 취약한 코드가 개발자에서 제안되었을 때, 개발자들이 좀더 취약한 코드를 생성하는 경향을 보이는 결과를 보였습니다. Abstract. AI-powered coding assistant tools (e.g., ChatGPT, Copilot, and IntelliCode) have revolutionized the software engineering ecosystem. However, prior work has demonstrated that these tools are vulnerable to poisoning attacks. In a poisoning attack, an attacker intentionally injects maliciously-crafted insecure code snippets into training datasets to manipulate these tools. The poisoned tools can suggest insecure code to developers, resulting in vulnerabilities in their products that attackers can exploit. However, it is still little understood whether such poisoning attacks against the tools would be practical in real-world settings and how developers address the poisoning attacks during software development. To better understand the feasibility of poisoning attacks against AI-powered coding assistant tools, we designed two user studies: an online survey and an in-lab study. The online survey was conducted with 241 software developers. The survey results showed developers widely adopted these tools to enhance coding speed, eliminate repetition, and gain boilerplate code. However, the survey also found developers may misplace trust in these tools because they overlooked the risk of poisoning attacks. The in-lab study was conducted with 30 professional developers. The developers were asked to complete three programming tasks with a representative type of AI-powered coding assistant tool like ChatGPT or IntelliCode running on Visual Studio Code. The in-lab study results showed that developers using a poisoned ChatGPT-like tool were more prone to including insecure code than those using an IntelliCode-like tool or no tool. This demonstrates the strong influence of these tools on the security of generated code. Our study results highlight the need for education and improved coding practices to address new security issues introduced by AI-powered coding assistant tools.
-
- 작성일 2023-10-31
- 조회수 1010
-
- [학생실적] ‘스꾸버스 앱 개발자’ 조승용(소프트웨어 23) 학우
- 인문사회과학캠퍼스 셔틀버스 실시간 위치, 인자셔틀 (인문사회과학캠퍼스 – 자연과학캠퍼스 셔틀버스) 시간표를 확인할 수 있는 앱 ‘스꾸버스’. 스꾸버스는 지난 9월 4일 정식 출시 이후 현재까지 인사캠퍼스 전체 학우의 약 20% 정도가 다운로드 받았고, 매일 250~300명 정도의 학우가 이용 중이다. (9/17 기준) 앱 구상 계기부터 직접 발로 뛰었던 홍보 이야기, 업데이트 계획까지, 앱 개발자 조승용 학우에게 들어보자. *스꾸버스는 플러터로 제작되었으며, 모든 소스코드는 깃허브에서 누구나 확인할 수 있습니다. https://github.com/spencer0124/SKKUBUS Q. 언제부터, 어떤 일을 계기로 ‘스꾸버스’ 앱 구상을 시작하셨나요? 코딩을 공부하면서, 실생활에서 겪고 있는 문제 해결의 수단으로 코딩을 사용해 보고 싶다는 생각이 들었습니다. 그때부터 학교에서 불편했던 부분들에 ‘왜?’라는 질문을 던지면서 더 나은 해결 방법은 없을까 고민해 보기 시작했습니다. 1학기 고전명저북클럽 강의를 듣기 위해 명륜 캠퍼스에 매주 방문했습니다. 인자 셔틀과 인사캠 셔틀버스에 대한 정보가 한 곳에 정리되어 있지 않다는 걸 알게 된 것이 결정적인 계기였던 것 같습니다. 본격적으로 앱을 제작하기 전에 수요조사가 필요하다고 생각되어 지난 3월, ‘인사캠 셔틀버스 실시간 위치 확인’이라는 핵심 기능을 담은 MVP 버전의 앱을 앱스토어에 배포했습니다. 많은 학우들이 좋은 반응을 보여주셨고, 경쟁력이 있다고 판단해서 본격적으로 개발을 시작했죠. Q. 앱 출시 이후에 에브리타임 등에서 학우들의 반응이 굉장히 좋았습니다. 그중 기억에 남는 반응이나 본인이 기대했던 반응이 있다면 무엇인가요? 많은 분들이 좋게 생각해 주셔서 감사할 따름입니다. 앱 홍보를 위해 인스타그램을 운영하며 많은 인사캠 학우들을 팔로우했습니다. 앱을 개발해줘서 고맙다고 스토리를 올려주신 분이 기억에 남습니다. 이외에도 인사캠에서 학우들이 스꾸버스 앱을 이용하거나 스꾸버스에 대해 이야기하는 모습을 보면 뿌듯해요. Q. 앱 제작에서 가장 신경 썼던 점은 무엇인가요? 일주일의 대부분을 자연과학캠퍼스에서 생활하다 보니 인사캠 셔틀버스에 대해 자세히 알지 못해 제일 힘들었던 것 같아요. 제작할 때 에브리타임, 인터넷에서 최대한 많은 자료를 찾아보고 인사캠 친구들에게도 많이 물어봤던 것 같아요. 앱을 테스트할 때는 인사캠에 방문해서 직접 셔틀을 타보며 테스트하곤 했어요. 실시간 데이터를 다루다 보니 이전에 만들었던 앱에 비해서 기술적인 어려움에 많이 부딪혔던 것 같아요. 정보를 받아오는 것에서부터, 오류가 났을 때 해당 오류를 재현하는 것조차 상당히 힘들었던 기억이 납니다. 다양한 테스트를 하면서 문제를 해결하기 위해 집중했던 것 같아요. Q. 앱을 개발하는 것 만큼이나 홍보에서도 다양한 시도를 했다고 들었습니다 앱을 사용하도록 유도하는 게 앱을 개발하는 것 만큼이나 어렵더라고요. 저는 오프라인과 온라인에서 할 수 있는 홍보 방법을 모두 시도해 보기로 했습니다. 오프라인에서는 공강인 날에 인사캠에 방문해서 직접 포스터를 붙였습니다. MBTI I 성향인 제게는 쉽지 않은 일이었지만, 에브리타임에 올라온 포스터 공유글을 보고 유입에 큰 도움이 된 것 같아 뿌듯함을 느꼈습니다. 학교 축제 (에스카라) 기간에는 모든 학우를 대상으로 밀도 높게 앱을 홍보할 기회라는 생각에 자과캠에서도 포스터를 붙이는 활동을 진행했습니다. 온라인에서는 스꾸버스 인스타그램 계정을 만들고, 인사캠의 모든 학과 학생회 인스타그램 계정을 찾은 뒤 가장 최근 게시물에 ‘좋아요’와 댓글을 남긴 모든 사람을 팔로우했습니다. 비공개 계정으로 팔로우를 신청한 뒤, 특정 요일 특정 시간에 모든 팔로우 요청을 한 번에 받아서 학우들 사이에서 나름의 화제를 일으켜 보려고 했어요. 이외에도 인사캠 학생회, 총학생회에 홍보를 요청해 본다든지, 인스타그램 계정과 연동하여 스레드 계정을 생성한다든지 다양한 시도를 해봤던 것 같아요. Q. 스꾸버스를 제작하기 이전에 제작했던 다른 앱이 있으신가요? 중앙도서관, 삼성도서관에 출입할 때 학번 기반의 바코드로 쉽게 출입할 수 있게 도와주는 ‘스꾸패스’ 앱을 제작한 경험이 있어요. 역시 현재 사용하고 있는 출입 앱의 불편함을 해결하고자 시작했던 프로젝트입니다. 현재는 앱스토어에만 올라가 있는데, 여러 가지 기능을 다듬고 내년 초에 정식 출시할 예정입니다. Q. 학우님을 끝없이 도전하게 하는 원동력은 무엇인가요? 사실 거창한 건 없어요. 대학교에 들어오고 나서는 ‘하고 싶은 게 있으면 고민하지 말고 일단 해보자!’가 목표였는데, 스꾸버스 앱을 제작하게 된 건 그런 생각의 연장선이었던 것 같아요. 그럼에도 앱을 개발하며 고민하게 되는 순간들이 분명히 있었습니다. 혼자서 모든 작업을 감당하기에 버거울 때도 있었고, 내가 가는 길이 옳은 길인지, 학우들이 제 앱을 필요로 할지 확신하지 못하는 순간들도 있었어요. 저는 개발자라면 ‘제 앱을 많은 사람이 사용하고 있어요!’가 아닌 ‘제 앱을 000명의 학우가 사용해 주시고, 일일 활성 유저는 000명이에요!’라고 수치로 이야기해야 하는 사람이라고 생각했어요. 그래서 개발 과정에서 꼼꼼하게 통계 작업을 신경 썼고, 이를 통해 학우들의 반응을 수치로 확인할 수 있었어요. 감사하게도 많은 학우들이 앱을 사용해 주셨고 이러한 반응을 통해 더욱 힘을 얻었습니다. Q. 앞으로의 계획 혹은 이루고 싶은 목표가 있으신가요. 단기적으로는 새로운 앱을 만들기보다는 스꾸버스 앱 업데이트, 그리고 리팩토링에 집중할 것 같습니다. 얼마 전 있었던 축제 (에스카라)에서도 복지 차원에서 인자셔틀이 대량 증차되고 탑승 위치가 달라졌는데요, 행사 당일에 많은 공지가 올라오는 인스타그램에서는 한눈에 확인하기 힘들 것 같다는 생각이 들었어요. 공지가 올라온 시점이 축제 당일까지 얼마 남지 않은 시점이어서 3일 동안 잠도 줄여가고, MT 가서도 코딩하며 완성했던 기억이 납니다. 이 외에도 얼마 전부터 교내에 진입한 종로 07 버스 시간표 추가, 스꾸버스 앱 사용자 데이터를 통한 혼잡도 표시, 알림 기능 추가 등 서비스를 고도화하는 데 집중할 예정이에요. 모든 성균관대 학우들이 스꾸버스 앱을 불편함 없이 사용할 수 있도록 ‘모바일 앱 접근성’도 개선할 예정이에요. 장기적으로는 학기 초에 가졌던 ‘왜?’라는 질문을 성균관대학교를 넘어 더 큰 세상에서 던져보고 싶습니다. 그곳에서 또 다른 불편함을 찾고 그것을 저만의 방식으로 해결해 가는 개발자가 되는 것이 목표입니다. 성균 웹진 524호 https://webzine.skku.edu/skkuzine/section/people01.do?mode=list&articleNo=109617
-
- 작성일 2023-10-11
- 조회수 504
-
- [학생실적] 2023년 해커톤 및 융합보안협의회 우수상, 김진무 (소프트웨어학과 23)학우
- 8월 24일과 25일 이틀에 쳐 자연과학캠퍼스에서 2023년 해커톤 및 융합보안협의회가 개최됐다. 이번 해커톤은 작년과 다르게 CTF(Capture The Flag) 형식으로 진행됐다. 프로그램의 취약점을 찾아 공격하여 얻은 Flag를 대회 사이트에 제출하면 점수를 획득하는 방식이다. 2023년 해커톤 및 융합보안협의회에서는 시스템해킹(Pwnable), 역공학(Reversing), 암호학(Crypto), 블록체인(Blockchain) 총 4가지 분야에서 문제가 출제됐다. 이 행사를 총괄한 김형식 교수는 경쟁보다는 참가자들이 행사에 몰입하고 문제에 집중할 수 있는 대회를 지향했으며 이를 위해 CTF 대회가 시작되기 전, 각 분야별로 문제를 출제한 교수의 튜토리얼이 진행됐다. 몰입을 통한 배움의 장에서 다양한 팀이 수상했으며 그중 개인으로 출전한 ‘23학번 새내기팀’의 김진무 학우가 우수상을 받았다. 김진무 학우는 고등학생 때부터 정보보안 전문가를 꿈꾸며 다수 해킹방어대회에 참여했다. 화이트햇콘테스트(국방부 주최), Wacon과 같은 규모 있는 대회에서 1위를 차지했으며 두바이 세계해킹방어대회, 코드게이트, 전국 청소년 정보보호 페스티벌과 같은 개인전 대회에서도 수상의 기쁨을 누렸다. 김진무 학우는 문제를 푸는 것에서 멈추지 않고 해킹방어대회를 운영하고 문제를 출제하며 해킹에 대한 열정을 보여주고 있다. 자신의 취약한 점을 찾아 끊임없이 발전해 나가는 김진무 학우의 이야기를 들어보자. Q. 안녕하세요. ‘2023년 해커톤 및 융합보안협의회’ 우수상 받은 것을 축하드립니다. 소감을 듣고 싶어요. 안녕하세요. 축하해 주셔서 감사합니다. 질 좋 문제, 좋은 취지의 대회를 개최해 주신 교수님들께 감사드립니다. 지금까지 제가 공부해왔던 지식을 성균관대학교에서 입증할 수 있어서 아주 좋은 기회라고 생각했습니다. 대부분 참여자들이 대학원생으로 구성된 팀이라 잘할 수 있을까 걱정했는데 좋은 성적을 얻어 영광입니다. 주변 지인, 특히 부모님께서 저보다 기뻐하시는 것 같아서 고맙고, 뿌듯하기도 해요. Q. 이번 행사에 어떤 마음으로 임하셨나요? 항상 1등 한다는 마인드로 해킹방어대회에 참여해왔기 때문에 이번에도 1등 한다는 마음가짐으로 참여했습니다. 첫 대학에 들어오고 동기들과 학교 생활을 즐기고 학업에 집중하면서 해킹에 소홀히 했던 것 같아서 새 출발 하자는 마음으로 참여했어요. 1인 팀으로 참여함으로써 제 실력을 되돌아보고 점검할 기회라고 생각했습니다. Q. 23학번 혼자 문제를 해결하기 쉽지만은 않았을 텐데 기억에 남는 에피소드가 있나요? 블록체인 분야에서 두 문제가 출제되었는데, 블록체인에 대한 지식이 아예 없어서 간단한 문제를 3시간 동안 삽질한 것이 기억에 남아요. 저를 제외한 거의 모든 팀들이 푼 문제였는데, 저만 풀리지 않아 계속 붙잡고 있었던 것 같아요. 그래서 튜토리얼 시간에 설명해주신 디버깅 방법으로 여러 시도를 해보다 스마트 컨트랙트의 메모리 구조에 대해 잘못된 개념을 가지고 있었다는 것을 깨달았고, 3시간의 삽질 끝에 문제를 풀 수 있었어요. 풀고 난 후 원래 알고 있던 지식이면 쉽게 풀었을 것 같아 허무하기도 했어요. 튜토리얼에서 배운 디버깅 툴을 사용하지 않았다면 이런 삽질하는 과정 자체를 못 했기 때문에 대회 전에 튜토리얼을 진행한 것이 대회 취지에도 맞는 아주 좋은 방식이었다는 생각이 크게 들었습니다. Q. 이번 경험을 통해 어떤 것을 얻으셨나요? 스마트 컨트랙트, PAC attack과 관련된 새로운 개념을 튜토리얼 알게 되었고 직접 풀어보면서 깊게 이해할 수 있었어요. 주변에 해킹에 관심이 있는 동기, 선배들을 찾기 어려웠는데, 이번 대회에 참여함으로써 해킹에 관심 많은 학부연구생, 대학원생이 있다는 것을 알게 되었어요. 앞으로 보안에 관심 있는 학생, 훌륭하신 교수님들과 함께 함으로써 얻을 수 있는 경험, 지식이 더욱 많을 것 같다고 생각했습니다. Q. 해킹에 관심 갖게 된 이유가 궁금합니다. 저는 해킹이라는 단어 자체에 호기심을 느끼고, 직업으로 삼을 수 있는지 궁금했어요. ‘취약점을 분석하여 미리 패치를 함으로써 해킹을 막을 수 있다’라는 것에서 저는 ‘정보 보안 전문가는 합법적으로 해킹할 수 있다’라는 말로 들렸거든요. 그때부터 무작정 공부를 시작했던 것 같아요. Q. 고등학생 때부터 많은 대회에 나가셨는데 이에 대한 이야기와 개인만의 팁을 알려주세요. 저는 목표가 있어야 동기부여가 되는 성격이라 1차적인 목표를 해킹방어대회 수상으로 정했어요. 처음에는 해킹 문제풀이를 하는 워게임 사이트에서 다양한 문제를 풀면서 해킹문제에 대한 감을 잡았고, 이후 여러 해킹방어대회에 참가하여 문제를 풀었어요. 대회 당시 못 풀었던 문제들은 문제풀이 보고서를 보면서 다시 풀어보는 것을 반복했는데 이런 점에서 해킹은 수학이랑 비슷한 것 같습니다. 저는 이 과정에서 고등학교 선배에게 많은 도움을 받았어요. 해킹을 처음 공부하는 몇 개월 동안은 모르는 것, 궁금한 것을 매일매일 물어봤던 것 같아요. 초반에는 저 스스로 해결한 문제가 손에 꼽을 정도로 취약점 분석, 공격에 대한 감이 부족했고, 거의 모든 문제를 선배에게 힌트를 물어보거나 인터넷에 있는 문제풀이를 참고했습니다. 이런 과정에서 많이 위축되기도 했지만, 꾸준히 하다 보니 어느 순간 대부분의 문제를 혼자 풀 수 있을 만큼 발전한 자신을 볼 수 있었어요. 감을 잡는 순간 자연스럽게 실력 발전에도 가속도가 붙는 것 같더라고요. 이때부터 국방부 주최 대회, 코드게이트, 두바이 세계 해킹방어대회 등 대회에 참여할 때마다 본선에서 상위권을 유지했고 나름 청소년부에서 이름을 날렸던 것 같습니다. 저는 꾸준히 하는 것과 목표를 세우는 것이 가장 중요하다고 생각해요. 모르는 내용에 대한 질문을 받아줄 수 있고, 서포트해줄 수 있는 주변 지인이 있다면 그 사람이 이전에 겪은 시행착오, 경험을 기반으로 더 수월하게 지식을 얻을 수 있을 거예요. CTF에 관심 있으신 분께서는 저에게 개인적으로 연락주시면 아는 선에서 최선을 다해 도와드리겠습니다. Q. 융합보안에 대한 다양한 경험으로 사회에 어떤 영향을 주고 싶은지 궁금합니다. 생명과 직접적으로 관련된 시스템에서 취약점을 찾고 이를 해결하고자 하는 데 관심이 있어요. 이러한 시스템은 의료기기, 의료 정보 시스템, 자동차 안전 시스템, 항공 운항 시스템 등 다양한 분야에 걸쳐 있을 수 있습니다. 이와 같은 분야에서 취약점을 탐지하고 해결함으로써 많은 생명의 안전을 보호할 수 있다고 생각해요. 취약점 분석 및 보완을 통해 생명과 안전을 보호하는 것은 기술과 엔지니어링 능력을 활용하여 사회적으로 중요한 과제에 기여하는 의미 있는 방법인 것 같아요. Q. 힘든 상황을 이겨내는 자신만의 방법이 있나요? 힘든 상황을 극복할 만큼의 큰 동기부여, 목적이 있으면 좋지만, 없다면 휴식을 취하면서 주변 지인들과 고민상담을 하는 것이 좋은 방법인 것 같아요. 저도 고등학교 때 해킹 공부를 하면서 슬럼프가 왔었는데, 그때 당시 한동안 게임만 하면서 학교 선배들에게 조언을 많이 구했던 것 같아요. 그 과정에서 많은 위로와 자신감을 다시 얻을 수 있었고, 자연스럽게 다시 해킹을 잡게 되었어요. Q. 두 번째 학기를 맞이하며 어떤 목표를 갖고 있나요? 새 출발한다는 생각으로 학점도 열심히 챙기면서 자기계발에 집중하고 싶어요. 최근에 자동차 취약점 분석을 주제로 연구하는 랩실에서 학부연구생을 하게 되어 자동차에서 취약점을 찾고, 최종적으로 익스플로잇 하는 것을 목표로 하고 있습니다. Q. 마지막으로, 성균관대 학우분들께 한마디 부탁드립니다. 자신의 진로에 대해 깊게 고민해보는 시간이 필요한 것 같아요. 저는 해킹 공부를 시작한 후 슬럼프가 왔을 때, 많은 사람들과 이야기를 나눠보았고, 혼자 고민도 많이 했어요. 그 생각의 끝은 ‘내가 해킹으로 진로를 정하는 것이 맞는 판단일까?’ 였어요. 내가 ‘꼭’ 해킹을 해야 하는 이유를 찾는데도 오랜 시간이 걸린 것 같아요. 제가 계속 해킹을 해야겠다고 다짐한 결정적 기준은 적성이었어요. 코드를 분석할 때마다 행복하고 즐겁진 않지만, 여러 조건에 대해 따지는 것에 감각이 있어 취약점을 분석하는 과정에서 ‘여기서 이렇게 하면 취약점이 발생하지 않을까?’ 라는 여러가지 경우를 가정하고 아이디어를 발상하는 것을 남들보다 잘할 수 있다고 생각했거든요. 바쁜 생활 속에서 잠시 쉬면서 내가 가고 있는 길을 ‘꼭’ 가야 하는 이유를 고민하는 시간을 보내시면 좋을 것 같아요. 성균관대학교 학우 여러분의 미래가 밝고 희망차기를 기대합니다. 감사합니다. 성균 웹진 523호 https://webzine.skku.edu/skkuzine/section/people01.do?articleNo=109277&pager.offset=0&pagerLimit=10
-
- 작성일 2023-10-11
- 조회수 432
-
- [연구] 우사이먼성일 교수 DASH 연구실, CIKM 2023 국제 학술대회 논문 3편 게재 승인 및 이상탐지 관련 워크숍 개최
- DASH 연구실 박은주 소프트웨어학과 박사과정, Binh M. Le 소프트웨어학과 박사과정, 소프트웨어학과 융합보안대학원 조범상 석사과정, 이상용 인공지능대학원 석사과정, 백승연 인공지능대학원 석사과정, 김지원 인공지능대학원 석사과정의 논문 3편이 인공지능 및 정보검색 분야의 top-tier 국제학술대회인 CIKM (Conference on Information and Knowledge Management) 2023에 최종 논문 게재가 승인되어 10월에 발표될 예정입니다. 1.호주 CSIRO Data61과 Deepfake 관련 연구 2.신분증 진위 분류를 위한 데이터셋 관련 연구 3.Machine Unlearning 연구 또한, DASH 연구실 우사이먼성일 교수님이 주축이 되어 제 1회 위성 및 무인비행체의 이상탐지에 관한 워크샵이 CIKM 2023에서 개최됩니다. 1. Beomsang Cho, Binh M. Le, Jiwon Kim, Simon S. Woo , Shahroz Tariq, Alsharif Abuadbba, and Kristen Moore , “Toward Understanding of Deepfake Videos in the Wild”, Proceedings of the 32nd ACM International Conference on Information & Knowledge Management. 2023. 본 연구는 최근 증가하는 Deepfake 문제를 다루며, 기존 Dataset이 최신 기술을 충분히 반영하지 못하는 한계를 극복하기 위한 목적으로 시작되었습니다. 우리는 RWDF-23이라는 최신 Deepfake Dataset을 제안합니다. RWDF-23은 Reddit, Youtube, TikTok, Bilibili등에서 수집한 2,000개의 Deepfake 비디오로 구성되며, 4가지의 다른 언어를 대상으로 수집하였습니다. 이를 통하여 이전 Dataset의 범위를 확장하고, 현재 온라인 플랫폼에서 얼마나 많은 최신 Deepfake 기술들이 사용되고 있는지 분석하며 Deepfake를 제작하는 사람들의 분석뿐만 아니라 시청자들의 의견과 상호 작용 데이터를 수집하여 Deepfake를 시청하는 사람들의 상호작용 방식을 조사합니다. 이러한 풍부한 정보를 고려하여 계속해서 진화하는 Deepfake와 현실 온라인 플랫폼에 미치는 영향에 대한 포괄적인 이해를 제공합니다. Deepfakes have become a growing concern in recent years, prompting researchers to develop benchmark datasets and detection algorithms to tackle the issue. However, existing datasets suffer from significant drawbacks that hamper their effectiveness. Notably, these datasets fail to encompass the latest deepfake videos produced by state-of-the-art methods that are being shared across various platforms. This limitation impedes the ability to keep pace with the rapid evolution of generative AI techniques employed in real-world deepfake production. Our contributions in this IRB-approved study are to bridge this knowledge gap from current real-world deepfakes by providing in-depth analysis. We first present the largest and most diverse and recent deepfake dataset (RWDF-23) collected from the wild to date, consisting of 2,000 deepfake videos collected from 4 platforms targeting 4 different languages span created from 21 countries: Reddit, YouTube, TikTok, and Bilibili. By expanding the dataset’s scope beyond the previous research, we capture a broader range of real-world deepfake content, reflecting the ever-evolving landscape of online platforms. Also, we conduct a comprehensive analysis encompassing various aspects of deepfakes, including creators, manipulation strategies, purposes, and real-world content production methods. This allows us to gain valuable insights into the nuances and characteristics of deepfakes in different contexts. Lastly, in addition to the video content, we also collect viewer comments and interactions, enabling us to explore the engagements of internet users with deepfake content. By considering this rich contextual information, we aim to provide a holistic understanding of the evolving deepfake phenomenon and its impact on online platforms. 2. Eun-Ju Park, Seung-Yeon Back, Jeongho Kim, and Simon S. Woo, ”KID34K: A Dataset for Online Identity Card Fraud Detection”, Proceedings of the 32nd ACM International Conference on Information & Knowledge Management. 2023. 본 연구에서는 모바일 신분증 검증 시스템의 보안 강화를 위한 데이터셋을 제공합니다. 최근 모바일 플랫폼에서의 본인인증절차는 신분증을 기반으로 진행되고 있는데, 비대면 금융거래가 증가함에 따라 금융거래의 당사자가 신분증 명의자임을 증명하는 절차도 중요해지고 있습니다. 그러나, 현재의 시스템은 금융거래 이용자가 제출하는 사진이 본인의 신분증을 직접 찍는 것인지, 아니면 모니터나 종이에 출력한 다른 사람의 신분증 사진을 찍은 것인지 구별하지 않습니다. 본 연구는 이러한 신분증 검증 시스템의 안정성 강화라는 측면과, 또한 신분증의 개인정보 유출을 막기위한 측면 두 가지를 고려한 신분증 이미지 데이터셋을 제공합니다. Though digital financial systems have provided users with convenient and accessible services, such as supporting banking or payment services anywhere, it is necessary to have robust security to protect against identity misuse. Thus, online digital identity (ID) verification plays a crucial role in securing financial services on mobile platforms. One of the most widely employed techniques for digital ID verification is that mobile applications request users to take and upload a picture of their own ID cards. However, this approach has vulnerabilities where someone takes pictures of the ID cards belonging to another person displayed on a screen, or printed on paper to be verified as the ID card owner. To mitigate the risks associated with fraudulent ID card verification, we present a novel dataset for classifying cases where the ID card images that users upload to the verification system are genuine or digitally represented. Our dataset is replicas designed to resemble real ID cards, making it available while avoiding privacy issues. Through extensive experiments, we demonstrate that our dataset is effective for detecting digitally represented ID card images, not only in our replica dataset but also in the dataset consisting of real ID cards. 3. Sanyong Lee and Simon Woo, “UNDO: Effective and Accurate Unlearning Method for Deep Neural Networks”, Proceedings of the 32nd ACM International Conference on Information & Knowledge Management. 2023. 본 연구에서는 간단하면서 효과적인 machine unlearning 기법 UNDO를 제안합니다. 이 기법은 학습된 모델에서 한 클래스의 정보를 지우기 위해 두 스텝으로 이뤄져있습니다. 먼저 coarse-grained level로서, 잊으려고 하는 데이터에 다른 레이블을 부여하여 한 에폭(epoch)만 짧게 학습하므로서 결정 경계를 허뭅니다. 그런 다음 fine-grained level로서, 앞선 단계에서 차마 잊지 못한 데이터를 잊으면서, 남길 데이터에 대한 부작용을 개선하기 위한 학습을 합니다. 이때 남길 데이터는 학습에 사용하지 않은 소량만 사용하여 학습 속도를 빠르게 합니다. 다양한 실험을 통하여 본 논문에서 제안하는 UNDO는 기존 machine unlearning 기법들 보다 빠르고 효과적임을 보여줍니다. Machine learning has evolved through extensive data usage, including personal and private information. Regulations like GDPR highlight the "Right to be forgotten" for user and data privacy. Research in machine unlearning aims to remove specific data from pre-trained models. We introduce a novel two-step unlearning method, UNDO. First, we selectively disrupt the decision boundary of forgetting data at the coarse-grained level. However, this can also inadvertently affect the decision boundary of other remaining data, lowering the overall performance of the classification task. Hence, we subsequently repair and refine the decision boundary for each class at the fine-grained level by introducing a loss to maintain the overall performance while completely removing the class. Our approach is validated through experiments on two datasets, outperforming other methods in effectiveness and efficiency. 4. The 1st International Workshop on Anomaly and Novelty detection in Satellite and Drones systems (ANSD '23) 제 1회 위성 및 무인비행체의 이상탐지에 관한 워크샵이 CIKM 2023에서 개최됩니다. 본 워크샵은 우사이먼성일 성균관대 교수, Shahroz Tariq CSIRO’s Data61 소속, 신유진 가톨릭대 교수, 정대원 한국항공우주연구원 소속이 주축이 되어 무인비행체의 시계열 및 이미지 데이터에 대한 이상을 탐지하는 것과 관련된 내용을 주제로 합니다. The workshop on Anomaly and Novelty Detection in Drones and Satellite data at CIKM 2023 aims to bring together researchers, practitioners, and industry experts to discuss the latest advancements and challenges in detecting anomalies and novelties in drone and satellite data. With the increasing availability of such data, the workshop seeks to explore the potential of machine learning and data mining techniques to enable the timely and accurate detection of unexpected events or changes. The workshop will include presentations of research papers, keynote talks, panel discussions, and poster sessions, with a focus on promoting interdisciplinary collaboration and fostering new ideas for tackling real-world problems. 문의사항이나 질문은 DASH Lab(https://dash.skku.edu)의 우사이먼교수(swoo@g.skku.edu)에게 연락부탁드립니다.
-
- 작성일 2023-09-18
- 조회수 843
-
- [교수동정] 소프트웨어학과 김유성 교수 연구실, 2023 스펙트럼 챌린지 대회 1등
- 소프트웨어학과 김유성 교수 연구실, 2023 스펙트럼 챌린지 대회 1등 ○ CSI Lab 팀, 2020년부터 4년 연속 1등 ○ 차세대 와이파이 환경에서 효율적인 주파수 공동 사용 방안 마련 소프트웨어학과 CSI Lab. 박태건(석사과정), 나인호(학부연구원), 허찬용(인턴), 김유성 교수 팀이 한국전자통신연구원(ETRI)에서 주최하는 2023 스펙트럼 챌린지 최종결선 대회에서 1등을 거머쥐었다. 스펙트럼 챌린지는 정부 주도형 연구·개발 체계를 개방된 도전 경쟁형 연구·개발 체계로 발전시키려는 목적으로 국가연구개발계획에 의거하여 2019년도부터 매년 실시되었다. 올해 스펙트럼 챌린지는 그동안 대회에 참가한 40개 팀에서 승자전으로 진출한 우수 팀 간의 최종결선 대회로 5주간 치러졌다. 도전 문제는 2가지 유형으로 유형1은 주어진 전파 환경에서 이용 중인 전파 특성을 AI 기술을 통해 식별하는 문제이며 유형2는 동적 환경변화에 강인한 자원 할당 및 스케줄링을 위한 강화학습 알고리즘을 개발하는 문제이다. 이번 대회에서는 우리 대학을 포함하여 한양대, 한동대, 고려대가 우수 팀으로 선발되었다. 성균관대학교 CSI Lab(Computer Systems and Intelligence Lab) 팀은 인공지능 기법을 이용해 비면허 대역의 통신환경 속에서 무선 서비스 기기가 전파 이용효율을 최적화하여 통신할 수 있는 전파자원 할당 기법을 찾는 알고리즘 개발 유형2 에서 1등을 수상하였다. 특히 CSI Lab 팀은 4년 연속 1등이라는 쾌거를 이룩했다. 기사 본문 전자신문 https://www.etnews.com/20230825000155 뉴스1 https://www.news1.kr/articles/?5151113
-
- 작성일 2023-09-12
- 조회수 655
-
- [동문] 김미수 박사(지도교수 이은석), 전남대학교 인공지능학부 조교수 임용
- 전자전기컴퓨터공학과(컴퓨터공학전공) 김미수 박사(지도교수 이은석), 전남대학교 인공지능학부 조교수 임용 정보통신대학 전자전기컴퓨터공학과 (컴퓨터공학전공) 김미수 박사가 전남대학교 AI융합대학의 인공지능학부 조교수로 2023년 9월부로 임용되었다. 김미수 박사는 소프트웨어공학연구실(지도교수 이은석)에서 연구를 진행하며, 전자전기컴퓨터공학과(컴퓨터공학전공)에서 2021년 8월, Deep learning and natural language processing-based framework for information retrieval-based bug localization를 주제로 박사학위를 받았다. 그 후 소프트웨어대학 소프트웨어융합연구원에서 박사후연구원으로 2년동안 Deep Learning-based Automated Software Debuging과 Software Debugging for Deep Learning System에 대해 연구를 진행하였다. 김미수 박사는 총 17개의 우수 국제 학회 발표 실적(BK/정보과학회 우수학회 13건)과 총 3편의 SCI(E) 논문을 출판하였으며, 총 10건의 수상 내역을 보유하고 있다. 김미수 박사는 "소프트웨어공학(SE)에 AI 기술을 접목하는 연구(AI4SE), AI 기술에 소프트웨어공학 기술을 접목하는 연구(SE4AI), 환경 친화적 소프트웨어공학 등의 연구를 통해 AI융합시대에 맞는 융합 연구를 진행하고자 하며, 비교적 탄소중립에 대한 관심이 적었던 소프트에어공학 분야에서 지속가능성 향상에 대한 연구를 진행하며 사회에 기여할 수 있도록 노력하겠다"라고 포부를 밝혔다.
-
- 작성일 2023-09-01
- 조회수 850