-
- [연구] 데이터 지능 및 학습 연구실(지도교수: 이종욱) SIGIR 2025 논문 3편 게재 NEW
- 데이터 지능 및 학습(Data Intelligence and Learning, DIAL, 지도교수: 이종욱) 연구실은 세계 최고 권위의 정보검색 학회인 SIGIR 2025에 3편의 논문이 최종 게재 승인되었으며, 7월에 이탈리아 파도바에서 논문을 발표할 예정입니다. [논문 목록] 1. Why is Normalization Necessary for Linear Recommenders? (SIGIR'25) 2. Linear Item-Item Models with Neural Knowledge for Session-based Recommendation (SIGIR'25) 3. DIFF: Dual Side-Information Filtering and Fusion for Sequential Recommendation (SIGIR'25) 연구 1 : Seongmin Park, Mincheol Yoon, Hye-young Kim, Jongwuk Lee, “Why is Normalization Necessary for Linear Recommenders?”, The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025 본 연구는 선형 오토인코더 (linear autoencoder, LAE) 기반 추천 시스템이 간단한 구조에도 불구하고 신경망 기반 모델과 비교할 만한 추천 성능과 빠른 추론 속도를 보인다는 점에 착안하였습니다. 그러나 LAE는 인기 있는 아이템을 과도하게 추천하는 인기도 편향 (popularity bias)와 지역적인 아이템 간 상관관계에 지나치게 의존하는 이웃 편향 (neighborhood bias)라는 두 가지 구조적 한계에 직면해 있습니다. 이러한 문제를 해결하기 위해, 본 논문에서는 LAE 모델에 적용할 수 있는 새로운 정규화 방법인 Data-Adaptive Normalization (DAN)을 제안합니다. DAN은 데이터의 특성에 따라 두 가지 bias를 유연하게 제어할 수 있도록 설계된 정규화 기법으로, (i) item-adaptive normalization과 (ii) user-adaptive normalization이라는 두 가지 핵심 컴포넌트로 구성됩니다. 첫 번째로, item-adaptive normalization은 정규화 파라미터 α를 통해 인기 아이템의 영향력을 조절하고 LAE에 denoising 효과를 부여합니다. 이를 통해 기존 LAE가 주로 추천하던 인기 아이템 (head items) 중심의 성능에서 벗어나 (즉, 인기도 편향), 비인기 아이템 (tail items)에 대한 추천 성능을 크게 향상시킬 수 있습니다. 두 번째로, user-adaptive normalization은 파라미터 β를 사용하여 이웃 편향을 제어합니다. 이 기법은 고주파수 성분 (high-frequency components)을 억제하고 중요한 저주파수 성분을 보존함으로써, 지역적인 상관관계보다 전체적인 글로벌 패턴을 더 잘 반영하도록 도와줍니다. DAN의 효과는 여섯 개의 대표적인 추천 데이터셋 (ML-20M, Netflix, MSD, Gowalla, Yelp2018, Amazon-book)에서 실험적으로 검증되었습니다. DAN을 적용한 LAE 모델들 (LAE_DAN, EASE_DAN, RLAE_DAN)은 모든 데이터셋에서 기존 LAE 모델 대비 일관된 성능 향상을 보였으며, tail 아이템과 unbiased 평가에서 최대 각각 128.57%와 12.36%의 성능 향상을 기록하였습니다. 또한 DAN은 최신 협업 필터링 모델들과 비교했을 때도 우수한 성능을 나타냈습니다. 또한, 그림 1 (Case study)은 정규화 방법에 따른 특정 사용자의 추천 결과를 보여주며, 다음과 같은 관찰을 했습니다. (1) 정규화 없는 LAE (W/O)는 사용자가 로맨틱 영화 3편을 시청했음에도 5개 모두 높은 인기도의 액션 영화만 추천합니다. 반면, 세 가지 정규화 방법 (RW, Sym, DAN)은 사용자가 본 "Step Up 1"과 관련된 "Step Up 2"를 최상위로 추천하여 사용자 선호도를 효과적으로 반영합니다. (2) DAN은 인기도 편향을 적절히 완화하면서도 사용자 선호도를 유지하는 가장 균형 잡힌 추천을 제공합니다. RW 정규화는 5개 중 4개가 인기 아이템으로, 여전히 인기도 편향이 강합니다. Sym 정규화는 5개 중 4개가 인기 없는 아이템으로, 인기도 편향을 과도하게 완화합니다. DAN은 인기 및 비인기 아이템의 균형을 맞추면서 사용자 선호도에 가장 관련성 높은 아이템을 추천합니다. 그림 1: ML-20M 데이터셋에서 사용자 #91935의 상호작용 이력과 네 가지 정규화 방법의 Top-5 추천 목록. 빨간 테두리는 head (상위 20%) 항목이고, 파란 테두리는 tail (하위 80%) 항목 나아가 본 연구는 데이터셋의 Gini index와 homophily 특성에 따라 정규화 파라미터 (α, β)의 효과가 어떻게 달라지는지 분석하고, 각 데이터셋에 적합한 파라미터 설정 가이드라인도 함께 제시합니다. 이를 통해 제안된 DAN 기법은 데이터 특성에 따라 정교하게 bias를 제어할 수 있는 일반적이고 실용적인 솔루션으로 자리매김할 수 있음을 보여줍니다. 본 논문에 관한 자세한 내용은 다음 주소를 참고해주세요. https://dial.skku.edu/blog/2025_dan 연구 2 : Minjin Choi, Sunkyung Lee, Seongmin Park, Jongwuk Lee, “Linear Item-Item Models with Neural Knowledge for Session-based Recommendation”, The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025 본 연구는 사용자의 현재 세션 내 상호작용을 기반으로 다음 행동을 예측하는 세션 기반 추천(Session-based Recommendation, SBR) 문제에 주목합니다. SBR 분야는 크게 두 가지 패러다임으로 나뉩니다. 하나는 복잡한 순차적 전이 패턴을 포착하는 데 강점을 보이는 신경망 기반 모델이며, 다른 하나는 아이템 간의 동시 등장 패턴을 효과적으로 학습하고 빠른 추론 속도를 제공하는 선형 아이템-아이템 모델입니다. 그러나 각 패러다임은 서로 다른 종류의 아이템 관계를 포착하는 데 특화되어 있으며, 신경망 모델의 높은 정확성과 선형 모델의 효율성을 동시에 달성하기 위한 효과적인 통합 방안은 아직 부족한 실정입니다. 이러한 배경 하에, 본 논문에서는 선형 모델과 신경망 모델의 지식을 효과적으로 통합하는 새로운 SBR 모델인 LINK (Linear Item-Item model with Neural Knowledge)를 제안합니다. LINK는 두 가지 유형의 지식을 하나의 통합된 선형 프레임워크 내에서 결합하여, 높은 정확도와 빠른 추론 속도라는 두 마리 토끼를 잡는 것을 목표로 합니다. 이를 위해 LINK는 두 가지 핵심 구성 요소를 포함합니다. (i) LIS (Linear knowledge-enhanced Item-item Similarity model)는 자기 증류(self-distillation) 기법을 통해 선형 모델 자체의 아이템 유사성(동시 등장) 포착 능력을 강화하고 세션 간의 고차원적 관계까지 학습합니다. (ii) NIT (Neural knowledge-enhanced Item-item Transition model)는 사전 학습된 임의의 신경망 모델로부터 복잡한 순차적 전이 지식을 증류하여, 이를 선형 모델 학습 시 정규화 항으로 활용하는 독창적인 방식을 통해 신경망의 지식을 선형 모델에 효과적으로 주입합니다. 그림 2에서 보이는 바와 같이, LINK 모델의 효과는 Diginetica, Retailrocket, Yoochoose 등 여섯 개의 실제 SBR 데이터셋을 사용한 광범위한 실험을 통해 검증되었습니다. 실험 결과, LINK는 모든 데이터셋에서 기존의 최첨단 선형 SBR 모델들(SLIST, SWalk 등) 대비 일관되고 큰 폭의 성능 향상(Recall@20 기준 최대 14.78%, MRR@20 기준 최대 11.04%)을 달성했습니다. 이는 선형 모델의 한계를 신경망 지식 통합을 통해 성공적으로 극복했음을 보여줍니다. 더불어 LINK는 복잡한 최신 신경망 모델들과 비교했을 때도 경쟁력 있는, 혹은 더 우수한 예측 정확도를 보이면서도, 선형 모델의 핵심 장점인 높은 추론 효율성(최대 813배 적은 FLOPs)을 그대로 유지하였습니다. 추가 분석을 통해 선형 모델이 비인기 아이템 간의 관계에 강점을 보이고 신경망 모델이 인기 아이템의 복잡한 패턴에 강점을 보이는데, LINK가 이 두 가지 강점을 효과적으로 결합하여 균형 잡힌 성능을 달성함을 확인했습니다. 그림 2: 정확도(Recall@20)와 추론 연산량(FLOPs) 비교 결론적으로, LINK는 SBR 분야에서 정확성과 효율성 사이의 실질적인 균형점을 제공하는 새로운 하이브리드 접근 방식을 제시합니다. 특히 NIT 컴포넌트는 특정 신경망 아키텍처에 구애받지 않고 다양한 모델의 지식을 활용할 수 있는 유연성을 제공하여, 향후 신경망 모델의 발전에 따라 지속적으로 성능 개선이 가능한 실용적인 솔루션입니다. 본 논문에 관한 자세한 내용은 다음 주소를 참고해주세요. https://dial.skku.edu/blog/2025_link 연구 3 : Hye-young Kim, Minjin Choi, Sunkyung Lee, Ilwoong Baek, Jongwuk Lee, “DIFF: Dual Side-Information Filtering and Fusion for Sequential Recommendation”, The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025 본 연구는 사용자의 과거 소비 이력을 바탕으로 다음에 선호할만한 항목을 예측하는 순차적 추천(Sequential Recommendation)에서 카테고리, 브랜드 등 아이템 부가 정보를 함께 활용하는 부가 정보 통합 순차적 추천(Side-information Integrated Sequential Recommendation, SISR)모델을 제안합니다. 제안 모델인 Dual Side-Information Filtering and Fusion (DIFF)는 사용자 시퀀스 내 노이즈를 제거하고, 다양한 속성 정보를 효과적으로 융합함으로써 더욱 정밀하고 표현력 있는 사용자 선호 모델링을 달성합니다. DIFF는 다음과 같은 세 가지 핵심 기법을 포함합니다: 그림 3: 부가 정보 통합 순차적 추천 시스템의 주파수 신호와 융합 기법 (1) 주파수 기반 노이즈 필터링 (Frequency-based Noise Filtering): DIFF는 우발적 클릭 또는 단기적 관심과 같이 실제 사용자 선호와 관련없는 신호를 제거하기 위해 주파수 영역으로의 변환을 수행합니다. 아이템 ID와 각 속성 시퀀스를 각각 주파수 영역으로 변환한 뒤, 불규칙적이거나 중요도가 낮은 주파수 성분을 제거합니다. 이를 통해 실제 사용자 선호를 반영하는 핵심 신호만을 강화할 수 있으며, 다중 시퀀스에 대해 필터링을 적용함으로써 보다 정교한 노이즈 제거를 가능하게 합니다. (2) 이중 멀티시퀀스 융합 (Dual Multi-sequence Fusion): 노이즈가 제거된 시퀀스들을 효과적으로 통합하기 위해, DIFF는 서로 다른 장점을 지니는 중간 융합과 초기 융합 방식을 함께 활용합니다. 저희는 기존 연구들이 정보 침식(information invasion) 문제를 우려하여 초기 융합 방식의 활용은 제한하거나 배제하는 경향이 있었으며, 이로 인해 다양한 속성 간 상관관계 모델링 능력을 간과하고 있다는 점에 주목하였습니다. DIFF는 초기 융합을 통해 다차원 속성 정보를 통합하고, 중간 융합을 통해 ID 중심의 선호 학습을 보완함으로써, ID와 속성 모두를 아우르는 정교한 사용자 표현을 학습합니다. 두 융합 방식의 상호보완적 조합을 통해 DIFF는 사용자 취향의 전반적인 구조뿐만 아니라 세부적인 속성 선호까지도 효과적으로 포착할 수 있습니다. (3) 정보 침식(information invasion) 방지를 위한 표현 정렬(representation alignment): 아이템 ID와 각 속성 임베딩은 서로 다른 표현 공간에 위치합니다. 따라서 이를 단순한 융합 함수(e.g. summation, concatenation, gating)로 합치는 초기 융합에서는 특정 정보가 과도하게 강조되거나 왜곡되는 정보 침식(information invasion) 문제가 발생할 수 있습니다. 이를 방지하기 위해 DIFF에서는 정렬 손실(Alignment Loss)을 설계하여, 아이템 ID와 속성 임베딩의 벡터 공간을 가깝게 만들어, 의미를 공유하면서도 적절한 차이를 유지할 수 있도록 유도합니다. DIFF는 네 개의 대표적인 공개 벤치마크 데이터셋(Yelp, Beauty, Toys, Sports)에서 검증되었으며, 기존 최신 순차 추천 모델들과 비교해 모든 지표에서 우수한 성능을 달성하였습니다. 특히, Recall@20과 NDCG@20 기준으로 각각 최대 14.1%, 12.5%의 성능 향상을 기록하며 새로운 state-of-the-art 성능을 입증하였습니다. 또한, DIFF의 노이즈에 대한 강건성(robustness)은 매우 두드러졌습니다. 사용자 시퀀스에 우발적인 클릭, 일시적인 관심 변화 등 현실적인 사용 환경에서의 노이즈를 고려해 테스트 시퀀스에 무작위로 아이템을 교체하는 방식으로 노이즈 시뮬레이션 실험을 진행하였습니다. 그 결과, DIFF는 5%의 낮은 노이즈 조건에서도 타 모델 대비 가장 적은 성능 저하를 보였으며, 25%의 높은 노이즈 조건에서도 안정적으로 높은 성능을 유지했습니다. 본 논문에 관한 자세한 내용은 다음 주소를 참고해주세요. https://dial.skku.edu/blog/2025_diff
-
- 작성일 2025-04-22
- 조회수 92
-
- [일반] 김장현 교수 칼럼 [김장현 이제는 AI시대] ‘엣지 있는’ 엣지AI NEW
- 흔히 인공지능(AI)은 사용자가 입력한 데이터를 서버나 클라우드로 가져가서 그것을 AI모델에 집어넣어 처리한 결과물을 돌려보내는 방식으로 활용된다. 최근에는 보안, 프라이버시 보호 등을 위해 데이터가 생성된 단말기 자체에서 바로 AI 처리를 하는 기술이 등장했는데 그것을 흔히 엣지AI(Edge AI)라고 부른다. 엣지AI의 장점은 개인정보를 보호하기 쉽다는 것이다. 개인정보를 외부로 보내려면 본인의 동의, 법적 규제에 맞는 암호화 등을 거쳐야 하는데 개인정보를 보호하기 위한 가장 좋은 방법은 민감한 정보가 사용자의 스마트폰과 같은 단말기를 떠나지 않게 하는 것이다. 엣지AI 덕분에 인터넷 연결이 없이도 AI를 활용한 데이터 처리가 가능해진다. 데이터를 보낼 필요가 없으니 네트워크 부하도 줄일 수 있는 것은 덤이다. 데이터를 보내는 시간이 소요되지 않으니 즉각적인 처리가 가능해지고 데이터의 압축, 원격처리, 전송 등에 필요한 자원이 소모되지 않기 때문에 전력도 절약할 수 있다. 인터넷 접속이 불가능한 지역이나 총탄이 난무하는 전장에서도 엣지AI는 즉석에서 문제를 해결하는 역할을 할 수 있다. 스마트폰에 에지AI를 사용하면 카메라로 찍은 이미지를 실시간으로 바꿔주거나, 이용자의 얼굴을 인식하고, 실시간 통역을 제공할 수 있다. 스마트워치에서는 실시간 건강 모니터링, 심박수 분석, 수면패턴 분석 등이 가능하다. 자동차나 드론에 엣지AI를 이용하면 이동경로를 최적화하거나 과속방지턱 등 장애물을 신속하게 인식할 수 있다. 특히 AI를 내장한 자동차가 갑자기 등장한 동물이나 장애물을 인식하여 운전자, 승객은 물론 지나가는 보행자까지 보호하는 방향으로 핸들을 꺾으며 제동함으로써 사고를 방지할 수도 있다. 기기 자체에서 AI를 활용하게 되면서 실시간 감지와 판단, 행동이 가능해진 것이다. 제조업에서 엣지AI를 활용하면 생산라인의 고급기술이 외부에 유출되는 것을 막을 수도 있다. 산업용 로봇이 오작동하면서 발생할 수 있는 피해도 실시간 감시가 가능해져 막을 수 있고 부실 원자재가 섞여 들어가서 나타나는 불량품도 조기에 감지·제거할 수 있다. 국방분야도 엣지AI를 활용하면 적의 전파방해 등으로 인한 작전상 문제를 최소화할 수 있다. 전투장비들이 원격으로 본부의 통제를 받는 경우 본부가 파괴되거나 통신회선이 두절되면 아무것도 할 수 없게 된다. 이때 자율적 의사결정을 할 수 있는 AI가 기기 자체에 탑재되어 있다면 통신두절을 극복하고 소기의 목적을 달성할 수 있다. 엣지AI가 5G 또는 미래의 6G 통신기술과 결합한다면 초고속 서비스가 가능한 분산형 AI가 현실화될 것이다. 엣지AI가 농업과 만난다면 사막에서도 농작물을 재배할 수 있는 기술이 등장할 수 있고, 의료에 적용되면 전기와 통신망이 없는 오지에서도 인명을 구하기 위한 수술을 할 수 있을 것이다. 다양한 산업을 위해 정교하게 다듬어진 엣지AI가 널리 활용된다면 기존 산업에서 넘을 수 없었던 장벽이 무너져 내리고 새로운 일자리가 생겨날 것이다. 다른 한편으로 엣지AI는 단말기 내에서 동작하기 때문에 복잡한 AI모델을 실행하기에는 역부족인 경우가 많다. AI모델을 경량화하다 보면 성능을 낮출 수밖에 없고, 그러한 부분을 보강하기 위해 수시로 온라인에 접속해 업데이트할 경우 민감한 데이터가 유출될 위험도 있다. 다양한 형태의 엣지AI를 아우르는 기술표준도 정립되지 않아 정착되기까지 시간이 좀 더 필요하다. 이 글을 읽는 독자들도 아시다시피 영어에서 엣지란 뾰족함, 모서리라는 뜻이다. 지난 2009년 국내 한 드라마에서 주인공이 사용한 '엣지 있는'이란 표현이 유행하면서 한국적 표현으로 널리 쓰이게 되었다. 영어의 최첨단(cutting edge)이라는 말을 기반으로 뭔가 세련되고 멋지다는 뜻으로 변용한 것인데, 엣지AI 기술이 꾸준히 성장한다면 정말 '엣지 있는' 기술이 될 것 같다. 김장현 성균관대 글로벌융합학부 교수 출처: <파이낸셜뉴스 4월 20일> https://www.fnnews.com/news/202504201812050782
-
- 작성일 2025-04-21
- 조회수 106
-
- [일반] 김장현 교수 칼럼 [김장현의 테크와 사람] 〈73〉AI로 행복찾기 NEW
- 니컬러스 크리스태키스, 제임스 파울러가 저술한 '행복은 전염된다'는 책을 보면, 행복감은 인간관계를 타고 전염되는 특성을 보인다. 주변에 행복한 사람이 많을수록 본인도 행복할 확률이 올라가는 것이다. 역으로 내가 행복해지면 주변인까지 덩달아 행복해질 확률이 올라간다. 개인의 행복감과 연관된 요인에는 소득도 있다. 소득이 일정 수준까지 늘어날수록 행복감도 비례해서 올라가는 특성을 보이지만, 그 수준을 넘어서면 소득이 더 올라도 행복감은 늘지 않고 정체되는 경향을 보인다. 1974년 미국의 경제학자 리처드 이스털린은 여기서 한걸음 더 나아가 부유한 국가에 사는 사람들이 가난한 국가 국민들보다 더 행복하다는 증거가 뚜렷하지 않다고 주장했다. 한 국가의 국민소득이 일정 수준을 넘어서면, 국민들의 평균적인 행복수준은 오히려 정체되는 경향을 보인다고 했다. 이러한 이스털린의 주장을 '이스털린 패러독스'라고 하며 많은 학자들은 이 현상의 원인에 관해 다양한 학설을 내놓고 있다. 첫째, 사람들은 소득이 늘어나도 잠시만 행복해할 뿐, 그러한 변화가 일상이 되면 무감각해지기 마련이다. 이 현상은 쾌락 적응 또는 적응 수준 이론이라 불리운다. 경제학에서 한계효용 체감의 법칙, 즉 한 사람이 재화나 서비스를 추가로 소비함에 따라 느끼는 주관적인 만족도의 증가분은 점차 감소한다는 법칙과 유사한 해석이라고 할 수 있다. 둘째, 소득이 증가함에 따라 사람들의 눈높이 역시 함께 상승하기 때문에, 높아진 기대치를 충족하지 못하면 소득이 늘어도 행복감이 늘지 않는다는 주장이 있다. 우리 나라 실정에 부합하는 관점이다. 셋째, 사람들은 자신의 절대적인 소득금액보다는 직장 동료, 동네 이웃, 혈연관계가 있는 사람들과 비교한 상대적인 수준 차이에 더 큰 영향을 받는다는 주장이다. 사회적 비교이론, 상대소득 가설 등으로 불리우는 관점은 왜 선진국에 사는 사람들의 행복감이 지구상 최빈국보다 높지 않은 경우가 종종 나타나는지 잘 설명해 주고 있다. 넷째, 욕구의 종류가 영향을 준다는 설명이다. 의식주와 같은 기본적 욕구가 충족되고 나면 건강, 사회적 관계, 일과 여가의 균형 등과 같은 소득 외 요인들의 중요성이 더 부각되기 마련이다. 비물질적 가치는 소득과 같은 물질적 가치가 충족시켜 주기 어렵다. 그렇다면, 인공지능(AI) 시대를 맞아 우리는 어떻게 행복을 찾아 나서야 할까? AI와 대화를 하면 할수록 AI는 당신의 취향과 연령, 성별, 교육 수준 등을 고려해 어떻게 하면 스트레스를 줄이고 행복감을 올릴 수 있을지 철저히 당신에게 특화된 행복 달성법을 코칭해줄 수 있을 것이다. 이렇게 개인화된 추천시스템의 등장은 정신 건강에 투자하기 인색한 우리 사회의 삭막한 풍토를 극복할 수 있는 방법이 될 것이다. 또 정책 당국이나 국회의 입장에서, 국민의 행복도를 올리기 위한 다양한 정책의 효과를 AI의 힘을 빌어 미리 시뮬레이션해 볼 수 있을 것이다. 국민의 삶의 질을 높이기 위한 다양한 정책 시뮬레이션은 기본소득, 맞춤형 복지정책, 근무시간 단축, 사회적 기업정책 등에 활용될 수 있다. 경제적 자원을 최적화해서 배분하는 것도 AI가 잘하는 영역 중 하나다. 특정 지역에 지하철을 놓는다면, 그로 인한 혜택은 투자액에 대비해 쓸모있는 것인지 미리 평가해 볼 수 있다. 가축 전염병의 창궐을 예방하기 위해 어디에 어떤 투자를 해야할지 결정하는 것도 가능하다. AI는 직장을 찾지 못한 사람들에게 개인의 특성을 반영한 자격증 취득, 경력쌓는 방법 등을 조언할 수 있다. 이렇게 AI는 인간의 일자리를 빼앗기만 하는 것은 아니며 오히려 행복을 찾는 도구로 쓰일 수도 있다. 김장현 성균관대 교수 출처: <전자신문 4월 17일> https://www.etnews.com/20250417000024
-
- 작성일 2025-04-21
- 조회수 98
-
- [동문] 교수보다 동행자, 함께 꿈꾸는 성균인 - 컴퓨터교육과 민무홍 교수(컴공 03) NEW
- 교수보다 동행자, 함께 꿈꾸는 성균인-컴퓨터교육과 민무홍 교수(컴공 03)
-
- 작성일 2025-04-16
- 조회수 159
-
- [교수동정] 글로벌융합학부 홍주화 교수, SBS <그것이 알고 싶다> 출연 NEW
- 글로벌융합학부 홍주화 교수가 SBS '그것이 알고 싶다'에 출연해 인공지능 관련 주제로 인터뷰를 진행했다.
-
- 작성일 2025-04-16
- 조회수 153
-
- [일반] 2025 실감미디어 겨울학교 성료
- 메타버스 융합대학원 인력양성 사업(류은석 단장)의 일환으로 지난 2월 24일부터 25일까지 우리 대학 인사캠에서 열린 ‘2025 실감미디어 겨울학교’가 성황리에 마무리됐다.이번 행사는 ‘가상 세계를 만드는 멀티모달 AI와 3D 생성 및 재구성 기술’이라는 주제로 개최됐으며, 멀티모달 AI 및 3D 기술의 최신 연구 동향과 실습이 어우러진 유익한 프로그램으로 구성됐다. 행사의 첫날은 홍성은 교수의 ‘멀티모달 AI의 원리와 응용’ 강연으로 시작됐다. 홍성은 교수는 멀티모달 AI의 핵심 개념과 주요 트렌드를 설명하며, 서로 다른 모달리티를 융합하는 다양한 방법과 응용 사례를 소개했다. 이어서 이상민 교수의 ‘멀티모달 AI 응용: 시각, 언어, 오디오 연결’ 강연이 진행됐으며, 다양한 데이터 표현 방식과 이를 활용한 문제 해결 방법이 논의됐다. 이어서 진행된 이경호 교수의 3D 디지털 휴먼 관련 강연에서는 ‘현실을 재현하는 3D 디지털 휴먼 기술’이라는 주제로 3D 스캔 및 모델링, 애니메이션 기술을 활용한 디지털 휴먼 제작 과정과 활용 사례를 설명했다. 참가자들은 언리얼 엔진의 Metahuman을 활용한 실제 사례를 통해 기술적 이해도를 높일 수 있었다. 둘째 날에는 생성형 AI를 활용한 가상 캐릭터 동작 생성 및 3D 공간 재구성 기술이 집중적으로 다뤄졌다. 이경호 교수는 ‘생성형 AI 기반 가상 캐릭터 동작 생성’ 강연을 통해 텍스트 기반 음성 및 동작 생성 기술을 설명하며, 가상 캐릭터의 자연스러운 표현 방식에 대해 논의했다. 이후 정종범 연구원이 ‘이미지 기반 3차원 재구성’ 강연에서 Structure-from-Motion(SfM) 및 Neural Radiance Fields(NeRF) 기술을 기반으로 한 3D 공간 재구성 기법을 소개했다. 오후 세션에서는 최근 주목받고 있는 Gaussian Splatting(GS) 기술을 주제로 발표가 진행됐다. 최재열 연구원이 ‘Gaussian Splatting 핵심 개념’ 강연을 통해 GS의 기본 원리를 설명한 데 이어, 박준형 연구원이 ‘Gaussian Splatting 최신 연구 동향’을 발표하며 대형 동적 공간 표현 및 렌더링 성능 향상 기술을 소개했다. 마지막으로 진행된 ‘Gaussian Splatting 실험 환경 셋업 및 실습’ 세션에서는 참가자들이 직접 GS 학습 모듈을 빌드하고 실시간 3D 공간을 렌더링하는 실습을 진행하며 기술 적용 방법을 체험할 수 있었다. 소프트웨어융합대학 실감 미디어공학과 주최로 개최된 이번 겨울학교 프로그램은 지능형멀티미디어연구센터, 한국방송미디어공학회의 지원을 받아 성사됐다. 행사에 참여한 한 연구자는 “이론뿐만 아니라 실습까지 포함된 프로그램이 매우 유익했다”라며 “실감 미디어 기술의 발전 가능성을 실감할 수 있는 자리였다”라고 소감을 전했다. 실감 미디어 및 AI 기술의 혁신을 이끌어 갈 연구자들의 적극적인 교류와 참여 속에 막을 내린 ‘2025 실감 미디어 겨울학교’는 앞으로도 매년 겨울방학 기간 동안 정기적으로 진행될 예정이다.
-
- 작성일 2025-04-09
- 조회수 392
-
- [연구] LAMDA Lab 박혜진, 이지윤 학생(지도교수 : 오하영), PAKDD(Pacific-Asia Conference on Knowledge Discovery and Data Mining) 학회 논문 게재
- 오하영 교수 연구실 LAMDA Lab에서 박혜진, 이지윤 학생이 발표한 FinTab-LLaVA: Finance Domain-Specific Table Understanding with Multimodal LLM using FinTMD 논문이 PAKDD (Pacific-Asia Conference on Knowledge Discovery and Data Mining)의 Full Paper로 Accept되어 Oral Presentation을 진행하게 되었다. 논문의 내용은 금융 도메인 특화 멀티모달 LLM인 FinTab-LLaVA 개발에 관한 연구로, 금융 테이블 데이터셋 FinTMD를 구축하고, Curriculum Learning 방식을 적용해 금융 도메인 지식 학습 및 테이블 이해 능력을 단계적으로 강화하여 금융 테이블 기반 질의응답, 사실 검증, 설명 생성 태스크에서 우수한 성능을 보이는 모델을 소개한다. PAKDD (Pacific-Asia Conference on Knowledge Discovery and Data Mining)는 1997년 첫 개최되어 올해로 29회를 맞은 데이터 과학, 데이터 마이닝, 지식 발견 분야의 권위 있는 학회로, 오는 6월 10일부터 6월 13일까지 호주 시드니에서 개최된다.
-
- 작성일 2025-04-09
- 조회수 704
-
-
-
- [연구] 김재광 교수 연구실(기계지능연구실, mainLab.), The 48th International ACM SIGIR 2025 논문 게재 승인
- 김재광 교수 연구실(기계지능연구실, mainLab.), The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval 논문 게재 승인 기계지능연구실 (지도교수: 김재광, https://mainlab.skku.edu)의 이남준(석사과정) 학생과 김재광 교수가 진행한 "SEALR: Sequential Emotion-Aware LLM-Based Personalized Recommendation System" 논문이 Information Retrieval 및 Intelligence 분야 에서 최우수 학술대회인 ACM SIGIR 2025 Short paper에 게재 승인되었습니다. 이번 연구는 감정 인식 기반 순차적 LLM 개인화 추천 시스템(SEALR)을 제안합니다. SEALR은 사용자 리뷰를 분석하여 시간 순서에 따른 감정 변화를 추적하고, 이를 기반으로 감정 레이블을 추출합니다. 이러한 감정 정보는 사용자의 선호도 변화를 보다 정밀하게 반영할 수 있도록 도와줍니다. 특히 사용자의 행동 데이터를 기반으로 생성된 후보 아이템과 감정 정보를 LLM에 통합 입력하여 개인화된 추천 결과를 도출하는데, 다양한 후보 아이템 수와 LLM 미세 조정 비율을 실험 변수로 설정해, 추천 정확도와 탐색 사이의 최적 균형을 탐색하였다는 점에서 의미가 있습니다. 아마존 리뷰 데이터를 활용한 실험 결과, SEALR은 기존 추천 방식 대비 의미 있는 성능 향상을 보였으며, 감정 정보와 행동 데이터의 통합이 추천 품질 향상에 효과적임을 확인했습니다. Abstract Large Language Models (LLMs) have demonstrated exceptional performance across various natural language processing tasks, driving significant advancements in language understanding and generation. However, their applicability in recommendation systems remains an area that requires further investigation. This study proposes the Sequential Emotion-Aware LLM-Based Personalized Recommendation System (SEALR) to harness this potential. SEALR applies sentiment analysis to user-generated textual reviews to sequentially track emotional changes for each user and extract sentiment labels. In addition, we design a novel framework that integrates candidate items generated by sequential models with user behavior data into an LLM to provide more precise and personalized recommendations. Our experiments investigate the impact of varying candidate pool sizes and instruction-based fine-tuning ratios, adopting an experimental methodology to optimize the trade-off between recommendation accuracy and exploration. To validate the effectiveness of the proposed approach, we conducted comparative experiments using Amazon datasets against existing recommendation methods, demonstrating meaningful performance improvements. Specifically, the combination of sentiment information and user behavior data contributed to enhancing recommendation performance, demonstrating the potential to accommodate diverse user preferences and contexts.
-
- 작성일 2025-04-09
- 조회수 518