[연구] 박호건 교수 LearnData 연구실, 지식 추론 연구 SIGKDD 2023 논문 게재 승인 (석사과정: 김수경, 김가영)
- 소프트웨어융합대학
- 조회수1980
- 2023-05-23
박호건 교수 연구실 지식 추론 연구 SIGKDD 2023 논문 게재 승인 (석사과정: 김수경, 김가영)
LearnData Lab(기계학습/데이터마이닝) 연구실(지도교수: 박호건, https://learndatalab.github.io)의 김수경(공동 1저자), 김가영(공동 1저자), 정희수 학생(석사과정)과 박호건 교수(교신저자)가 제출한 “Exploiting Relation-aware Attribute Representation Learning in Knowledge Graph Embedding for Numerical Reasoning” 논문이 인공지능 분야 최우수 학회 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD) 2023 (https://kdd.org/kdd2023/) (BK IF=4)의Research Track에서 Full Paper로 게재 승인되었고, 2023년 8월 미국 캘리포니아에서 발표될 예정입니다.
본 논문은 지식 정보를 활용한 수치 추론에 대한 주제로 작성되었습니다. 수치 추론 작업은 지식 그래프에 있는 기존의 관계 정보와 수치 속성(예: 높이)을 활용하여, 잘 알려져 있지 않은 두 가지 엔티티(Mountain A와 Mountain B)를 비교하고 다양한 속성에 대한 새로운 사실(예: A가 더 높음)을 알아 내는 것(추론)하는 것을 목표로 합니다. 그러나 기존의 대부분의 방법은 새로운 속성 인코더를 도입하거나 추가적인 손실을 감수하고 수치 값을 예측해야 하는 한계가 있으며, 수치 속성이 드물게 존재하는 경우 성능이 크게 떨어집니다. 본 논문에서는 지식 그래프에 대한 수치 추론을 강화하는 새로운 그래프 임베딩 방법인 RAKGE를 제안합니다. 제안된 방법에는 관계와 해당 수치 속성 간의 연관성을 활용할 수 있는 새로운 형태의 Representation Learning이 포함됩니다. 또한, 강력한 자기 지도 학습 방법을 도입하여 보이지 않는 긍정 및 부정 예시를 생성함으로써 숫자 속성이 희박한 경우 제안 방법의 예측을 더욱 신뢰할 수 있도록 합니다.
Spotify, 개인 신용 정보, 도시 정보 데이터셋 등 세 가지 대규모 데이터 세트에 대해 평가한 결과, 우리가 제안한 모델은 최고 경쟁사 대비 최대 65.1%의 히트율(Hits@1)과 최대 52.6%의 MRR을 달성하며 다른 최신 경쟁 알고리즘보다 뛰어난 성능을 보였습니다.
[논문 정보]
Exploiting Relation-aware Attribute Representation Learning in Knowledge Graph Embedding for Numerical Reasoning
Sookyung Kim+, Gayoung Kim+, Ko Keun Kim, Suchan Park, Heesoo Jung, Hogun Park*
ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD) 2023. Full Paper (Research Track). [+ Means Equal Contribution.]
[Abstract] Numerical reasoning is one of the essential tasks to support machine learning applications such as recommendation and information retrieval. The reasoning task aims to compare two items and infer the new facts (e.g., is taller than) by leveraging existing relational information and numerical attributes (e.g., the height of an entity) in knowledge graphs.
However, most existing methods are limited to introducing new attribute encoders or additional losses to predict the numeric values and are not robust when numerical attributes are sparsely available. In this paper, we propose a novel graph embedding method named RAKGE, which enhances numerical reasoning on knowledge graphs. The proposed method includes relation-aware attribute representation learning, which can leverage the association between relations and their corresponding numerical attributes. Additionally, we introduce a robust self-supervised learning method to generate unseen positive and negative examples, thereby making our approach more reliable when numerical attributes are sparse. Evaluated on three real-world datasets, our proposed model outperforms state-of-the-art methods, achieving an improvement of up to 65.1% in Hits@1 and up to 52.6% in MRR compared to the best competitor.