1월 3주차 그래프 오마카세

Examining graph neural networks for crystal structures: limitations and opportunities for capturing periodicity

[https://arxiv.org/abs/2208.05039]

material 산업에서 gnn 이 활용되고 있다는 사실 알고계실까요? 반도체 디자인을 위해 강화학습과 GNN을 결합하여 진행하는 시나리오도 있는데요. 반도체는 원자 배열에 따라 전하의 이동을 받는데, 원자 배열 또한 원자-원자 간 그래프 형태로 표현이 되기 때문에 이를 전하이동 최적화측면으로 접근한다고 하네요.

논문의 저자는 이처럼 원자 배열의 중요성에 대해 강조하며 material 산업에서의 GNN 의 역할에 대해 논의합니다. 과연 GNN이 기존 human-designed descriptors 의 특성 정량화를 잘 할것인가? 가 주 research question 이라고 보시면 될 것 같습니다.

정량화를 ‘잘’ 한다는 것은 결국 화합물 구조의 특성을 벡터로 잘 표현한다라는 것과 동일한 의미인데요. 이 때 화합물 구조 특성 추출할 때 발생하는 GNN 의 한계점으로 다음 2가지를 언급합니다.

  1. capture lattice constants
  2. 격자 구조로 표현된 분자구조에서의 공간정보 또한 중요하다 라는 의미를 내포하고 있습니다. 예를 들면 ) H-H-H 등 모두 동일한 원자 정보를 가진 화합물일지라도, 어떤 H로 연결되어있으며 그 연결의 각도 그리고 몇번째 depth에 속해있는가와 같은 3D 입체적인 정보를 반영하게 된다면 전혀 다른 조합이 탄생한다는거죠. 이를 기존에는 많이 간과하고 있으므로 본 논문에서는 그 문제점을 어떻게 해결할 것인가에 대해 아이디어를 제시합니다.
  3. long-range information ,readout-function
  4. neighborhood aggregation 을 통해 hop 간의 정보가 전달이 되긴합니다. 허나, 3-hop 이상의 거리가 있는 노드 정보를 받아올 때 여러 정보들이 결합됨으로써, 본연의 정보를 잃고 전달이 되곤하는데요. 이 문제를 어떻게 해결할 것인가에 대해 아이디어를 제시합니다.

material , physics 에 관심있는 분들이 보시면 좋을 논문 같습니다. 왜 gnn 이 lattice 구조에서 강한가 부터 시작해서 어떤 요소들이 prediction에 유리한지, 와 같은 전반적인 청사진을 파악하기에 좋은 논문이라 생각됩니다. (많은 내용이 담겨있는 만큼 논문의 양 또한 방대합니다..무려 49p)

On the Ability of Graph Neural Networks to Model Interactions Between Vertices

[https://arxiv.org/abs/2211.16494]

vertex - vertex 간의 interaction 또한 예측성능에 중요한 재료라고 할 수 있습니다. 기존에는 어떤 vertex가 removed 되었을 때, prediction performance 가 오르고 내리고를 관찰하며 중요도를 산정했다면, 본 논문에서는 vertex 를 연결하는 edge 의 중요도를 산정하기 위한 아이디어를 제시합니다.

Walk Index Sparsification(WIS) 라는 아이디어 입니다. large-scale graph에서 발생하는 overload for memory, runtime 를 서두에 꺼내면서 전체 overall graph 보다 partitioning graph 중에서도 중요한 노드,엣지들을 보존한다면 비교적 연산량이 적기 때문에 효율적이다.라는 proof , reference 로 motivation을 전개해놓았습니다.

partition → WIS measurement 적용 → performance 체크 → edge remove 과정이 진행됩니다. 사전에 지정해놓은 하이퍼파라미터인 desired number of edge 에 도달할 때 까지 진행됩니다.

심플하게 생각해보면 딥러닝의 경량화 방법 중 하나인 pruning technique 를 그래프 데이터에 적용할 수 있게 변환했다고 보시면 될 것 같습니다.

핵심은 ‘separation rank’ 라는 measurement 과 vertex , graph prediction performance 간의 연관성을 어떻게 녹여내었는지를 보시면 논문의 핵심을 이해하셨다고 보셔도 될 것 같습니다.

large graph dataset (w GNN model training) 을 효율적으로 적용하기 위해 고민하고 계신 분들에게 도움이 될 것 같습니다.

Temporal Graph Learning in 2023

[https://towardsdatascience.com/temporal-graph-learning-in-2023-d28d1640dbf2]

dynamic , temporal graph 의 기본서라 생각해도 될만큼 핵심 내용들을 잘 정리해놓은 포스팅입니다.

temporal graph learning 이 무엇인지 개요부터 포스팅이 시작됩니다. 구성을 보시면 크게 ‘temporal graph introduction’ , ‘WL-test learning ‘, ‘ evaluation‘ , ‘ framework’ , ‘applications’ 다섯 섹션으로 구성되어 있습니다.

특히, temporal graph application 파트에서는 Disease modeling , anomaly detection , detecting information 3가지 측면으로 어떻게 활용이 되는지 접근법을 짧고 쉽게 설명이 되어있습니다.

그래프 형태의 데이터에서 시간에 대한 정보도 반영되어있을때, 어떤 접근법이 좋을지 고민하고 계신분들에게 도움이 될 만한 글입니다.

Multi-behavior Recommendation with Graph Convolutional Networks

[https://peterjin.me/Multi-behaviour Recommendation with Graph Convolutional Networks.pdf]

추천시스템 산업에서 도메인마다 다르겠으나, 유저의 만족도를 높인다 라는 목적은 모두 동일할거라 생각됩니다. 유저의 만족도가 높아짐에따라 구매, 구독 과 같은 요소들이 올라가며 플랫폼의 실질적인 수익 또한 상승할것이다 이기 때문에 단기적으로 보면

본 논문에서는 유저의 다양한 행동들을 그래프 형태로 표현하여 추천시스템에 활용합니다. 다양한 행동들이라 함은 정의하기에 따라 무수히 많겠으나 여기에선 click , cart , purchase 3가지만을 선정하여 적용합니다.

심플하게 각각의 행동에 따라 Weight 들이 학습하는 디자인은 예상하셨을거라 생각됩니다. 이 논문에서 주의깊게 보면 좋을 포인트는 1. 다양한 행동들이 유저의 추천에 어떻게 기여하는가에 대한 논리 전개 2. user-item graph 뿐만아니라, item-item graph 를 설계하여 대체재 , 보완재 측면으로 접근하는 논리 이상 두가지를 유의깊게 보시고 적용하시면 좋을것 같습니다.

Read more

26년 2월 3주차 그래프 오마카세

RAG-ANYTHING: ALL-IN-ONE RAG FRAMEWORK RAG-Anything: All-in-One RAG FrameworkRetrieval-Augmented Generation (RAG) has emerged as a fundamental paradigm for expanding Large Language Models beyond their static training limitations. However, a critical misalignment exists between current RAG capabilities and real-world information environments. Modern knowledge repositories are inherently multimodal, containing rich combinations of textual

By omakasechef

26년 2월 2주차 그래프 오마카세

Graph Talks LLM,GNN integration 행사 참여 신청 링크 안녕하세요, GUG 정이태입니다. 1.입춘이 다가오고 있지만 여전히 바람이 매섭네요. 다행히 지난 주말은 바람이 잦아들어 잠시나마 숨을 돌릴 수 있는 휴일이었는데, 다들 건강하게 잘 지내고 계신가요? 2.요즘 AI 업계는 NVIDIA GTC 2025에서 화두가 되었던 GraphRAG(Softprompt, KGE)를 넘어, 다가올

By omakasechef