24년 8월 4주차 그래프 오마카세

Simplicial Neural Networks

paper link : https://arxiv.org/abs/2010.03633

official code : https://github.com/stefaniaebli/simplicial_neural_networks

video : https://www.youtube.com/watch?v=2cidzWXH_vg&t=21s

배지훈

Index

  • Introduction
  • Proposed method : Simplicial convolution - SNNs
  • Summary
  • 이번 주 오마카세에서는 Simplicial complex의 higher-order interactions을 컨볼루션 연산을 통해 학습할 수 있는 시초의 단순 신경망 모델을 제안하여 이후의 많은 관련 연구의 인용이 되고있는 'Simplicial Neural Networks' 논문을 전달해드리고자 합니다.
  • Spectral graph convolution network로 유명한 Chebnet의 아버지 M. Defferrard이 연구에 참여하였음을 보아, 'Chebnet과 같은 스펙트럼 그래프 컨볼루션의 개념을 Simplical complex와 같은 higher-order complex상으로 어떻게 확장시켜 정의한 모델인가?' 라는 단순한 궁금증으로 논문을 읽어보았던 것 같습니다.
  • 포스터 세션으로 제출된 논문이다 보니 해당 아이디어의 설명이 조금 부족하단 느낌이 들 수 있을 것 같습니다. (개인적으로 그러한 느낌을 많이 받았습니다..) 따라서, 추가적으로 1저자분이 발표한 유튜브 영상을 video 링크로도 남겨두었으니 해당 영상을 참고하시면 조금 더 깊은 이해에 도움이 되지않을까 생각합니다.
    • 또한, official code의 구성이 정말 깔끔합니다. 해당 코드의 notebook을 직접 돌려보시면서 그 결과를 확인해보시는 것도 추천드립니다.

Introduction

  • 다들 잘 아시다시피, 컨볼루션 신경망(CNN)은 이미지 이해, 인식 분야에서 뛰어난 성능을 자랑합니다. 하지만 그 특성 상, 비유클리드 공간에서의 불규칙적 데이터 구조를 이해하는 것에는 한계가 존재합니다.
  • 그로부터 CNN의 개념을 그래프 개념으로 확장한 GNN (GCNs)의 효과와 그 유연성이 입증되었으며, 더욱 폭넓은 도메인 상에서 그래프 표현 학습의 개념 및 활용 방법 등이 활발하게 연구되어지고 있습니다. 하지만 pairwise relation을 모델링하는 것에 제한되어 있습니다.
    • 다음을 해결하기 위하여 hypergraph neural networks, motif-based GNNs 등이 제안되어져 왔으나, 공간 전역의 그래프가 표현하는 토폴로지 정보를 명확하게 연결짓는 수학적 이론 배경이 부족하다는 한계가 있음을 언급합니다.
    • 다음 사실을 기반하여, Simplicial complex로 표현되는 데이터 토폴로지 구조의 탄탄한 수학적 이론들을 배경삼아 그 위에 구축될 수 있는 Simplcial (convolutional) neural network를 설계해보자는 아이디어 접근으로 시작됩니다.

Proposed method : Simplicial convolution

  • Simplicial complex 및 Hodge Laplacian 에 대한 배경지식('Simplicial complexes, Simplicial Laplacian' 세션 참고) 내용은 생략하겠습니다.
  • 그래프 라플라시안 행렬의 고유분해를 통해 얻어지는 고유 함수(고유벡터, 고유값) 들의 선형조합 꼴에서 정의되는 그래프 푸리에 변환을 활용한 기존 ChebNet의 컨볼루션 연산을 기반으로, 해당 p-Simplicial complex(K_p)의 cochains (Cp)에 대한 스펙트럼 푸리에 변환을 아래와 같이 정의합니다.
Fourier transform of real p-cochains on a simplicial complex with Hodge Laplacian
    • 여기에서 e_i는 Hodge Laplacian의 고유값에 따라 오름차순으로 정렬된 eigen-cochains입니다.
    • F_p(C)는 p-cochain 각각에 eigen-cochains과의 내적 벡터들을 모은 |K_p| 차원의 실수 벡터들의 함수로써 정의됩니다.
    • Hodge Laplacian의 diagonalizable한 성질 덕분에, F_p 함수는 invertible하며, 그로부터 그래프 푸리에 변환에 사용되는 고유함수의 꼴로 표현할 수 있게 됩니다.
  • 따라서, 다음 푸리에 변환 함수를 활용하여 주어진 Simplicial complex의 cochain을 Spectral domain 상으로 맵핑하여 컨볼루션 연산을 수행할 수 있게 되었습니다. 그로부터 다음의 단순한 형태의 Simplicial Neural Networks(SNNs) 모델을 정의합니다.
    • 여기에서 \phi 표기는 비선형함수를 의미합니다.
    • 각 레이어 마다 Localized한 컨볼루션 연산을 보장하기 위해, Chebnet과 유사하게 다음 가중치 함수 (W)를 고유값 기반의 저차 (i) 다항식 꼴로 근사화합니다. 다음은 단순하게 선형 결합 형태로 아래와 같이 정의합니다.
Localized convolutional layer that are low-degree polynomials in the frequency domain.
  • 결과적으로, 아래와 같은 식을 도출할 수 있습니다.
    • 간단하게, 입력 p-cochain (c)를 i차수 Hodge Laplacian (i번 거듭제곱 꼴) 및 가중치 행렬을 통해 컨볼루션 연산을 수행하는 것으로 이해해볼 수 있습니다.
    • 다시 말하면 Chebnet의 컨볼루션 식에서 라플라시안 행렬을 Hodge Laplacian으로 치환하고, 입력 데이터가 Simplicial complex로 바뀌었다는 것 외에 나머지 연산은 동일한 꼴로 정의할 수 있게 됩니다.
  • 저자들은 공저자 (coauthorship) complex (CC, Fig 1(b) 참고)에의 결측 데이터를 처리하는 도메인 상에서 제안 모델 SNNs의 효율성을 실험으로 입증합니다.

Summary

  • 이번 주 오마카세는 (가볍게) 그래프 스펙트럼 컨볼루션 개념을 기반으로 Simplicial complex로 확장할 수 있는 컨볼루션 연산자를 정의한, 이후의 많은 Simplicial neural networks 변형 모델들의 모티브가 되고 있는 논문을 소개해드렸습니다.
    • 다음 논문에서는 Simplicial complex 상의 컨볼루션 정의 관련한 핵심 개념들을 간략하게 설명해주고 있기에, 독자 여러분들께서도 부담 없이 이해하실 수 있으실거라 생각합니다.
    • 특히 Chebnet의 내용을 잘 알고계시는 독자분들이라면, 이번 논문의 내용은 상당히 쉽게 느껴지셨을 거라 생각합니다. 그만큼 스펙트럼 그래프 컨볼루션과 깊은 관련이 있으며, 저자들도 Conclusion 부분에서 해당 스펙트럼 개념이 논문 아이디어 전개에 큰 영향을 끼친다고 언급하고 있습니다.
  • 하지만 개인적으로, 해당 논문의 설명 만으로 그 내용을 깊게 이해하기에는 어렵다는 생각이 들었습니다. 따라서 저자의 유튜브 설명 및 official code를 참고하여 이해해보고자 하였으며, 그 필요성을 많이 느꼈던 것 같기에.. 다음 논문을 읽으시려는 독자 여러분들께도 추천드리는 바 입니다 !
  • 글을 마무리하기에 앞서, 그래프 오마카세를 함께 만들어나갈 마음이 있으신 분들을 구하고 있습니다. 매주 다양한 그래프 주제로 자유롭게 뉴스레터를 연재하는 것에 관심이 있으신 분들께서는 언제든지 제 메일주소로 편하게 연락주시면 감사하겠습니다 !

[Contact Info]

Gmail : jhbae1184@akane.waseda.jp

Twitter (X): @jhbae1184

LinkedIn

Subscribe for daily recipes. No spam, just food.