24년 12월 1주차 그래프 오마카세
Vertex, Edge, Clique: What's in a Graph?
Youtube link : https://www.youtube.com/watch?v=MCfp8p7tETk
- 어느덧 24년의 마지막 12월이 찾아 왔습니다. 올 한해 독자 여러분들 정말 고생많으셨고, 그래프 오마카세와 함께 해주셔서 언제나 감사드립니다.
- 이번 주 오마카세는 글이 아닌 Bastian 교수님의 최근 유튜브에 업로드된 1시간 분량의 강연으로 전달해드리고자 합니다. 이전보다 훨씬 더 가볍게 즐기실 수 있으실 것 같고, 그래프 전반적인 내용과 토폴로지 관점에서 그래프에 적용할 수 있는 이점, 그리고 현실적 어려움들 및 해결 방향성 등을 자세하게 풀어서 설명해주셨습니다. 그래프를 사랑하시는 독자 여러분들께 많은 도움을 드릴 수 있을 듯 하고 여유가 되신다면 끝까지 시청하시는 것을 추천드립니다.
- 저도 해당 영상을 시청하고 나름대로 정리해보았는데, 가볍게 해당 영상을 요약해보면 다음과 같습니다.
- 초반 13분 이전까지의 내용을 간단하게 정리해보았습니다.
- 머신 러닝 상에서의 그래프의 중요성을 강조하셨습니다. 수십년간 연구되어온 그래프 연구의 방향성과 확대 흐름성, 그리고 그 한계성을 정확하게 짚고 넘어가야 함을 강조합니다. 최근 그래프에 대한 관심이 커지면서 발전 속도가 매우 빨라지고 있는 만큼, 그 흐름을 정확하게 잡고 있어야 빠른 변화 속에서도 뒤쳐지지 않을 수 있음을 말씀하셨습니다.
- 그래프 신경망의 메세지 전달 메커니즘 및 그래프 트랜스포머에 대해서도 언급하면서 이들의 한계점을 표준 벤치마크 데이터셋의 문제점과 연관지어 설명합니다. 그로부터 Synthetic Graph Generation의 중요성도 강조하셨네요. 자세히는 모르지만 꽤나 흥미로운 주제로 보입니다.
- 더욱 다양한 유형의 그래프 데이터를 처리하기 위한 프레임워크 및 방법론에 대한 연구의 중요성을 강조하셨고 프로그래밍 언어 및 라이브러리 개발의 필요성 또한 주장하셨습니다.
- 그 이후의 내용은 다음과 같이 정리해보았습니다.
- 데이터셋의 문제점을 다시금 지적하면서 그 출처를 아는 것, 투명성 및 재현성을 보장하는 것의 중요성을 주장하셨고, 신뢰할 수 없는 데이터 소스 사용 및 관리 문제, 자문 관리 부족 등의 다양한 어려움들을 지적하셨습니다. 그만큼 그래프 학습을 통해 얻어진 결과의 신뢰성을 보장하기 위해 더 나은 데이터 관리 프로토콜이 필요함을 강조하였습니다.
- 그래프 학습 도메인에서 토폴로지를 사용하는 방법에 대한 Bastian 교수님의 연구 사례를 소개하면서, 다음 방법론의 유용성을 항상 장담할 수는 없지만 각 노드의 특징을 더욱 폭넓게 활용할 수 있는 방법의 효율성은 장담한다고 언급하셨습니다. 대체적으로 노드 특징에 중요한 정보가 많이 담겨져 있다는 사실을 수많은 연구를 통해 확인하게 된 것으로 보입니다.
- 초반 13분 이전까지의 내용을 간단하게 정리해보았습니다.
- 최근 Mantra라는 TDL 도메인에 적합한 새로운 데이터셋을 소개하고 구축 과정 및 실험 결과를 공유하여 확장된 그래프 학습의 의의 및 Simplicial & Cell complex 등의 잠재력에 대해 논의하였습니다.
- 확장 가능성에 비해 해당 도메인의 인지도가 낮은 사실로부터 관련 커뮤니티의 활동 및 노력이 필요하다는 점을 강조하며 영상은 마무리됩니다.
- 노드와 엣지, 이들의 조합으로 다양하게 구성될 수 있는 그래프 표현 방법들이 머신 러닝 도메인 폭을 충분히 넓힐 수 있는 잠재성을 가지고 있음에도, 관련 연구자 및 종사자들로부터 해결되어야 할 어려움들이 많이 남아있다는 사실로부터 이에 해당되는 저희들의 노력이 중요하다는 사실을 강조해주신 것 같습니다.
- 영상 시청 후 제 스스로 다시금 그래프에 대해 생각해보게 되었고, 많은 동기부여가 되었던 영상이라 생각이 들어서 독자 여러분들께도 추천해드리고 싶은 마음에 이번 주 오마카세로 가볍게 전달해드렸습니다.
[Contact Info]
Gmail : jhbae1184@akane.waseda.jp
Twitter (X): @jhbae1184