26년 1월 3주차 그래프 오마카세

GUG Interview

안녕하세요, 정이태입니다. GUG talks 소식을 전해드립니다.

이번 세션은 Neo4j 솔루션 엔지니어 Bryan Lee 함께 점심시간을 활용해 온라인으로 진행합니다. 가볍게 점심을 준비해 편안한 마음으로 참여해 주시면 좋을 것 같습니다.

Bryan disucssion topic
최근 지식 그래프(Knowledge Graph) 구축을 위한 NER(Named Entity Recognition) 태스크에서 다양한 연구와 시행착오를 겪은 Bryan의 경험담을 공유할 예정입니다. 특히 Neo4j 소속인 Bryan의 관점에서 Graph Database(GDBMS)를 활용한 인사이트를 깊이 있게 얻을 수 있는 시간이 될거라 생각되네요.

※ 세부 내용은 Bryan의 Medium 아티클을 통해 미리 확인하실 수 있습니다.
https://medium.com/@bryan.leezc/named-entity-recognition-ner-trilemma-balancing-cost-latency-accuracy-0be093fc8028

Yitae discussion topic
저 또한 SEOCHO 빌드 과정에서 NER 프롬프트에 온톨로지를 기입해 LPG 및 RDF 형태의 ouput을 도출하고, 이를 Neo4j에 적재해 각 인스턴스마다 에이전트를 매핑하는 Graph Agent 워크로드를 평가하고 있습니다.

평가 도구로는 Opik을 활용 중이며, 이 프레임워크가 최종적인 Graph Agent 평가에 효과적인 대안이 될 것이라 생각합니다. 인덱싱, 검색(Retrieval), 생성(Generation)의 세 가지 관점에서 평가 체계를 고민하고 계신 분들께 좋은 참고가 되길 바라네요.

하기 luma 링크를 통해 이벤트 신청할 수 있습니다.

https://luma.com/25s4qck4


Vectors vs Graphs: How Topology and Geometry Are Transforming Machine Learning

Vectors vs Graphs: How Topology and Geometry Are Transforming Machine Learning - Hypergraphs , metagraph for aware AI

Keywords

  • From Vectors to Geometry
  • Learning the Shape of Data
  • Topology-aware AI Systems
  • 우리는 그동안 데이터를 노드와 이를 잇는 에지로 구성된 이진 연결(Binary Relation) 그래프로 이해해 왔습니다. 그러나 여러 차례 오마카세에서 이야기했듯이, 유기적으로 상호작용하는 단백질 구조 또는 유체의 흐름이나 물질의 상전이와 같은 다체 상호작용이 지배적인 물리 시스템 등 현실 세계의 수많은 데이터는 단순한 두 개체 간의 관계만으로는 설명하기 어려운 그룹 단위의 상호작용을 본질적으로 포함하고 있습니다
  • 이처럼 다자간 상호작용이 명시적으로 존재하는 데이터를 모델링할 때, 커뮤니티에서는 오랫동안 “벡터 임베딩이 더 우수한가, 그래프 표현이 더 적합한가?”, 혹은 “이 둘을 어떻게 결합할 것인가?”라는 질문에 집중해 왔습니다. 하지만 이번 아티클이 제안하는 핵심 관점은 다릅니다. 우리가 던져야 할 진짜 질문은 “어떤 구조에 어떤 종류의 임베딩을 사용할 것인가?”입니다.
  • 이번 주 오마카세에서는 평면적인 유클리드 벡터 공간을 전제로 한 표준 연결 방식을 넘어, 데이터가 지닌 본질적인 형상과 구조를 이해하기 위한 위상수학과 기하학적 관점의 수학적 기초, 그리고 그 실질적인 가치를 살펴봅니다.

  • “어떤 구조에 어떤 임베딩을 사용할 것인가?”라는 질문은, 데이터를 무조건 평평한 유클리드 공간에 밀어 넣는 접근에서 벗어날 것을 요구합니다. 위상수학과 기하학의 관점에서 보면, 데이터는 각기 고유한 모양을 가지고 있습니다.
    • 계층적인 구조는 곡률(Curvature)을 허용하는 리만 기하학적 공간에서 더 자연스럽게 표현되며, 복잡한 네트워크는 단일 공간이 아닌 Product Space 상의 위상적 연결성으로 설명될 때 그 본질이 드러납니다.
  • 다자간 상호작용을 기존 그래프 모델로 표현할 때 흔히 사용하는 방식은 Clique 구조, 즉 완전 연결 하위 그래프입니다. 그러나 아티클은 이 방식이 정보 표현력 측면에서 치명적인 한계를 가진다는 점을 지적합니다. 단순한 벡터 공간이나 그래프 구조를 넘어, 데이터의 성격에 최적화된 기하학적 공간을 선택하는 것이 핵심이라는 메시지입니다. 대표적인 예는 다음과 같습니다.
    • Hyperbolic Spaces: 조직도나 분류 체계와 같은 계층적·나무 형태의 구조를 표현하는 데 최적입니다. 하이퍼볼릭 공간의 기하급수적인 확장성은 복잡한 계층 구조를 효율적으로 담아냅니다.
    • Spherical Spaces: 방향성 관계나 정규화된 특징들을 표현할 때 유리합니다.
    • Multidimensional Boxes: 직교하는 특징이나 경계가 있는 속성을 나타낼 때 사용됩니다
  • 이러한 관점 전환은 그래프를 단순한 점과 선의 연결이 아닌, 위상적 복합체(Complex)로 바라보게 하며 TDA(Topological Data Analysis) 기반의 확장 분석으로 이어집니다.
    • TDA (Topological Data Analysis, 위상적 데이터 분석): 데이터 구조 내의 ‘구멍(holes)’이나 고차원 공동(voids)을 탐지하고, 데이터가 섭동되더라도 변하지 않는 핵심적인 위상적 특성을 포착합니다. 이는 지속 호몰로지와 조합 라플라시안(Combinatorial Laplacian)의 스펙트럼 분석을 통해 수행됩니다.
    • GDA (Geometrical Data Analaysis, 기하적 데이터 분석): 이러한 위상적 골격 위에 거리, 각도, 곡률, 밀도와 같은 기하학적 정보를 결합함으로써 데이터의 표현력을 한층 확장합니다. Downward Closure라는 수학적 제약 하에서 지속 라플라시안(Persistent Laplacian)의 스펙트럼 분석을 통해 위상과 기하 정보를 동시에 추출합니다.
  • 또한 단순한 그래프를 넘어선 메타그래프, 특히 하이퍼그래프는 이미 많은 그래프 커뮤니티에서 핵심적인 표현 도구로 자리 잡고 있습니다. 노드 집합 간의 관계를 하이퍼에지로 표현하고, 나아가 관계들 사이의 관계를 모델링함으로써 계층적 고차 구조를 포착할 수 있습니다.
    이는 단순히 “A는 B와 관련이 있다”를 넘어서, “이 패턴 전체가 저 패턴과 어떤 관계를 맺고 있는가?”를 이해하는 지능형 시스템의 기반이 됩니다.
  • 나아가 Sheaf 이론과 범주론(Categorical Theory)은 서로 다른 추상화 수준의 데이터가 어떻게 결합되고, 전역적으로 일관성을 유지하는지를 수학적으로 모델링할 수 있는 틀을 제공합니다. 이러한 관점에서 메타그래프의 위상 분석 또한 중요한 잠재적 가치를 지닙니다.

  • 지금까지 우리는 벡터와 그래프를 이분법적으로 나누어 사고해 왔습니다. 그러나 이 아티클이 독자에게 던지는 진짜 질문은 표현 방식의 선택이 아니라, 이 정보가 어떤 기하학적·위상학적 구조를 갖고 있는가입니다.
  • 위상수학과 기하학은 이산과 연속, 국소와 전역, 구조와 변환을 하나의 수학적 언어로 연결하는 통합적 틀을 제공합니다. 이 관점에서 그래프, 복합체, 메타그래프, 그리고 다양한 기하학적 공간은 경쟁 관계에 있는 대안이 아니라, 정보의 성질과 과제에 따라 선택되고 조합되는 표현의 레퍼토리가 됩니다.
  • 현실 세계의 데이터는 더 이상 평평한 공간 위에 놓인 점들의 집합이 아닙니다. 그것은 본질적으로 복합적인 구조체이며, 앞으로의 그래프 표현과 모델 아키텍처 설계는 성능 최적화를 넘어 데이터가 담고 있는 지식 구조 자체를 이해하는 방향으로 발전해 나가야 함을 시사합니다.
💡
As we move forward, the most powerful AI systems won’t be purely vector-based or purely graph-based. They’ll be topology-aware systems that fluidly move between geometric representations as the data and task demand.

[Contact Info]

Gmail: jhbae1184@akane.waseda.jp

Twitter (X): @jhbae1184

LinkedIn

Read more

26년 1월 2주차 그래프 오마카세

mHC-GNN: Manifold-Constrained Hyper-Connections for Graph Neural Networks mHC-GNN: Manifold-Constrained Hyper-Connections for Graph Neural NetworksGraph Neural Networks (GNNs) suffer from over-smoothing in deep architectures and expressiveness bounded by the 1-Weisfeiler-Leman (1-WL) test. We adapt Manifold-Constrained Hyper-Connections (\mhc)~\citep{xie2025mhc}, recently proposed for Transformers, to graph neural networks. Our method, mHC-GNN, expands

By omakasechef

26년 1월 1주차 그래프 오마카세

Beyond Context Graphs: Why 2026 Must Be the Year of Agentic Memory, Causality, and Explainability https://medium.com/@volodymyrpavlyshyn/beyond-context-graphs-why-2026-must-be-the-year-of-agentic-memory-causality-and-explainability-db43632dbdee * 안녕하세요, 구독자 여러분. 희망찬 2026년 새해가 밝았습니다. 새해 복 많이 받으시고, 좋은 일들로 가득한 한 해가 되시기를 바랍니다. * 2026년의 첫 오마카세로 어떤 것이 좋을지 여러 아티클들을 찾아보고 읽어보다가, "요즘

By omakasechef

25년 12월 4주차 그래프 오마카세

Signals with shape: why topology matters for modern data? News article: Signals with shape: why topology matters for modern data?SURE-AI * 어느덧 2025년 을사년의 마지막 그래프 오마카세로 인사드리게 되었습니다. 구독자 여러분들의 올 해는 어떠셨을까요? 각자의 현장에서 혁신과 큰 발전을 이끌어오셨을 구독자 여러분들께 안부를 전합니다. 지금 한국은 엄청난 한파라고 들었습니다만 모두

By omakasechef