25년 2월 3주차 그래프 오마카세

Graph technologies outlook in 2025

youtube link : https://www.youtube.com/watch?v=e5MWzPEQk_g

Anisha Designs and Connected Data London
  • 2024년에 GraphRAG, Agents, KG에 대한 관심이 급증하면서 그래프 AI 다운스트림 태스크의 활용 측면에서 서비스 개발 및 기술 공유의 빈도수가 크게 늘어났습니다. 그래프 뿐만 아니라 다른 도메인으로의 확장 방향성에 대해서도 많이 논의되었고 현재진행형 이라고 생각합니다.
  • KG 팟캐스트 및 다양한 주제를 논의하는 채널을 운영하는 Ashleigh Faith의 최신 영상을 보면 2025년 올 한해의 KG와 전반적인 AI 또는 그래프 외의 다른 도메인에서의 교차 트렌드에 대해 논의하고 있습니다. 지식 그래프에 관심이 많은 분들은 개인적으로 해당 영상 시청을 추천드리는 바입니다.
  • 2025년 기대해볼 수 있는 그래프 기술 트렌드 관련한 내용을 간추려보면 아래와 같습니다. (참고: https://medium.com/derwen/graph-technologies-outlook-in-2025-bea621f394d8)
    • LLM에서의 추론이 힘을 잃고, 대신 LLM보다 성능이 뛰어난 추론을 위한 더 나은 기존 접근 방식을 활용하는 것으로 대체될 것으로 예상합니다. (참고: neurosymbolic systems graph reasoning)
    • GraphRAG는 현재 "그래프"라는 단어가 여러 가지 다른 의미를 갖는 방식을 감안할 때 경계 객체입니다. 표준화되는 대신(즉, 한 라이브러리가 시장 점유율 우위를 차지함) neurosymbolic systems이 확장되고 다양화됨에 따라 이는 실무 커뮤니티로 발전할 가능성이 큽니다.
    • Contextual Engineering”이 증가할 것으로 예상합니다. (참고: Rob Caulk and Elin Törnquist @ AskNews). 그래프 쿼리에 대한 내용이 줄어들고 특히 패턴 및 컨텍스트 마이닝을 위한 그래프 알고리즘에 대한 내용이 늘어날 것으로 예상합니다 (참고: Russ Jurney @ GraphletAI).
    • AI 애플리케이션은 과학, 특히 재료 과학, 지구 과학/기후, 제약/생명 과학에서 큰 진전을 이루고 있으며, 이는 대부분 기술 거대 기업과는 무관합니다. (참고: Clem Delangue, et al. @ Hugging Face, Anima Anandkumar, et al. @ Caltech)
    • 그래프 관행에서 더 많은 "Layers"을 볼 것으로 예상합니다. 예를 들어 관계형 데이터 관리 시스템 위에 KG를 구축하고 그래프 분석에서 더 많은 “levels of detail (LOD)” 을 볼 수 있습니다. 이는 공간 분석의 LOD와 유사합니다.
    • ML 관행에서 평가가 더 공식화될 것으로 예상합니다(참고: Gaël VaroquauxOlivier Grisel, et al., @ :probabl). 더 작고 계산 비용이 덜 드는 모델(less carbon footprint)에 중점을 둡니다.
    • 확실히 그래프 친화적인 수학자들을 주의 깊게 살펴볼 것입니다.특히 확률 회로(참고: Guy Van den Broeck, et al. @ UCLA StarAI Lab)와 최적화된 인과 그래프(참고:Urbashi Mitra, et al. @ USC Viterbi)의 발전에 주목해야 합니다. 이러한 발전은 AI 애플리케이션을 증강하여 인간과 기계의 협업적 결정을 인간 규모에서 더 쉽게 이해하고 조작할 수 있게 만들 가능성이 높습니다.
  • 영상에 나오셨던 Paco Xander의 Medium 글과 함께 해당 영상을 시청하시면 그래프 기술 흐름에 대해 가볍게 짚고 넘어가는 것에 도움이 많이 되실 것 같습니다.

How to Implement Graph RAG Using Knowledge Graphs and Vector Databases

blog link : https://medium.com/towards-data-science/how-to-implement-graph-rag-using-knowledge-graphs-and-vector-databases-60bb69a22759

Credits: the medium blog, Steve Hedden
  • RAG, Semantic Search, and Recommendations의 단계별 구현 튜토리얼을 제공하고 있는 유용한 블로그 글입니다. 다음 목표는 KG와 벡터 데이터베이스 간의 차이점을 설명하고 이들이 함께 동작할 수 있는 방법을 제공하는 것이라고 합니다. (위의 그림 : '벡터 데이터베이스와 KG가 advanced queries를 실행하는 개괄적 개요' 참고)
  • 블로그 요약을 아래와 같이 제공하고 있습니다. 해당 내용만 가볍게 짚고 넘어가셔도 괜찮을 것 같습니다. 핵심만 간추리면 아래와 같습니다.
    • 벡터 데이터베이스는 몇 가지 경고와 함께 의미 검색, 유사성 계산 및 일부 기본 형태의 RAG를 꽤 잘 실행할 수 있습니다. 벡터화 모델은 주로 비정형 데이터에서 학습되므로 엔터티와 관련된 텍스트 청크가 주어지면 잘 수행됩니다.
    • 벡터 데이터베이스만 사용하는 가장 큰 단점 중 하나는 설명 가능성이 부족하다는 것입니다. 하지만 의미 검색, 유사성 및 RAG에 KG를 사용하는 가장 큰 장점은 때때로 "enhanced data enrichment" 또는 "graph as an expert"라고 불리는, KG를 사용하여 검색어를 확장하거나 정제할 수 있는 이점으로부터 설명 가능성 문제를 커버할 수 있습니다.
    • KG 사용을 시작하는 데 가장 큰 장애물 중 하나는 KG를 구축해야 한다는 것입니다. 즉, LLM을 사용하여 KG 구축 속도를 높이는 방법은 여러 가지가 있습니다. (아래 그림 참고)
Credits: the medium blog, Steve Hedden
    • 'Context poisoning': 벡터 데이터베이스에서 관련 없는 콘텐츠가 반환될 가능성은 검색 및 유사성에는 귀찮은 일이지만 RAG에는 큰 문제입니다. 위험한 점은 응답이 반드시 사실적으로 부정확하지 않고 부정확한 데이터에 기반하지 않으며 질문에 답하기 위해 잘못된 데이터를 사용하는 것입니다. 그러나 KG는 컨텍스트 오염 가능성을 줄이는 데 도움이 될 수도 있습니다.
  • 해당 튜토리얼에서 제공하는 내용은 벡터 데이터베이스를 KG로 변환하여 Semantic search, similarity search, RAG에 대한 3가지 검색 테스트 (Vector-based, Prompt-to-query, and hybrid retrieval)를 수행합니다. Medium 블로그에 그 과정에 대한 코드와 자세한 설명이 제공되어 있으니, 참고해보시면 좋을 것 같습니다.

[Contact Info]

Gmail: jhbae1184@akane.waseda.jp

Twitter (X): @jhbae1184

LinkedIn

Read more

25년 8월 2주차 그래프 오마카세

Graph Tensor Networks: An Intuitive Framework for Designing Large-Scale Neural Learning Systems on Multiple Domain paper link : https://arxiv.org/abs/2303.13565 * 현재 토폴로지 신경망의 학습 메커니즘을 설계하는 과정에서 매우 중요한 텐서 연산에 대한 이해를 크게 도와준 논문 하나를 여러분들께 소개해드리려고 합니다. 그래프 구조를 활용하여 다양한 신경망의 텐서 연산

By admin

25년 8월 1주차 그래프 오마카세

A General Graph Spectral Wavelet Convolution via Chebyshev Order Decomposition paper link : https://arxiv.org/abs/2405.13806 official code : https://github.com/liun-online/WaveGC * 그래프 스펙트럼 컨볼루션은 그래프 신호처리 이론을 기반으로 그래프 필터링, 데이터 분석 등의 넓은 분야에서 활용되고 있습니다. 다음은 그래프 스펙트럼 변환을 위한 신호 기저 (고유벡터) 선택

By admin