25년 2월 3주차 그래프 오마카세

Graph technologies outlook in 2025

youtube link : https://www.youtube.com/watch?v=e5MWzPEQk_g

Anisha Designs and Connected Data London
  • 2024년에 GraphRAG, Agents, KG에 대한 관심이 급증하면서 그래프 AI 다운스트림 태스크의 활용 측면에서 서비스 개발 및 기술 공유의 빈도수가 크게 늘어났습니다. 그래프 뿐만 아니라 다른 도메인으로의 확장 방향성에 대해서도 많이 논의되었고 현재진행형 이라고 생각합니다.
  • KG 팟캐스트 및 다양한 주제를 논의하는 채널을 운영하는 Ashleigh Faith의 최신 영상을 보면 2025년 올 한해의 KG와 전반적인 AI 또는 그래프 외의 다른 도메인에서의 교차 트렌드에 대해 논의하고 있습니다. 지식 그래프에 관심이 많은 분들은 개인적으로 해당 영상 시청을 추천드리는 바입니다.
  • 2025년 기대해볼 수 있는 그래프 기술 트렌드 관련한 내용을 간추려보면 아래와 같습니다. (참고: https://medium.com/derwen/graph-technologies-outlook-in-2025-bea621f394d8)
    • LLM에서의 추론이 힘을 잃고, 대신 LLM보다 성능이 뛰어난 추론을 위한 더 나은 기존 접근 방식을 활용하는 것으로 대체될 것으로 예상합니다. (참고: neurosymbolic systems graph reasoning)
    • GraphRAG는 현재 "그래프"라는 단어가 여러 가지 다른 의미를 갖는 방식을 감안할 때 경계 객체입니다. 표준화되는 대신(즉, 한 라이브러리가 시장 점유율 우위를 차지함) neurosymbolic systems이 확장되고 다양화됨에 따라 이는 실무 커뮤니티로 발전할 가능성이 큽니다.
    • Contextual Engineering”이 증가할 것으로 예상합니다. (참고: Rob Caulk and Elin Törnquist @ AskNews). 그래프 쿼리에 대한 내용이 줄어들고 특히 패턴 및 컨텍스트 마이닝을 위한 그래프 알고리즘에 대한 내용이 늘어날 것으로 예상합니다 (참고: Russ Jurney @ GraphletAI).
    • AI 애플리케이션은 과학, 특히 재료 과학, 지구 과학/기후, 제약/생명 과학에서 큰 진전을 이루고 있으며, 이는 대부분 기술 거대 기업과는 무관합니다. (참고: Clem Delangue, et al. @ Hugging Face, Anima Anandkumar, et al. @ Caltech)
    • 그래프 관행에서 더 많은 "Layers"을 볼 것으로 예상합니다. 예를 들어 관계형 데이터 관리 시스템 위에 KG를 구축하고 그래프 분석에서 더 많은 “levels of detail (LOD)” 을 볼 수 있습니다. 이는 공간 분석의 LOD와 유사합니다.
    • ML 관행에서 평가가 더 공식화될 것으로 예상합니다(참고: Gaël VaroquauxOlivier Grisel, et al., @ :probabl). 더 작고 계산 비용이 덜 드는 모델(less carbon footprint)에 중점을 둡니다.
    • 확실히 그래프 친화적인 수학자들을 주의 깊게 살펴볼 것입니다.특히 확률 회로(참고: Guy Van den Broeck, et al. @ UCLA StarAI Lab)와 최적화된 인과 그래프(참고:Urbashi Mitra, et al. @ USC Viterbi)의 발전에 주목해야 합니다. 이러한 발전은 AI 애플리케이션을 증강하여 인간과 기계의 협업적 결정을 인간 규모에서 더 쉽게 이해하고 조작할 수 있게 만들 가능성이 높습니다.
  • 영상에 나오셨던 Paco Xander의 Medium 글과 함께 해당 영상을 시청하시면 그래프 기술 흐름에 대해 가볍게 짚고 넘어가는 것에 도움이 많이 되실 것 같습니다.

How to Implement Graph RAG Using Knowledge Graphs and Vector Databases

blog link : https://medium.com/towards-data-science/how-to-implement-graph-rag-using-knowledge-graphs-and-vector-databases-60bb69a22759

Credits: the medium blog, Steve Hedden
  • RAG, Semantic Search, and Recommendations의 단계별 구현 튜토리얼을 제공하고 있는 유용한 블로그 글입니다. 다음 목표는 KG와 벡터 데이터베이스 간의 차이점을 설명하고 이들이 함께 동작할 수 있는 방법을 제공하는 것이라고 합니다. (위의 그림 : '벡터 데이터베이스와 KG가 advanced queries를 실행하는 개괄적 개요' 참고)
  • 블로그 요약을 아래와 같이 제공하고 있습니다. 해당 내용만 가볍게 짚고 넘어가셔도 괜찮을 것 같습니다. 핵심만 간추리면 아래와 같습니다.
    • 벡터 데이터베이스는 몇 가지 경고와 함께 의미 검색, 유사성 계산 및 일부 기본 형태의 RAG를 꽤 잘 실행할 수 있습니다. 벡터화 모델은 주로 비정형 데이터에서 학습되므로 엔터티와 관련된 텍스트 청크가 주어지면 잘 수행됩니다.
    • 벡터 데이터베이스만 사용하는 가장 큰 단점 중 하나는 설명 가능성이 부족하다는 것입니다. 하지만 의미 검색, 유사성 및 RAG에 KG를 사용하는 가장 큰 장점은 때때로 "enhanced data enrichment" 또는 "graph as an expert"라고 불리는, KG를 사용하여 검색어를 확장하거나 정제할 수 있는 이점으로부터 설명 가능성 문제를 커버할 수 있습니다.
    • KG 사용을 시작하는 데 가장 큰 장애물 중 하나는 KG를 구축해야 한다는 것입니다. 즉, LLM을 사용하여 KG 구축 속도를 높이는 방법은 여러 가지가 있습니다. (아래 그림 참고)
Credits: the medium blog, Steve Hedden
    • 'Context poisoning': 벡터 데이터베이스에서 관련 없는 콘텐츠가 반환될 가능성은 검색 및 유사성에는 귀찮은 일이지만 RAG에는 큰 문제입니다. 위험한 점은 응답이 반드시 사실적으로 부정확하지 않고 부정확한 데이터에 기반하지 않으며 질문에 답하기 위해 잘못된 데이터를 사용하는 것입니다. 그러나 KG는 컨텍스트 오염 가능성을 줄이는 데 도움이 될 수도 있습니다.
  • 해당 튜토리얼에서 제공하는 내용은 벡터 데이터베이스를 KG로 변환하여 Semantic search, similarity search, RAG에 대한 3가지 검색 테스트 (Vector-based, Prompt-to-query, and hybrid retrieval)를 수행합니다. Medium 블로그에 그 과정에 대한 코드와 자세한 설명이 제공되어 있으니, 참고해보시면 좋을 것 같습니다.

[Contact Info]

Gmail: jhbae1184@akane.waseda.jp

Twitter (X): @jhbae1184

LinkedIn

Read more

25년 10월 2주차 그래프 오마카세

Flexible GraphRAG: a configurable open source framework for GraphRAG Blog link : https://integratedsemantics.org/ Github : https://github.com/stevereiner/flexible-graphrag * 이번 주 오마카세는 'Open Source Integrated AI and Semantic Tech' 블로그에서 설명하는 통합된 오픈소스 플랫폼 관련한 소식을 전달해드리고자 합니다. 최근 포스트에서는 문서 처리, 지식 그래프 구축, RAG 및

By admin

25년 10월 1주차(2) 그래프 오마카세

1.광고 안녕하세요 정이태입니다.오랜만에 10월 23일 목요일 저녁에 GUG 온라인 세미나가 예정되어 있습니다. 카이스트 김재철AI대학원 신기정 교수님 연구실 소속 김선우 연구원님과 하이퍼 그래프 이론부터 응용까지 라는 주제로 진행할 예정이며, 저또한 모더레이터 겸 요새 GraphRAG 트랜드부터 왜 HyperGraphRAG가 나오고 있는지 산업계 관점에서 생각을 공유드릴 예정이오니 관심있는 분들은 참여하셔서 본인 연구나

By Hardy