25년 1월 5주차 그래프 오마카세
Open-Sourcing the WhyHow Knowledge Graph Studio, powered by NoSQL
medium link : https://medium.com/enterprise-rag/open-sourcing-the-whyhow-knowledge-graph-studio-powered-by-nosql-edce283fb341
github : https://github.com/whyhow-ai/knowledge-graph-studio

- 안녕하세요. 어느덧 1월달의 마지막 주가 찾아왔습니다. 이번 주에는 설날이 포함되어 있어 많은 구독자 여러분들의 이동이 잦을것으로 생각되어 바쁜 이동 와중에 가볍게 꺼내드실 수 있는 내용들로 구성해보고자 하였습니다. 다시금 새해복 많이 받으세요 !
- 그 시작은 Agentic RAG 및 모듈형 지식 그래프 어플리케이션을 구축하는 데 도움을 줄 수 있는 WhyHow KG Studio의 오픈 소스화를 명시하고 관련 내용을 게시해둔 미디움 블로그를 공유해드리고자 합니다.
- MongoDB를 기반으로 구축된 Knowledge Graph Studio는 LLM 시스템, 다중 에이전트 RAG 워크플로, 구조화된 지식 표현에 필요한 고유한 요구 사항을 수용하도록 설계되었으며 관계형 데이터, 벡터 스토리지 및 검색, 유연한 스키마의 모든 이점을 결합한 플랫폼이라고 소개합니다.
- Key highlight 부분에서 해당 플랫폼은 비구조화된 벡터 검색의 결합을 수행하는 기존 워크플로우의 한계점을 처리하면서 훨씬 더 정확하고 결정론적인 워크플로우로 향상된 수행 능력을 강조하고 있습니다.
- 또한 쿼리 엔진에 Text2Cypher를 사용하지 않고, 의미적 유사성을 통해 임베딩된 triplet을 검색하여 연결된 텍스트 청크를 고려한다는 것입니다. 그로부터 단순히 임베드된 노드를 검색하려고 시도하는 것보다 훨씬 더 풍부한 데이터를 포함 결과를 2배가까이 향상시킬 수 있었음을 언급합니다.
💡
By being able to combine Text Chunks with Triples and Nodes, we are able to perform far more accurate, complete and deterministic information workflows as seen in these various case studies here (healthcare), here (legal), or here (finance).
Since WhyHow’s query engine does not utilize Text2Cypher, the results are up to 2x more accurate, as can be seen in this benchmark here, where the same Graph created with Langchain’s LLMGraphTransformer gets better retrieval responses from WhyHow’s query engine than Text2Cypher.
Since WhyHow’s query engine does not utilize Text2Cypher, the results are up to 2x more accurate, as can be seen in this benchmark here, where the same Graph created with Langchain’s LLMGraphTransformer gets better retrieval responses from WhyHow’s query engine than Text2Cypher.
- 간단하고 직관적으로 구축된 위 플랫폼의 주요 기능들과 오픈소스화 이유에 대한 설명을 참고해보시면서 현업에서 상호작용 해보시는 것은 어떠신가요? 도움이 되는 정보였으면 하는 바람입니다 !
KAG Graph + Multimodal RAG + LLM Agents = Powerful AI Reasoning
youtube link : https://www.youtube.com/watch?v=EBBdbn4Gbw8

- 썸네일에 홀려서 저도 모르게 클릭하고 시청한 영상인데 내용이 꽤 알차서 이 영상도 여러분들께 공유드리고자 합니다.
- RAG는 최신 AI 트렌드에 게임 체인저로써 역할을 똑똑히 해내고 있음은 다들 잘 아시고 계실거라 생각합니다. 하지만 벡터 유사성과 지식 추론 관련성 사이의 큰 차이와 전문적 지식 서비스 구현에 어려움을 겪는 문제점이 있습니다. 텍스트나 벡터 유사성에 의존하여 참조 정보를 검색하는 것의 비효율성을 언급합니다.
- 그로부터 지식 증강 생성 (Knowledge Augmented Generation, KAG) 프레임워크의 중요도를 강조합니다. 해당 기술은 지식 그래프(KG)와 벡터 검색의 장점을 최대한 활용하면서 그래프의 의미 유형, 관계 등을 LLM에 통합시킴으로써 LLM & KG의 양방향적인 향상성을 목표로 합니다.
- 해당 논문과 깃허브 코드를 남겨두었으니 참고해보시기 바랍니다.
- KAG github : https://github.com/OpenSPG/KAG
- 통합 및 추론 기능에 있어서 KAG와 기존 GraphRAG의 차이점도 소개합니다. KAG는 논리적, 추론적, 수치적 작업에 있어서 의미론적 관계를 통합하고 하이브리드 추론 엔진을 활용하여 더욱 구조적이면서 복합적인 문제 해결을 가능하게 하는 KG를 전적으로 기반합니다. 그에 반해, GraphRAG는 추론 및 생성에 더 집중되어 의미론적, 논리적 추론에 대한 중요도가 낮으므로 복잡한 쿼리문 및 전문적인 어플리케이션에 있어서 그 효율성이 (잠재적으로) 제약될 수 있음을 언급합니다.
- 더욱 자세한 내용은 위 영상에 잘 설명되어있으니 시간 되신다면 시청해보시고 새로운 인사이트 많이 얻어가셨으면 좋겠습니다 !
[Contact Info]
Gmail: jhbae1184@akane.waseda.jp
Twitter (X): @jhbae1184