Everything you care about in one place

Follow feeds: blogs, news, RSS and more. An effortless way to read and digest content of your choice.

Get Feeder

siwei.io

siwei.io

Get the latest updates from siwei.io directly as they happen.

Follow now 10 followers

Latest posts

Last updated 10 days ago

Fusion GraphRAG Introduced

2 months ago

本文分享我们团队在 GraphRAG 领域的探索与实践历程,介绍一下 FusionGraphRAG。 本文将分享我们团队在 GraphRAG 领域的探索与实践历程。GraphRAG 是检索增强生成(RAG)技术的高级技术之一,旨在解决传统 RAG 的局限性。上周,我在 Twitter 上分享了关于...

图数据库驱动的基础设施运维示例

over 2 years ago

图技术在大型、复杂基础设施之中 SRE/DevOps 的实践参考,本文以 OpenStack 系统之上的图数据库增强的运维案例为例,揭示图数据库、图算法的智能运维方法,全流程示例代码开源。 因为有一些还未采用图技术的 DevOps/Infra 领域同学在 NebulaGraph 社区询问参考的案例,我最近试着实践了一下如何利用图的能力与优势去帮助在复杂基础设施上构建辅助运维系统,希望能帮助到感兴趣 Infra Ops...

连接微信群、Slack 和 GitHub:社区开放沟通的基础设施搭建

over 2 years ago

NebulaGraph 社区如何构建工具让 Slack、WeChat 中宝贵的群聊讨论同步到公共领域 1 要开放,不要封闭在开源社区中,开放的一个重要意义是社区内的沟通、讨论应该是透明、包容并且方便所有成员访问的。这意味着社区中的任何人都应该能够参与讨论和决策过程,并且所有相关信息应该公开和自由地共享。 在公共场合进行沟通在开源理念中是重要的,正式这种方式使得社区的成员可以进行有效地共同工作,分享想法和反馈,为项目或社区做出贡献。 为了更清楚表达,我举几个反面的例子: 要求贡献者使用对他们来说难以访问或难以使用的工具可能会妨碍开源社区中的开放沟通。 这可能是由于多种原因,例如: 工具可能昂贵或需要许可证,而并非所有贡献者都能负担得起。 工具可能难以使用或需要很高的技术经验积累,而并非所有贡献者都具备。...

图数据库的社交网络应用

over 2 years ago

图数据库的社交网络应用 本文是一个基于 NebulaGraph 上解决社交网络问题的常规方法综述。其中介绍的方法提供都了 Playground 供大家学习、玩耍。 社交网络大家都不陌生,无论是微信、微博、B 站还是大众点评、知乎、陌陌等服务,其本质上的用户都形成了社交网络。 在一个社交网络系统中,我们可以用图数据库来表示用户和他们的连接关系。图数据库能允许对用户之间的关系进行有效的查询,使得各种基于连接查找、统计、分析的社交网络上的业务实现变得可行、高效。 例如,图形数据库可以用来识别网络中的“有影响力用户”,或者根据用户之间的共同点对新的连接(好友关系、关心的内容)进行推荐,再或者寻找社群中相聚集的不同人群、社区,进行用户画像。图形数据库因为在能支撑复杂多跳查询的同时也能支持实时写入、更新,使其非常适合应用在用户关系不断变化的社交网络系统之上。 1 图建模为了给出一些常见社交场景的应用示例,我会把大多数例子建立在一个典型的小型社交网络上,社交网络天然就是一张网络、图的形态。...

chatGPT 加 NebulaGraph 预测 2022 世界杯冠军球队

over 2 years ago

一次利用 chatGPT 给出数据抓取代码,借助 NebulaGraph 图数据库与图算法预测体育赛事的尝试。 1 蹭热度最近因为世界杯进行时,被这篇 Cambridge Intelligence 的文章启发(仅仅利用有限的信息量和条件,借助图算法的方法做合理的冠军预测),讨论到也可以试着用 NebulaGraph 玩玩冠军预测,还能顺道科普一波图库技术和图算法。...

基于开源技术栈的数据血缘、治理参考解决方案

over 2 years ago

也许我们没有必要从头在 NebulaGraph 上搭建自己的数据血缘项目,本文分享如何用开源、现代的 DataOps、ETL、Dashboard、元数据、数据血缘管理系统构建大数据治理基础设施 1 元数据治理系统元数据治理系统是一个提供了所有数据在哪、它们的格式化方式、生成、转换、依赖、呈现和所属的一站式视图。 元数据治理系统是所有数据仓库、数据库、表、仪表板、ETL 作业等的目录接口(catalog),有了它,我们就不用在群里喊“大家好,我可以更改这个表的 schema 吗?”, “请问谁知道我如何找到 table-view-foo-bar...

NebulaGraph 的云原生 API 网关最佳实践

over 2 years ago

本文介绍了利用开源 API 网关 APISIX 加速 NebulaGraph 多个场景的落地最佳实践:负载均衡、暴露存储结构与TLS Termination。 1 API 网关介绍 1.1...

利用 dbt,基于表结构的 Nebulagraph 图建模与 ETL

over 2 years ago

如何把相对原始的数据处理、建模并导入 NebulaGraph?本文用一个端到端的示例演示,从多数据源聚合数据,清理、利用 dbt 转换成 NebulaGraph 建模的属性图点边记录,最后导入成图谱的全流程。 1 任务假设作为一个类似于 Netflix、爱奇艺的服务提供商,我们需要利用 NebulaGraph 搭建一个用户-电影知识图谱,来辅助支撑推荐、问答和推荐理由等常见由图谱支撑的场景。 知识图谱需要的数据存在在不同的数据源,比如一些公开的...

基于图数据库的推荐系统

over 2 years ago

1 基于图数据库的推荐系统 本文是一个基于 NebulaGraph 上图算法、图数据库、机器学习、GNN 的推荐系统方法综述,大部分介绍的方法提供了 Playground 供大家学习。 1.1 基本概念推荐系统诞生的初衷是解决互联网时代才面临的信息量过载问题,从最初的 Amazon 图书推荐、商品推荐,到电影、音乐、视频、新闻推荐,如今大多数网站、App...

NebulaGraph 内核贡献开发指南

over 2 years ago

如何 build NebulaGraph?如何为 NebulaGraph 内核做贡献?从本章作为切入点就够了。 1 NebulaGraph 的架构简介为了方便对 NebulaGraph 尚未了解的读者也能快速直接从贡献代码为起点了解它,我把开发、贡献内核代码入手所需要的基本架构知识也在这里以最小信息量的形式总结一下,作为前导知识,请资深的 NebulaGraph 玩家直接跳过这一章节。...

nGQL 简明教程,第二期 nGQL 执行计划详解与调优

over 2 years ago

本文旨在帮助 NebulaGraph 新手快速了解查询语句调优,读懂查询计划。 很长时间以来,NebulaGraph 社区里最热门之一的话题都是“我如何表达这样的查询最好?“,”我这个查询还有优化空间吗?“这一类的。今天,我就试着介绍一下如何理解查询语句的执行与优化过程,帮助大家脚踩在地上去写自己的查询语句。 同时,这篇文章也是 nGQL 简明教程系列的第二期,通过本文了解面向性能去写查询语句之后,我们在进行图建模的过程(第三期的内容)中也能有更多支撑。 1 一个查询的一生先从一个查询语句从进入 NebulaGraph 一直到返回查询结果的全过程。...

nGQL 简明教程

over 2 years ago

本文旨在让新手快速了解 nGQL,掌握方向,之后可以脚踩在地上借助文档写出任何心中的 NebulaGraph 图查询。 本文配套视频教程还在录制中,敬请期待。 1 视频TBD 2 开始之前本文假设你已经在文档看过快速入门流程,部署、连接过 NebulaGraph,并且看过了常用命令。如果您还没看过这两个文档,强烈建议先快速过一遍。 2.1 教程目标本教程目的在于让新手大概知道了...