Text2CypherRetriever：让数据库查询像聊天一样简单！

发布日期：2024-12-13 12:11:43 浏览次数： 3458

作者：活水智能

微信搜一搜，关注“活水智能”

在如今的信息时代，快速、准确地检索数据是每个人都会面临的问题。无论是开发者还是普通用户，传统的数据检索方式往往需要掌握复杂的查询语言和数据库结构，这让很多人望而却步。

为了解决这个问题，Text2CypherRetriever 提供了一种全新的解决方案。通过自然语言生成 Cypher 查询，用户只需输入简单的自然语言问题，系统就能自动生成查询并返回结果。无论你是否熟悉数据库查询语言，都可以轻松完成复杂的数据检索任务。

接下来，我们将介绍如何使用 Text2CypherRetriever，并将其集成到你的项目中，帮助你更高效地检索数据。

什么是 Text2Cypher？

Text2Cypher 是一种将自然语言转换为 Cypher 查询的翻译方法。Text2CypherRetriever 通过首先请求 LLM 根据用户的问题生成一个 Cypher 查询来执行此方法。然后，该生成的查询将在 Neo4j 数据库中执行，以获取所需的信息。结果记录将添加到 LLM 的上下文中，以便为用户的查询生成最终答案。这种方法允许用户以自然语言输入查询，而 LLM 负责查询生成和答案编写，从而实现与数据库的更直观交互。

我们的内部研究表明，使用 Text2Cypher 作为检索方法相对来说是对不同问题变体最一致的应对方法，并且在处理不同复杂度的任务时表现优于其他策略。

设置

与之前的文章类似，首先连接到一个预配置的 Neo4j 演示数据库，该数据库模拟了一个电影推荐知识图谱。你可以使用 recommendations 作为用户名和密码，在 https://demo.neo4jlabs.com:7473/browser/ 访问该数据库。这个设置提供了一个现实的场景，你的向量嵌入数据已经是 Neo4j 数据库的一部分，可以直接使用。

在你的 Python 环境中，安装 neo4j-graphrag 包以及以下其他包：

pip install neo4j-graphrag neo4j openai

然后，使用 Neo4j Python 驱动程序建立与 Neo4j 数据库的连接：

from neo4j import GraphDatabase

URI = "neo4j+s://demo.neo4jlabs.com"
AUTH = ("recommendations", "recommendations")

driver = GraphDatabase.driver(URI, auth=AUTH)

检索

设置 Text2CypherRetriever：

from neo4j_graphrag.retrievers importText2CypherRetriever
from neo4j_graphrag.llm importOpenAILLM

t2c_llm =OpenAILLM(model_name="gpt-3.5-turbo")

neo4j_schema ="""
  节点属性:
  Person {name: STRING, born: INTEGER}
  Movie {tagline: STRING, title: STRING, released: INTEGER}
  关系属性:
  ACTED_IN {roles: LIST}
  REVIEWED {summary: STRING, rating: INTEGER}
  关系:
  (:Person)-[:ACTED_IN]->(:Movie)
  (:Person)-[:DIRECTED]->(:Movie)
  (:Person)-[:PRODUCED]->(:Movie)
  (:Person)-[:WROTE]->(:Movie)
  (:Person)-[:FOLLOWS]->(:Person)
  (:Person)-[:REVIEWED]->(:Movie)
"""

examples =[
"用户输入: '《黑客帝国》有哪些演员参演？' 查询: MATCH (p:Person)-[:ACTED_IN]->(m:Movie) WHERE m.title = 'The Matrix' RETURN p.name"
]

retriever =Text2CypherRetriever(
  driver=driver,
  llm=t2c_llm,
  neo4j_schema=neo4j_schema,
  examples=examples,
)

使用 Text2CypherRetriever，你可以轻松生成并执行查询，从数据库中检索信息：

query_text = "雨果·维文参演了哪些电影？"
print(retriever.search(query_text=query_text))

结果为：

items=[
RetrieverResultItem(content="<Record m.title='云图'>", metadata=None),
RetrieverResultItem(content="<Record m.title='裁缝'>", metadata=None),
RetrieverResultItem(content="<Record m.title='小猪宝贝'>", metadata=None),
RetrieverResultItem(content="<Record m.title='V字仇杀队'>", metadata=None),
RetrieverResultItem(content="<Record m.title='黑客帝国'>", metadata=None),
RetrieverResultItem(content="<Record m.title='采访'>", metadata=None),
RetrieverResultItem(content="<Record m.title='沙漠妖姬'>", metadata=None),
RetrieverResultItem(content="<Record m.title='证明'>", metadata=None)
]
metadata={
'cypher':"MATCH (p:Person {name: 'Hugo Weaving'})-[:ACTED_IN]->(m:Movie) RETURN m.title",
'__retriever':'Text2CypherRetriever'
}

将此检索器添加到 GraphRAG 流水线中：

from neo4j_graphrag.generation import GraphRAG

llm = OpenAILLM(model_name="gpt-4o", model_params={"temperature": 0})

rag = GraphRAG(retriever=retriever, llm=llm)

query_text = "雨果·维文参演了哪些电影？"
response = rag.search(query_text=query_text)
print(response.answer)

结果为：

雨果·维文参演了以下电影：
- 裁缝
- V字仇杀队
- 黑客帝国
- 沙漠妖姬
- 证明

总结

Text2CypherRetriever 是将 Neo4j 与生成式 AI 集成的一个重大进展。它通过使用自然语言处理生成 Cypher 查询，简化了检索过程，使开发人员更容易使用。此工具在需要精确、上下文相关的信息时特别有用，而无需管理向量嵌入。

学习资源

若要了解更多知识图谱或neo4j图数据库相关教学，你可以查看公众号的其他文章：

如何用GPT-3.5构建知识图谱？这份实操指南告诉你！
Neo4j GraphRAG：1个Python包，轻松搞定RAG + 知识图谱！
Mistral 7B+Neo4j：构建知识图谱的免费开源利器！
利用AI大模型，将任何文本语料转化为知识图谱，可本地运行
解读 Graph RAG：从大规模文档中发现规律，找到相互关系，速度更快，信息更全面！
利用LLM构建非结构化文本的知识图谱

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-07-08

企业AI落地，到底怎么样才算成功？

2026-07-07

不用 AI 会死，用了 AI 也不赢

2026-07-07

向 AI 许愿前，先搞清楚要解决什么问题

2026-07-07

“当天出demo，直接跟董事长对话”--某企业招聘超级AI个体靠谱吗？

2026-07-07

企业AI规模化落地思考：治理、场景和基建的三层建设路径

2026-07-07

AI 原生企业的真正定义：你的客户，是 AI 吗？

2026-07-06

企业 AI：方法论易得，交付力难求

2026-07-06

企业AI场景怎么从一句模糊需求，到一个能上线的AI产品

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

超级个体时代｜腾讯研究院3万字报告

2026-06-03

企业 AI 转型为什么需要 FDE 模式

2026-05-13

FDE越来越火，你认为这会是2026年AI落地之道吗？

2026-05-26

浏览器自动化：从GUI到OpenCLI

2026-04-14

别再做智能问数Demo了，根本上不了线

2026-04-20

从“无所不知”到“无所不能”，企业龙虾将怎样接管企业 IT

2026-04-16

企业软件“大越界”

2026-05-21

DataBuddy 庖丁解牛（系列1）：腾讯刚刚押下的「数据 Agent 全栈」

2026-06-10

ChatBI 是个伪需求，业务真正要的不只是“问数”

2026-04-27

埃森哲押注 FDE：咨询公司的宿命，它真的能破吗？

2026-06-02

大家都在问

企业AI落地，到底怎么样才算成功？

2026-07-08

“当天出demo，直接跟董事长对话”--某企业招聘超级AI个体靠谱吗？

2026-07-07

AI 原生企业的真正定义：你的客户，是 AI 吗？

2026-07-07

正当红的 Context Layer 到底是什么？

2026-07-02

哪些分析场景，值得企业投入分析 Agent？

2026-06-29

企业AI两年了，为什么还没出现真正的 Killer Case？

2026-06-18

咨询｜FDE 为什么突然火了？到底是咨询顾问、还是AI工程师更适合做FDE呢？

2026-06-11

为什么企业内部AI应用看起来厉害,用起来是垃圾?

2026-06-05

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw