前言
Neo4j是一个基于图形数据模型的NoSQL数据库管理系统。
一、neo4j介绍
Neo4j是一种图形数据库管理系统,它使用图形模型来存储和处理数据。它被广泛用于各种领域,包括社交网络、网络安全、生命科学、金融服务和知识管理。
- Neo4j的图形模型由节点和边组成。节点代表实体或对象,边表示它们之间的关系。节点和边都可以拥有属性,这些属性可以是任何类型的数据。Neo4j的图形模型可以轻松地表示复杂的关系和连接,并且支持深度查询和数据可视化。
- Neo4j提供了丰富的查询语言Cypher,它是一种用于查询图形数据的声明性语言。Cypher提供了一种易于使用的方式来查询和操作图形数据,它的语法类似于SQL。Cypher的查询可以返回节点、边、节点和边之间的关系、关系的属性等。
- Neo4j还支持ACID事务,这使得它成为处理复杂事务的理想选择。此外,它还提供了许多高级功能,如索引、聚合、限制、排序、批量操作、过滤器等。这些功能使得Neo4j可以满足各种应用程序的需求。
- Neo4j可以作为一个独立的数据库服务器运行,也可以作为一个嵌入式库集成到应用程序中。它支持多种编程语言和平台,包括Java、Python、.NET、Node.js和Ruby等。
总之,Neo4j是一种强大的图形数据库管理系统,它使用图形模型来存储和处理数据。它提供了丰富的查询语言、ACID事务和许多高级功能,是处理复杂数据的理想选择。
二、安装
2-1、JDK安装
下载链接:https://www.oracle.com/java/technologies/downloads/: 之后直接安装即可。
2-2、环境变量配置
- 电脑->属性->高级系统设置->环境变量
- 系统变量里,新建环境变量,命名为JAVA_HOME,变量值设置为刚才JAVA的安装路径
- 编辑系统变量的path属性,新建-然后输入%JAVA_HOME%\bin,保存。
- 打开命令提示符CMD(WIN+R,输入cmd),输入 java -version,若提示Java的版本信息,则证明环境变量配置成功。
2-3、安装neo4j
下载链接:https://neo4j.com/download-center/#community: 下载之后直接解压即可,无需安装。
2-4、配置环境变量
- 电脑->属性->高级系统设置->环境变量
- 系统变量里,新建环境变量,命名为JNEO4J_HOME,变量值设置为刚才neo4j的安装路径
- 编辑系统变量的path属性,新建-然后输入%NEO4J_HOME%\bin,保存。
- 以管理员身份运行cmd。然后,在命令行处输入neo4j.bat console,出现如下界面说明安装成功。
在浏览器中输入界面中给出的网址http://localhost:7474/,显示界面后输入默认的用户名和密码neo4j。登录之后显示如下界面:
- 首先需要安装py2neo库,可以通过以下命令安装:pip install py2neo
- 下面是一个示例代码,展示了如何使用Python连接Neo4J图数据库:
from py2neo import Graph, Node, Relationship, NodeMatcher # 连接数据库 graph = Graph("bolt://localhost:7687", auth=("neo4j", "password")) # 创建一个Person节点 person = Node("Person", name="Alice", age=30) # 将节点添加到数据库 graph.create(person) # 创建一个Movie节点 movie = Node("Movie", title="The Matrix", released=1999) # 将节点添加到数据库 graph.create(movie) # 创建一个Director节点 director = Node("Director", name="Lana Wachowski") # 将节点添加到数据库 graph.create(director) # 添加节点之间的关系 graph.create(Relationship(person, "ACTED_IN", movie, roles=["Trinity"])) graph.create(Relationship(director, "DIRECTED", movie)) # 查询节点 matcher = NodeMatcher(graph) alice = matcher.match("Person", name="Alice").first() matrix = matcher.match("Movie", title="The Matrix").first() print(alice) print(matrix) # 查询关系 query = "MATCH (p:Person)-[r:ACTED_IN]->(m:Movie) WHERE m.title = 'The Matrix' RETURN p, r, m" results = graph.run(query) for record in results: print(record) # 更新节点 alice['name'] = 'Alice Smith' graph.push(alice) # 删除节点和关系 graph.delete(alice) graph.delete(matrix) graph.delete(director) # 删除已有的内容 graph.delete_all()
这个示例代码演示了以下操作:
- 连接Neo4j数据库
- 创建三个节点: Person, Movie, Director
- 添加节点之间的关系: ACTED_IN, DIRECTED
- 查询节点和关系
- 更新节点
- 删除节点和关系
需要注意的是,上面的示例代码只是一个简单的入门示例,实际使用中可能需要进行更多的操作和查询。如果需要更多关于py2neo的信息和文档,请访问官方文档:https://py2neo.org/
四、常用的Neo4j命令:
安装服务:bin\neo4j install-service 卸载服务:bin\neo4j uninstall-service 启动Neo4j服务器: neo4j start 停止Neo4j服务器: neo4j stop 打开Neo4j控制台: cypher-shell 创建节点: CREATE (:Label {property: value}) 创建关系: MATCH (a:Label1), (b:Label2) WHERE a.property = value1 AND b.property = value2 CREATE (a)-[:RELATIONSHIP]->(b) 查询节点: MATCH (n:Label) WHERE n.property = value RETURN n 查询关系: MATCH (a:Label1)-[r:RELATIONSHIP]->(b:Label2) WHERE a.property = value1 AND b.property = value2 RETURN r 更新节点: MATCH (n:Label {property: oldValue}) SET n.property = newValue 删除节点: MATCH (n:Label {property: value}) DELETE n 删除关系: MATCH (a:Label1)-[r:RELATIONSHIP]->(b:Label2) WHERE a.property = value1 AND b.property = value2 DELETE r 显示数据库信息: CALL dbms.showCurrentUser() 显示当前数据库中所有标签: CALL db.labels() 显示当前数据库中所有关系类型: CALL db.relationshipTypes() 显示当前数据库中所有节点: MATCH (n) RETURN n 显示当前数据库中所有关系: MATCH ()-[r]->() RETURN r 显示节点的所有属性: MATCH (n:Label {property: value}) RETURN properties(n) 显示关系的所有属性: MATCH (a:Label1)-[r:RELATIONSHIP]->(b:Label2) WHERE a.property = value1 AND b.property = value2 RETURN properties(r) 显示节点的所有标签: MATCH (n:Label {property: value}) RETURN labels(n) 显示节点的所有关系类型: MATCH (a:Label1)-[r]->(b:Label2) WHERE a.property = value1 AND b.property = value2 RETURN type(r) 计算节点数量: MATCH (n:Label) RETURN count(n) 计算关系数量: MATCH ()-[r]->() RETURN count(r) 按属性值排序显示节点: MATCH (n:Label) RETURN n ORDER BY n.property ASC/DESC 按属性值排序显示关系: MATCH ()-[r]->() RETURN r ORDER BY r.property ASC/DESC 显示节点度数(入度和出度): MATCH (n:Label {property: value}) RETURN size((n)-[:RELATIONSHIP]->()), size(()-[:RELATIONSHIP]->(n)) 执行聚合函数: MATCH (n:Label) RETURN sum(n.property), avg(n.property), min(n.property), max(n.property) 使用WHERE子句过滤查询结果: MATCH (n:Label) WHERE n.property >= value RETURN n 使用LIMIT子句限制查询结果数量: MATCH (n:Label) RETURN n LIMIT value 使用SKIP子句跳过查询结果的前几行: MATCH (n:Label) RETURN n SKIP value 使用WITH子句进行结果分组和传递: MATCH (a:Label1)-[:RELATIONSHIP]->(b:Label2)-[:RELATIONSHIP]->(c:Label3) WITH a, c, count(*) as count WHERE count > value RETURN a.property, c.property
五、错误汇总
5-1、Neo4j报错:py2neo.errors.ProtocolError: Cannot decode response content as JSON 解决方案
- 创建neo4j,对数据库增删改查时的报错,解决方案如下:
# 执行build_medicalgraph.py时发生错误。 # 该错误为graph_name为空时的问题, 即在连接时需要指定name属性,则报错解除。 self.g = Graph("http://localhost:7474/browser/", auth=("user", "password"), name='neo4j')
5-2、解决报错UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xaf in position 81: illegal multibyte sequence
- 该错误发生在读取数据时,解决方案如下:
# 在open的函数最后加上编码encoding='utf-8'即可,错误解决! for data in open(self.data_path, encoding='utf-8'):
5-3、解决ValueError: The following settings are not supported: {‘http_port’: 7687}
- 初次加载代码时发生这个错误,主要是因为py2neo包是新的,可以考虑降低版本或者解决方案如下:
# 初始代码如下: self.g = Graph( # host="", # neo4j 搭载服务器的ip地址,ifconfig可获取到 http_port=, # neo4j 服务器监听的端口号 user="", # 数据库user name,如果没有更改过,应该是neo4j pasword="") # 只要将上边代码格式更改为: self.g = Graph("http://localhost:7474/browser/", auth=("user", "password"), name='neo4j') 即可。
# 也可以直接安装旧版本 pip uninstall py2neo pip install py2neo==4.3.0
5-4、pip install ahocorasick 无法安装的问题
# 包的名字改了,改为 pip install pyahocorasick
参考文章:
关于使用Py2neo连接Neo4j图数据库出现“ValueError: The following settings are not supported”报错的解决方案.
总结
又是一个周五,想出去玩。😊