Neo4j

重要的

这个文档已经退休了,可能不会被更新。产品、服务或技术中提到的这些内容没有正式认可或由砖进行测试。

Neo4j是一个本机图形数据库,利用数据作为一流的实体的关系。你可以连接一个砖集群Neo4j集群使用neo4j-spark-connector提供Apache火花api为抽样,DataFrame, GraphFrames。neo4j-spark-connector使用二进制螺栓协议传输数据和从Neo4j服务器。

本文描述如何部署和配置Neo4j,并配置访问Neo4j砖。

Neo4j部署和配置

您可以部署Neo4j各种云提供商。

在AWS EC2 AMI使用自定义部署Neo4j遵循的指令托管Neo4j EC2 AWS。其他选项,请参阅官方Neo4j云部署指南。本指南假定Neo4j 3.2.2

改变从默认的Neo4j密码(您应该促使当你第一次访问Neo4j)和修改conf / neo4j.conf接受远程连接。

# conf / neo4j.conf#螺栓接头dbms.connector.bolt.enabled=真正的# dbms.connector.bolt.tls_level =可选dbms.connector.bolt.listen_address=0.0.0.0:7687# HTTP连接器。必须有一个HTTP连接器。dbms.connector.http.enabled=真正的# dbms.connector.http.listen_address = 0.0.0.0:7474# HTTPS连接器。可以有0或1 HTTPS连接器。dbms.connector.https.enabled=真正的# dbms.connector.https.listen_address = 0.0.0.0:7473

有关更多信息,请参见配置Neo4j连接器

砖的配置

如果你Neo4j集群运行在AWS和您想要使用私有ip,看到VPC凝视指南。

  1. 安装两个库:neo4j-spark-connectorgraphframes作为火花包。看到指南说明。

  2. 创建一个集群火花配置

    spark.neo4j.bolt。url螺栓:/ / < ip-of-neo4j-instance >: 7687 spark.neo4j.bolt。用户<用户名> spark.neo4j.bolt。密码<密码>
  3. 导入库和测试连接。

    进口orgneo4j火花_进口orggraphframes_瓦尔neo=Neo4j(sc)/ /虚拟数字查询检查连接瓦尔testConnection=neo数字(“匹配(n)返回n”;)。loadRdd(]