[0057]第三更新单元,适于当所述第一子图信息和所述第二子图信息不同时,将第一子图信息与第二子图信息合并,得到更新子图信息。
[0059]将所述第一子图信息或所述第二子图信息作为主子图信息,读取另一个子图信息并将所述另一个子图信息写入所述主子图信息所在物理分区;
[0060]建立与所述第一索引标识相同的索引标识对应的图节点及与所述第二索引标识相同的索引标识对应的图节点间的关联关系;
[0062]更新所述另一个子图信息中各索引标识与所述更新子图的主标识的所述第一映射关系。
[0063]可选地,所述图数据处理服务的装置,还包括关联关系删除单元,所述关联关系删除单元包括:
[0064]第三获取单元,适于当服务检测到子图信息中一条关联关系信息需要删除时,获取待加入的一条关联关系信息对应的两个图节点信息的索引标识分别作为第一索引标识和第二索引标识;其中,一条关联关系信息对应两个图节点的图节点信息,一条关联关系信息包括两个图节点的关联关系、关联次数和最后关联时间;
[0065]第三目标子图获取单元,适于根据所述第一索引标识或所述第二索引标识获取目标子图信息;
[0066]关联关系信息删除单元,适于在所述目标子图信息所在的物理分区中删除所述关联关系信息,得到更新子图信息。
[0067]可选地,所述关联关系删除单元还包括第二判断单元,适于在子图信息存在关联关系信息中的关联权重值达到固定阈值时,判定需要删除对应的关联关系信息;其中,所述关联权重值通过所述关联次数和所述最后关联时间计算所得。
[0068]可选地,所述关联关系信息删除单元适于:当删除所述关联关系信息后,所述目标子图信息形成多个拆分后子图的子图信息时,将图节点的索引标识数最多对应的所述拆分后子图保留,将保留的所述拆分后子图作为更新子图。
[0069]可选地,所述图数据处理服务的装置,还包括子图删除单元,所述子图删除单元包括:
[0070]第四获取单元,适于接收到删除目标子图的子图信息的信息时,获取所述目标子图的子图信息中任一图节点的索引标识;
[0071 ] 第四主标识获取单元,适于根据所述索引标识及所述索引标识与主标识间的所述第一映射关系获取主标识;
[0072]目标物理分区查找单元,适于根据所述主标识与其对应的目标物理分区间的第二映射关系查找目标物理分区;
[0073]删除单元,适于当所述目标物理分区中存在所述主标识时,在所述目标物理分区中删除目标子图的子图信息、所述第二映射关系、以及所述目标子图的子图信息中每个图节点与对应的主标识码间的第一映射关系;
[0074]写入单元,适于在所述目标物理分区中写入仅包含所述目标子图的主标识的子图
[0075]可选地,所述图数据处理服务的装置,还包括物理分区清理单元,所述物理分区清理单元包括:
[0076]第一记录单元,适于当所述服务接收到存在待清理物理分区需要进行磁盘整理的信息时,适于记录当前所述待清理物理分区的子图信息为快照信息;
[0077]交换区写入单元,适于将所述快照信息写到交换区;所述交换区为磁盘中未被占用的空间;
[0078]清理单元,适于在所述交换区中清除所述快照信息中的已经被删除的子图所占用的物理分区;
[0079]同步单元,适于将当前所述待清理物理分区中新写入的信息同步写入所述交换区;
[0080]覆盖单元,适于将所述交换区中的信息覆盖所述待清理物理分区中的信息。
[0081]可选博亚体育 博亚体育app 在线地,所述图数据处理服务的装置,还包括子图清理单元,所述子图清理单元包括:
[0082]第二记录单元,适于记录每天所述图数据处理过程中所要求获取的所述主标识;
[0083]主标识合并单元,适于将规定的有效期内记录的所有所述主标识合并,得到有效的主标识集;
[0084]子图信息清理单元,适于搜索子图信息库,当查询到所述子图信息库中存在没有出现在所述有效的主标识集中的子图信息时,将所述子图信息删除。
[0086]本发明实施例通过在接收到查询目标子图的子图信息时,获取所述目标子图的子图信息中任一个图节点的索引标识,根据所述图节点的索引标识与对应的主标识间的第一映射关系获取对应的主标识,根据所述主标识查找所述目标子图对应的物理分区,判断所述物理分区中是否包含与所述主标识相同的标识信息,当所述物理分区中包含与所述主标识相同的标识信息时,则根据所述标识信博亚体育 博亚体育app 在线息获取到所述目标子图的子图信息,由于本发明实施例的技术方案通过任一图节点的信息即可高效获取子图的主标识,进而快速通过所述子图的主标识查找到子图存储的物理分区,从而实现通过任一图节点即可查询到子图的信息,提高了查询子图的效率。
[0087]进一步地,本发明实施例的技术方案还可以根据服务检测到的信息指示进行相应的插入关联关系操作、删除关联关系操作和删除子图操作,由于上述操作中涉及查询子图信息时采用了上述查询子图信息的方案,因此对应的图数据处理效率也相应地提高。
[0088]进一步地,本发明实施例的技术方案通过在检测关联关系信息中的关联权重达到固定阈值时,删除对应的关联关系信息,从而使得图节点之间的连通关系保持强连通,不至于使子图变得无限大,进而可以提高查询子图的效率。
[0089]进一步地,本发明实施例的技术方案通过记录每天所述图数据处理过程中所要求获取的所述主标识,将规定的有效期内记录的所有所述主标识合并,得到有效的主标识集,搜索子图信息库,当查询到所述子图信息库中存在没有出现在所述有效的主标识集中的子图信息时,将所述子图信息删除,从而实现通过定期清除来控制存储的图数据的大小,避免数据无限制膨胀不利于图数据的查询和处理。
[0096]图7是本发明实施例中的一种图数据处理服务的装置的结构示意图。
[0097]如前所述,现有技术中,图计算和图数据库主要是基于社交网络的需求,研究人与人之间的关系,图的查询注重的不是关系,而是含有关键词的信息,现有技术的图数据处理服务方法侧重与图计算,向用户返回包含关键词的信息,而不能实现图谱的高效查询。
[0098]本发明实施例通过接收到查询目标子图的子图信息时,获取所述目标子图的子图信息中任一个图节点的索引标识;根据所述图节点的索引标识与对应的主标识间的第一映射关系获取对应的主标识;根据所述主标识查找所述目标子图对应的物理分区;判断所述物理分区中是否包含与所述主标识相同的标识信息;当所述物理分区中包含与所述主标识相同的标识信息,则根据所述标识信息获取到所述目标子图的子图信息,从而实现通过任一图节点即可查询到子图的信息,进而提高查询子图的效率。
[0099]为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
[0100]图1是本发明实施例中的一种子图的结构不意图。图1中具有两个子图分别为子图a和子图b。图作为一种常用的数据结构包括图节点信息和边,图1中因为图a和图b不具有连通关系而分成了子图a和子图b两个子图,子图中由图节点和关联关系组成,每一个图节点在实际应用场景中可以具体定义为指代某一信息,而子图的边代表两个图节点间的关联关系。例如,假设图谱为互联网服务中的服务账号的拓扑图,那么子图a中图节点VI和图节点V2可以具体代表登录互联网服务中的账号,例如图节点VI可以代表用户的微博账号信息,图节点V2可以代表用户的微信账号信息,而图节点VI和图节点V2间的边代表用户的微博账号信息和用户的微信账号信息存在关联关系。
[0101]需要指出的是,可以具体定义由哪些信息内容唯一与一个图节点对应,例如,图节点VI可以代表用户A的微博账号信息而V2可以代表用户的微信账号信息。除此之外,还可以定义图节点VI代表用户使用A终端登陆微博账号,而图节点V2代表用户使用B终端登陆微博账号,即用户在不同的终端上登陆同一互联网服务账号也可以细分为不同的图节点,图节点信息中可以加入终端的标识信息,使得图节点信息唯一与一个图节点对应,通过定义每个图节点的图节点信息,可以有助于挖掘用户在不同终端上的用户行为等丰富的数据。
[0102]在本发明的具体实施中,每个子图都有一个主标识,每个子图的主标识是第一次写入关联关系时的图节点的索引标识,所述图节点的索引标识与图节点信息一一对应。例如,图1中子图a中第一次写入关联关系时的图节点是VI,图节点VI的索引标识为1,则索引标识1为子图a的主标识。