2. 关键特性

标签:关键特性

从功能组件上来看,WeDPR隐私计算系统主要包括:隐私计算核心算法实现组件、统一网关、隐私计算管理平台。

隐私计算核心算法组件是隐私计算任务的核心实现;隐私计算网关负责所有隐私计算节点的通信、机构内的服务注册和服务发现等;隐私计算管理平台实现了跨机构元数据信息同步、细粒度的用户和权限管理体系以及丰富的异构数据源的接入等。

2.1 隐私计算任务

丰富的隐私计算任务支持

  • 隐私求交集: 包括两方隐私求交集任务和多方隐私求交集任务,并从性能、网络带宽、使用场景等多方面考虑,实现了多种隐私求交集算法,包括CM2020(性能高), RA2018(非平衡PSI算法,适用于CS模式), ECDH-PSI;

  • 匿踪查询: 基于OT算法构建匿踪查询,可将数据集发布为匿踪查询服务开放给相关用户使用;

  • 联合建模: 基于SecureLGB和SecureLR算法支持多方数据联合建模,并可将建模结果发布为模型用于预测,满足了80%多方数据联合建模需求;

  • 联合分析: 基于安全多方计算算法,提供了类SQL/Python的隐私数据联合分析语法,可在不引入额外学习成本的前提下,满足数据开发人员基于多方数据进行联合分析的需求;

专家模式

  • 基于Jupyter构建了专家模式,并提供了联合建模Python toolkit: wedpr-ml-toolkit来支持数据开发人员在Jupyter中发起各类隐私计算任务,可在不升级隐私计算系统组件的前提下,实现数据开发人员各种定制化的数据统计、评估需求,提升了隐私计算系统的功能可扩展性

  • 实现了用户维度的Jupyter管理,多用户的Jupyter环境通过linux用户体系完全隔离开

2.2 隐私计算网关

统一网关

  • 支持基于最短路径的消息路由转发

  • 支持按节点ID、服务名、机构名进行路由寻址

  • 支持服务注册和服务发现

统一网关SDK

  • 提供Java/Python网关SDK,支持接入网关与其他节点、服务或者机构进行通信

  • 可向网关注册服务

  • 可从网关拉取服务信息

2.3 隐私计算管理功能

灵活可信的数据同步服务

  • 基于区块链进行跨机构元数据信息同步

丰富的数据源管理

  • 支持HDFS, Hive, MYSQL和国产数据库等多种数据源接入

支持DAG的任务调度模块

  • 任务调度模块支持DAG工作流

  • 各类隐私计算节点多活可扩展

细粒度的用户和权限体系

  • 支持多用户模式,并支持用户维度的数据、服务权限管理

  • 实现了通用的审批模块,支持数据、服务授权

服务发布功能

  • 数据集可发布为匿踪查询服务,供授权的用户或机构查询

  • 联合建模训练过程中产生的模型可发布为服务,供联合预测使用

API接入

  • 支持应用方通过申请的凭证AccessKey接入到管理平台