2020-12-07 12:24

隐私计算大爆发前夜,如何把握商机?丨世界区块链大会·武汉

12月5日,2020世界区块链大会·武汉正式在武汉国际会展中心开幕。大会由巴比特主办,并得到了武汉市政府、江汉区政府、武汉市经信局、中国信通院等部门单位的大力支持。

在当天下午举办的“联邦学习与隐私计算区块链的商业创新发展应用”圆桌论坛,蓝象智联CEO徐敏、洞见科技创始人、董事长姚明、微众银行系统架构师曾纪策、光之树副总裁武姗姗以及富数科技产品总监林琳,共同探讨联邦学习和隐私计算区块链的商业创新。

 

如何看待数据商业化和隐私之间的博弈和平衡?

 

徐敏:

数据商业价值和隐私在今天来看似乎是一对矛盾体,但就像两朵面对面冲来的海浪一样,不管这两朵海浪看上去是多么地冲突,在下一秒它们就会融为一体,有共同的前进方向。人类社会的很多矛盾冲突也是类似的,所以我坚信数据商业价值和隐私保护这对矛盾体一定会和谐一致地往前走,这个转变过程中,会需要人文、法律、科技三方面的配套,人文方面,我们需要在享受社会便利和隐私保护之间找到新的平衡点;法律方面,会需要来设定底线;人文和法律结合起来,人文设定上限、法律决定底线,之后就通过技术的发展来优化这个过程,达成更好的平衡态。

xumin

今天我们牺牲了40%的隐私,实现了60%的个人的便利性,有了隐私计算保护以后,我们只需要牺牲更少的个人隐私,就可以换取更多的个人便利性。

 

如何在数据隐私保护的前提下把握智能数据与区块链融合?

 

姚明:

先从信用本身讲起,信用行业是比较特殊的行业,行业的本质其实是在利用数据和人的历史经验,也就是模型和智慧去判断交易主体的风险。在这样一个领域存在第三方的信用评估场景,这个场景里面有个非常重要的原则,就是最少可用原则,如果大家关注信用产业的话,这个词是在政策法规中频繁提到的。最少可用的原则其实是为了保护主体的隐私能够不被泄漏,并且不被侵犯,这在今年的民法典里面也有所体现。另一部分也是为了保障公平性。

对于最少可用,实际上来说它实现的对于信息的可见部分尽可能不让它去泄漏出来或者被转售。对于这个最小可用原则,如果我们将它定义为是对可见的信息部分的一个保护,现在技术就提供了一个更新的机会,对于那些不可见的计算价值部分,如果我们能够将它抽取出来,是不是就可以打破这个最少可用的原则呢,这点就对于信用评价,特别是风控有重大的意义。

因为从风控的角度来说,它其实并不希望用最小可用原则,他希望用更多的数据来刻划交易对象的风险,以此来进行信用的量化定价和控制风险,这两者实际上是冲突的。那么这种冲突就给联邦学习和多方安全计算提供了机会,对于数据,把它用于计算的价值,从它的可见信息部分抽离出来,让这个不可见的计算价值部分尽可能多的去参与共享,参与流通,参与信用评价,这样就可以从技术层面突破最少可用原则,但是又充分保护了可见的个人隐私信息部分并没有被侵犯或者被泄漏,这个实际上是对信用产业一种技术的革新。

 

如何对整个系统做安全验证?

 

曾纪策

从隐私计算或者数据交换的原理方面,可以推理证明算法的安全性以及出具安全报告证书。从系统层面来说,比如系统通过3A、4A的安全认证,包括合作方身份,合作授权,还有账号以及审计。另外还有一个杀手锏,就是开源,微众银行是完全基于整个FATE开源系列构建商业化合作体系,除了离线建模,还包括在线推理、多云管理以及即将推出的可视化一站式建模和与区块链深度结合的FATEChain,开源系统经由社区打磨也容易让合作方代码安审。

zengjice

同时我们还提供建模过程中网络抓包验证方法,提供可审计的交互日志,同时即将结合区块链技术对整个合作过程的行为存证及追溯。

 

如何突破传统的数据合作模式,实现新型数据可用不可见的联合建模和价值共享?

 

武姗姗:

传统的数据开放的模式的有几个挑战,其一是数据的所有权和使用权无法进行分离。大家都认为数据放在一起进行计算,建模,开发以及去做相应的分析效果是最好的,但通常对拥有珍贵的数据资产的企业,他们很难去做数据开放的原因是,在传统的计算范式当中,数据发出去后,对方不会对数据反复付费,数据也会脱离数据所有权的人的控制,从而导致用途没有办法明确和监管;其二原来联合建模的模式把数据通过脱敏和据标签化输出,数据标签化主要还是对数据做一个降维,把它变成一个仍然还含有信息,但是维度和细节进行了简化的方式,这样距离真实的业务场景需求就会很远,使用方经常会反馈说给的标签不准,是否能定制标签和开放更底层的数据。因此传统方法无法解决数据融合中的安全、成本和效率问题。

wushanshan

联邦学习作为一种全新的技术架构,可以在物理分散,逻辑集中的前提下,让各个数据所有方各自在本地拥有自己的数据,在整个计算和建模的过程中,不需要互相暴露原始数据,并且可以去规定数据的用途和权限,整个数据流转过程做到数据的可用不可见。

 

隐私计算在整个商业化落地过程中所遇到的挑战

 

林琳:

第一个挑战是安全性证明,安全性是客户最关心的,而且是最难证明的一个环节和步骤,安全性证明会分成两个部分,一个是理论安全性,另外一个是工程安全性。理论安全性是通过完成一些行业相关的认证,另外还会跟客户一起去做安全相关的POC,来解决这个问题。工程安全性,我们希望通过我们产品把多方安全计算以及联邦学习这样一个非常复杂的但又很黑核的技术,能够把它透明化,让用户可以看到每一个运行的实际的步骤,每一个节点的流转,让他们觉得这个技术相对是可控的。

lilin

第二个挑战,隐私计算也是一个非常新的技术,各个方面都没有像其他的产品那么成熟,所以它的应用门槛是非常高的,我们希望通过现在已经在做的或者已经上线的,包括流程的自动化,联邦学习的可拖拽建模,以及联邦共享的一些算法库以及模型库来解决这样的问题,不断降低用户的使用门槛,推动大规模应用。

第三个挑战,这个行业有非常多的技术流派,并且到目前为止,这些技术流派之间还不能够做到互相兼容,我们也是希望在这个环节里面,可以不断地去推动互联互通,然后去推动行业往前再走一步。

 

联邦学习和隐私计算适合在哪些领域大放异彩?

 

林琳:

目前我们的多方安全计算以及联邦学习技术已经在智能风控、智能运营、政务开放和智能营销等领域都有一些非常好的案例。我们最近和交通银行以及中国移动合作的基于多方安全计算的中小企业融资服务项目,最近被选入了中国人民银行上海总部的金融科技创新监管试点应用。在这个项目里面,我们是通过多方安全计算这个技术,在数据不出域的情况下,让银行方和运营商这双方的企业的关系图谱,他们可以融合起来,帮助金融机构去识别这个企业背后非常复杂的关系网络和欺诈风险,帮助金融机构更精准地去投放中小企业的贷款,提高他们的风控水平,同时也提高用户的贷款体验。这个项目是目前第一个进入央行监管沙箱的隐私计算项目,我们认为它可能会对隐私计算整个行业在金融行业之后的发展和应用,会有很好的指引的作用。
武姗姗:
我们觉得隐私计算是通用型的技术,在各个行业都可以大有作为。除了我们之前在金融、政府、大型企业的实践外,光之树今年在智慧农业这块也做了一些银企合作的探索,我们和地方政府以及合作伙伴在推进从农业生产侧到销售侧的全流程数据安全融合,为产业金融创新、普惠的授信和农业保险的赔付提供更有力的抓手。
曾纪策:
联邦学习在国内用得比较多的是纵向联邦,适用于风控类场景,在金融领域有贷前、贷后审批等,这块微众已经应用到了消金、银行等合作伙伴,还有微众自营的几个贷款产品也用到了联邦学习。同时还在千人千面的推荐场景也有不错的效果。对于横向联邦,其中有个反洗钱的业务,被深圳市监管推荐应用。另外,联邦学习框架,还被应用于集团中台场景。
姚明:
隐私计算技术诞生在一个特殊的环境之下,其诞生的前提是多方参与整个数据的流转,在这个过程涉及到的场景方角色包括数据提供方、数据应用方、技术服务方、政府监管方等。洞见科技的基因是服务于信用产业,外延是服务于金融产业,再外延就是服务于政务金融产业。
徐敏:
我个人看好三个行业:金融、大健康、社会服务和治理。因为这三个行业一方面是量身定制方案的,第二是它是非常个人化的场景。我讲一下场景应用后的效果,很多时候两个数据碰撞的效果非常非常出乎人意料,我们最近帮助一个银行做预授信风控模型,我们通过引入运营商的几个数据因子,和银行因子碰到一起,效率非常高,因为两个行业之前是不同的行业,运营商并不知道自己的数据在金融行业这么有用,而银行不知道运营商有多少数据,我们作为桥梁,是把整个数据进行更加高效的合作,一定带来更多的回报,对整个社会会更好。
 

隐私计算和联邦学习的发展趋势

 

徐敏:

2020年是隐私计算元年,2021年是隐私计算的应用落地年,我能想见在接下去一年中,会出现很多很多百花齐放的场景,很多场景会得到全行业的复制。蓝象智联会重点聚焦在金融行业,同时我们会重点聚焦在金融的营销和风控两个领域。
姚明:
市场关于数据流通的环节可以分为四个时代:第一个时代是数据搬家时代;第二个时代是API时代,即用即调的模式;第三个时代是沙盒模式时代;第四个时代是隐私计算时代,即2020年为元年的“数据可用不可见”、数据不离库的方式,也是沙盒模式的升级版,真实的市场是这四种模式共存。在我看来,隐私计算的应用不但要开发新的落地场景,还要升级迭代传统的数据流通或共享交换的商业模式,所以从整个市场来看,既有存量市场,又有增量市场,从技术侧来看,无论是数据搬家还是API调用,亦或是沙盒、隐私计算等,其都有各自价值发挥的空间,我并不认为某一种技术能通吃整个市场,更多的还是根据场景特点选择组合或叠加某项技术来完成商业落地。

yaoming

用通俗一点的话来说就是,不管白猫黑猫能抓住耗子的就是好猫,没有万能的技术,只有万能的组合,这是我的观点。

曾纪策:
我认为在技术上一定也是百花齐放,各种隐私技术更为成熟达到商用要求,应用框架越来越丰富,已有框架方面更为完善及趋向开放性。

第二,治理,微众目前构建运营着超过530+机构的合作网络,网络趋向越大越丰富,治理的问题也比较突出,包括数据、模型、贡献度、安全可信、系统运作等等这些治理会变得非常重要

第三,工业应用标准,合作网络内部的标准化可以使得合作接入更为顺畅便利,不同合作网络之间更是需要协议标准来实现互联互通

第四,监管,例如今年我国就发布了隐私保护相关的法律法规,这个领域就大放异彩。

武姗姗:
随着隐私业务的持续的爆发,市场不断的反馈和表达,以及隐私信息的共享和交换的相关法律法规逐步的实施和构建,再加上在座的各位领导和同仁、行业共同的深耕,我们认为2021年隐私计算会获得巨大的推动力持续向前演进。在演进的过程中大家会找到更适合自己的路线,向平台化延伸或做场景化垂直深耕。同时我们会更加聚焦在互联互通,和提升隐私计算技术在客户业务场景的渗透度等方面的工作上。
林琳:
第一点,2021年,整个市场对于隐私计算的接受度会有个非常好的上升,也会有大量的商业化的案例去落地。

第二点,我们非常认同技术精进这一点,我们背后有竞争,但有很多的交流,会在很小的技术细节上去共同努力攻克它,真正把这个技术再往上推一个高度。

第三点,我们认为2021年在监管层面,我们行业的标准会更加明确,我们整个隐私计算的赛道它的商业逻辑也会更加清晰。

第四点,我非常认同互联互通这个说法,因为从终极的思维来想,隐私计算将来非常有可能成为一个非常重要的一个底层的基础设施。我们希望能够把隐私计算串联起来,真正能够让数据、价值和AI的价值,以安全的方式在更多的地方流动起来。

本文链接:https://www.8btc.com/article/677819
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册
下载
阅读
分享
评论
点赞
上一篇
下一篇