杭州区块链国际周 | 圆桌对话:隐私计算在产业中如何发挥“用武之地”

ElaineW 发布在 区块链 12594

开头: 7月5日,杭州区块链国际周分论坛【“隐私计算:让数据安全有序流动起来”暨2020隐私计算产业30强榜单颁奖典礼】顺利开幕。此次论坛由算力智库联合巴比特、海南省大数据管理局、上海人工智能发展联盟、长三角大数据产业合作联席会议、新财富等共同举办,论坛汇聚了国内外近几年来在隐私数据与安全计算领域专注耕耘的大厂、金融机构与科技企业重磅嘉宾与专家首次云集,共享数据应用思辩饕餮盛宴,同时,还颁发了2020隐私计算产业30强榜单。

在分论坛中,国盛证券研究所所长助理宋嘉吉主持了以《隐私计算在产业中如何发挥“用武之地”》为论题的圆桌对话,多位行业专业人士对此各抒己见,交流心得体会。

圆桌嘉宾主持人:

国盛证券研究所所长助理、通信行业首席分析师 宋嘉吉

圆桌嘉宾:

云象-浙江大学区块链联合实验室负责人 陈建海

同盾科技人工智能研究院深度学习首席专家 李宏宇

锘崴科技创始人 王爽

富数科技安全计算首席专家 卞阳

微众银行首席架构师 张开翔

 

宋嘉吉:欢迎各位嘉宾参加这场分论坛的圆桌交流,我是国盛证券的宋嘉吉,在过去一段时间,我们站在券商的角度一直非常关注一二级市场在区块链,包括相关联的一些细分领域的研究。今天,我们就隐私计算这个话题来和各位做一个分享,早期大家关注的最热门的词是区块链,隐私计算相对小众一些,市场上这两年这个概念兴起以后,大家对这个概念有点模糊,早先市场有很多这样的概念,包括可信计算等等,先请各位专家和大家分享一下,如何定义这个隐私计算,和市场以前所了解的可信计算这些概念有什么区别?

陈建海:大家好,非常高兴能够来到这个现场,今天也是学习了很多,我在隐私计算方面的研究也是比较初步的,我来自云象-浙江大学区块链联合实验室,重点在区块链方面的研究。区块链来了以后安全可信是核心的问题,所以应该说安全也火了,所以隐私计算这个词,在区块链应用的时候很重要的一点就是解决多部门之间的协作,数据互通互相,解决的是可信的问题。相当于让数据在计算机当中能够看到的是靠谱的,让人是信任的,数据不能丢失,这里离不开密码学。实际上隐私本身就是一个问题,比如说隐私保护,数据本身不能丢,数据包含的真正和用户相关的私密信息不能丢,所以隐私计算应该理解成就是一种技术、计算,所以要解决隐私问题我们说用密码学的技术。密码学当然靠算法,算法离不开算力,好算法需要服务器,所以隐私计算一定是基础的技术,真正要解决隐私问题靠计算肯定是离不开的,当前有很多密码学的技术,实际上还是有很多研究要突破的,不仅仅是硬件本身要改善。

李宏宇:大家好,我是来自同盾科技的李宏宇,很荣幸和大家一起分享和探讨隐私这个领域最新的一些东西。刚才提到隐私计算的概念,从我个人的理解来讲,从字面上来看隐私计算是关于隐私数据的计算,在隐私数据的基础上计算,从这样一个角度来看,隐私计算和我们说的联邦学习其实都是有异曲同工之妙,其实隐私计算不能局限在刚才我们看到徐教授的PPT中提到,隐私计算不是一种技术,不是一个具体的技术,可能是一个体系,一系列的方法都存在、都属于隐私计算当中的一环。我们同盾提到知识联邦,和这个有异曲同工之妙,隐私计算对于如何处理、如何计算隐私数据,保护隐私数据的基础上发挥更多的功能,不仅仅是局限在计算这个层面上,可能从隐私数据的采集、存储到隐私数据的使用,以及到隐私数据的销毁,隐私计算可能从广义来讲可能涉及到的面更广,可能涉及到很多东西。

刚才也提到,隐私计算这几年还是一个小众的话题,但是事实上每一个流行起来的领域都是从小众的话题慢慢成为一个热门领域,我也是相信在未来的3-5年的时间,我们可以看到隐私计算成为一个非常蓬勃、非常壮大的新的领域,谢谢大家!

王爽:非常荣幸今天能够和大家分享一下我对于隐私计算的理解。我们锘崴科技主要专注于在医疗领域应用隐私计算服务于医疗大数据的分析分享,我们医疗数据隐私计算有很久了,在美国创办了国家生物医学计算中心,专注于通过隐私计算技术来服务大数据的互联互通,我可以理解隐私计算是传统意义上的信息安全的拓展和飞跃,传统信息安全更多在数据防和守阶段,比如说美国规定医疗数据通过什么样的安全标准才可以进行存储和传输,通过什么样的脱敏标准才可以进行数据分享。

在传统方式下并不能保证数据的绝对安全,加密只能保证数据在存储和传输过程当中的安全,使用过程当中还是需要解密的,存在信息上的安全漏洞,传统数据脱敏的办法还是要交给第三方使用,数据的使用权、管理权存在相应的缺失问题,隐私计算应运而生,能够解决传统防和守的问题,更多是主动的确保数据在使用过程当中是一个定向和定量的分配和分享方式,定向就是有权使用这些数据的使用方才能够进行分析,定量就是只能够获得被允许获得这方面的数据,比如说医学领域很多分析的结果并不是关注个体数据本身,而是关系一个计算的结果,比如说某种基因变异的位点和某种疾病的相关性。通过隐私计算的技术,可以实现多中心的合作,定向定量信息的传递和分享。

卞阳:大家下午好!今天有很多专家观点都非常精辟,我也非常高兴来这里和大家一起做一个交流和分享。富数科技在行业里比较早做隐私计算,2017年做大数据,发现大数据有很多金子可以挖掘,但是风险很大,所以当年立项做隐私计算。我之前做信息安全,也有对人工智能的从业经验,所以负责孵化这个项目。

今天我们是区块链的分论坛,我也讲一讲区块链和隐私计算的关系,区块链要共享账本,达成共识,隐私计算恰恰相反,信息是不能共享,要进行保护。看起来两个是矛盾的,但是事实上隐私计算一定是涉及到多方的,如果计算过程当中只涉及到单方面的数据,只需要在本地做计算,不需要做加密了,不需要保护隐私了,所以隐私计算也是多方协同,也需要交换、也需要共享,这个过程当中和区块链的交换共享、达成共识就一致起来了。反过来区块链的共享账本,每个人交易记录所有人都可以知道,都透明,大家不敢用,所以需要隐私计算来保护这方面的数据和信息,从这个角度来讲,区块链和隐私计算是你中有我、我中有你,完全同意的。

富数开发了一个隐私计算的平台,通过这样一个平台希望能够做到做到个人信息用APP中,我们不知道背后到底传递了多少方,有这样的平台可以让个人的信息暴露的面大大减少,企业和企业之间合作的时候,也不需要把自己的数据都给到合作方或者去到中间的地方,各方数据可以在本地得到安全的保护。同时要做增量的市场,数据价值要发挥出来,通过隐私计算把价值能够真正的实现变现,数据生产要素能够真正的流通起来。

张开翔:我们微众银行做区块链研究有一些年头了,我们2014年、2015年开始研究的,今天这个主题讲隐私计算,要给计算下一个定义很难,但是我们做区块链的过程当中有一个痛点问题就是隐私保护,做计算还是做什么事情最终是保护隐私,隐私什么时候会产生风险,其实在多方参与到一个事情中,你的主体的数据透露给了第三方,甚至是敌对一方才会产生隐私保护的问题,如果数据只在本地是没有问题的。所以区块链加剧了隐私泄露的风险,因为分布式账本一切数据共享以后、透明以后,加剧了隐私的泄露和隐私的扩大面。所以,2016年开始我们开始研究隐秘支付,我们是银行,支付我们觉得是重头的方向,同时我们还研究很多。

回到主题,隐私保护和隐私计算它是很宽泛的一个话题,如果你把数据留在本地,用可信第三方的方式,可能不牵扯到计算,它是数据管理,管理制度也是保护隐私的非常重要的渠道,但是如果数据一定要拿出去多方联合证明或者得到一个模型就牵扯到一个计算。我们是学计算机的,HASH也是计算,联邦计算、大数据、人工智能也是计算,所以这是很宽泛的话题,这里有很多可以研究的地方可以和大家一起探讨。

宋嘉吉:感谢五位嘉宾,接下来时间分成两块,首先是技术,其二是产业,前面很多发言专家讲到了大数据,但是其实在隐私保护的角度来看,其实大数据有点既要又要的感觉,既要把数据分享出来又要保护你的隐私,其实我们也看到了很多尝试,早期的大数据交易所都在做这方面的尝试,当然结合所有的行业,包括在座的各位嘉宾涉及到的金融、供应链、医疗等等行业,又有自己不同的特性,我们先从技术上看一看,如何来实现的。当然当你实现隐私计算的时候一定要通过一些加密手段,在我们一般人来理解,就是通过加密、通过计算来弥补了你的隐私,这和性能之间需要不断取得平衡,这个过程其实算法非常多,MPC、联邦计算、TEE等等,首先请五位嘉宾介绍一下,咱们在自己各自的场景中怎样选择这些技术的,包括和资源的平衡以及和自己场景的平衡。

陈建海:我结合我们云象的一些落地的实践当中,我们提一下区块链和隐私解决安全问题的时候我们做了一些事儿,云象2014年开始做区块链,率先在银行、金融领域就开始,一直围绕金融领域做了非常多,包括供应链金融。我们是站在区块链底层平台来做,这几年我们也落地了很多实实在在的地方,把实际业务跑起来。一开始要突破区块链技术本身,这里有几个城市的架构,比如说性能上的共识怎么办,比如说早期走以太坊那一套,我们试了一下性能上比较弱,后来研究超级账本,所以现在在超级账本上也共享了很多代码。

当然在实际应用的时候也碰到了问题,比如说安全这方面,传统的密码学拿来用,实际上像超级账本当中也用256、椭圆,这些都是商用的密码,所以又要支持国密的,所以我们把国密的加密算法都整合起来,这里也是要根据用户对这个保护的需求来的,他们觉得这个是国家的,就是靠谱的,所以我们就做。现在主打的底层的基础平台,还有就是我们发起的VNT Chain,也是开源的公链的社区,把我们研究的一些架构进行集成,而且在这里我们也是希望大家能够一起多交流,我们也希望这方面向大家多学习,因为这里真的是关于密码学的一些应用在区块链当中很多,真的有很多东西是值得深入去研究的。比如说MPC,我们很早也探究了这个东西,也申请了很多专利,但是MPC一开始尝试它就是一个硬件还真的无法支持非常大的计算量,所以随着未来硬件的提升,包括通信,现在5G来了及网络的速度的突破,我想对我们隐私安全计算方面也会有一些改善,谢谢大家。

宋嘉吉:李总讲一讲这些技术中间有哪些优势,哪些BUG。

李宏宇:提到隐私计算两个最常见的领域,一个是MPC,一个是联邦学习,我们知道联邦学习某种程度上可以称之为安全多方学习,差别是一个在于计算,一个在于学习,学习当中也会涉及到计算,本质上是在联邦学习当中需要续联模型,安全多方学习,用既定好的规则可以实现相应的应用,联邦学习从Google最早提出来是应用在个人终端上做一些数据用户的隐私保护,我们国内有很多企业都有自己的数据,他们的数据的价值没有得到真正的释放,我们怎样把这些企业或者政府机构中存量的数据价值最大化,释放出来,这其实是面临的最大的难题。

同盾科技作为一个智能分析和决策领域的领军型企业,服务了有上万家企业级客户,我们在选择具体会采用什么技术首先会考虑到怎样解决企业里的存量数据怎样充分利用的问题,在联邦学习过程当中,我们进一步把这些挖掘了一下,扩大了从安全多方计算到安全多方学习产生了一个新的体系叫做知识联邦,比如说在金融领域场景两个问题,一个问题就是风控,怎样能够给一个客户合理的风险评估的分数,信用分是我们做所有小额贷款或者金融服务的时候经常面临的问题,如果想要给他们一个合理的风控,肯定就要利用多方数据训练出来一个模型,而不是根据规则直接得到的东西。这里就会涉及到标签,标签知不是可以泄露出来,标签不能泄露在什么程度上怎样通过可信第三方实现还是直接通过双方之间经过一些不经意的传输技术手段来实现,这就是一种方式。这个时候我们说一般肯定采用联邦学习在模型层上进行计算的过程。

在金融领域经常提到多头共战,可能遇到很多人,可能在一家机构贷款了,在另外一家机构贷款了,贷了很多家机构,这个人风险系数就高了,由于信息不对称无法确认这个人是 不是潜在隐患,这个时候肯定选择技术手段,不可能训练模型,用的是多方安全计算方式去解决这个问题。这里可能是我们有一定的先进的规则,通过加密手段在技术上把一些数据转换成有用的信息,我们说这些信息是有价值的,通过同态加密计算最后可以获取到一个结论,不要去数据的流动,要的是结论,结论说这个人有风险或者没有风险,最终可以形成非常有效的机制,这是在金融领域的应用,每一个业务场景其实都可能决定我们会选择不同的技术手段,这是根据实际的情况会有选择,比如说政务共享、开放过程当中可能应用的是另外的,因为更多是业务模块,涉及到数据检索查询,如何进行安全多方检索是另外一个议题。

宋嘉吉:接下来是王总这边如何平衡技术的选择以及优劣势。

王爽:其实每一种技术都有自己的优缺点,没有办法说同一个技术可以解决所有的问题,我们锘崴科技主要是深耕于医疗数据的隐私计算方面的应用,医疗数据本身也是非常复杂的,比如说临床数据、基因测序数据、图像数据,应用场景比较复杂,像有数据的查询、模型的构建、模型的使用、临床决策、支持,包括医院、药场、保险公司,在不同组合情况下,我们主要是通过利用不同的隐私计算的优缺点的组合,实现针对具体场景的应用。

我可以举几个具体的例子看一下我们具体怎样应用不同的技术来实现,比如说在多中心的罕见病的研究当中,锘崴科技的一套多中心系统实现了跨省的多家医院的合作,在这个案例当中,我们应用到了联邦学习和多方安全计算的技术的特点,保证每家医院的数据在不出医院的情况下,也能够实现增加样本量、增加样本维度的合作。但是在一些情况下,比如说做一些查询的情况下的时候,既要保护数据库本身,也要保护查询条件,因为很多药厂或者科研机构做查询的时候基因位点查询和疾病相关性信息是很敏感的,就要应用到其他不同的技术,比如说基于可信计算环境、同态加密针对性的技术解决数据库查询的问题。

既有一个很大的应用领域,就是医学上临床决策支持,很多情况下需要构建知识库,基于这个知识库和病人的相关的信息提供最好的诊疗方法和用药、诊疗手段,但是这些知识库压身是非常敏感的信息,可以通过一些同态加密的技术来加密的环境下进行模式的匹配,实现临床的决策的支持。

我们这个系统基本上要根据用户的具体的应用场景、数据类型来进行多技术的融合的支持。其实我们也是从很早之前就在用不同的技术,也在实践不同的技术,2014年我们构建了全球的演示计算大赛,每年20多个国家的队伍来参加这个比赛,通过我们在过去这些年的观察发现,需要基于实际的应用场景结合不同技术的优缺点实现最优化的隐私计算的解决方案。 宋嘉吉:关于医疗方面的隐私保护应用场景再单独请教你,接下来请卞阳总讲一下技术选择的问题

卞阳:我喜欢用武林门派来比喻,隐私计算三个主要技术:多方安全计算比作少林派,因为历史悠久,功力深厚,联邦学习比作武当派,要用到少林派多方安全技术密码学的技术,但是又发展了用在机器学习、人工智能方面,非常具有代表性,可信执行环境用到的硬件,我比作华山派,特别快,华山派的剑法特别快,但是原理和前面两种有很大的不同。

我非常认同前面几位专家的观点,这些技术要用在不同的场景,而且他们不是完全是相互排斥的,虽然最早的时候从多方安全计算开始的,但是做着做着就是联邦学习都相关了。 下一周有三个隐私计算的标准会发布,我们全程参与了三个标准的制定,最后还是要看用户的场景,然后我们需要集武功大城才能够真正解决实际问题。

宋嘉吉:从我们目前了解银行应用场景来看您怎么看这些技术

张开翔:我们做开源社区整个软件整个社区在用,不限于银行业,工业、农业、文化、娱乐都有,这是按照场景需要选择技术,对于基础设施建设者来看我们应该怎样做,有很多门派,就有很多武器,我们要建立一个武器库,建设一个尽量丰富能够解决问题的武器库,选择什么武器以用户需求、以成本,可能还有别的限制,比如说法律法规、标准等等。

比如说中印边境怎么解决问题?为什么没有用核弹?因为有特定场景的要求,所以在什么场景应用什么技术,前提是准备好一系列的兵器库。

宋嘉吉:结合各个场景在落地的时候要根据政策环境来选择,今天时间相对有限,关于具体的场景分析我们今后有时间再具体交流,希望未来从政策、从产业引导、技术发展各方面能够推进整个隐私保护从而引爆整个大数据浪潮,今天第一个分论坛到这里,谢谢大家!

本文链接:https://www.8btc.com/article/618234
转载请注明文章出处

评论
登录 账号发表你的看法,还没有账号?立即免费 注册