区块链安全和效率并非不可兼得,MPC用于隐私保护成熟至少要5年时间

时间:2018-12-12 23:06:48

分类:区块链新闻

2018年9月12日,在第四届区块链全球峰会《区块链与隐私保护》圆桌论坛上,PlatON创始人孙立林、趣链科技CEO李伟、Least Authority首席执行官Liz Steininger、微软中国云计算创新中心首席产品经理宋青见对区块链与隐私保护进行了讨论,新加坡新跃社科大学李国权教授担任本场讨论主持人。

2018第四届区块链全球峰会隐私保护

对于安全和隐私保护二者的关系,与会嘉宾普遍认为是要分开看,安全是数据不可以被窃取,隐私是数据在流通过程中不要把细节透露给不需要知道的人。在安全和隐私保护的实现上,宋青见提出将公链技术和联盟链结合,用公链来做联盟链数据的存证,可以增加联盟链没有公有链可信度高的缺点,联盟链又提高了很高的吞吐量,达到了安全访问同时降低了隐私保护的难度。

对于要达成安全和隐私保护,区块链的性能是否会随之下降这个问题,孙立林认为这个问题需要重新审视。理论密码学往往存在大量的前提和假设,认为安全性和效率一定是对立的,这些假设是否真的成立很多经典的论文里并没有给出解释或者只是模糊解释。目前看,上述对立有可能不完全成立,有可能会从理论上重新构造问题。

对于将MPC(安全多方计算)用于隐私数据处理的前景,李国权表示目前的算力还达不到相应的水平。孙立林则从实践的角度出发,认为三方以上的算法到工程化实践乐观估计要五年的时间。因为前端要做大量的数据预处理,要配合AI,从编译器到虚拟机到调算法又需要大量的应用,同时还要依赖于硬件加速。

以下为圆桌讨论详细内容,整理:

主持人(李国权):你们怎么看隐私保护?如何解决隐私保护的问题?

孙立林

孙立林:隐私保护和数据流动是完全不同的两件事情,你把黄金存在保险柜里是安全的,但金子想进到市场做流动的时候需要提供足够多的隐私保护。所以我们在做的事情主要是为了确保数据的流动性以及在数据流动过程中如何提供完备的隐私保护。最终的目的是为了给数据做基准定价以至于能够被当成数据化的资产来衡量。

李伟:隐私保护和安全是区块链极其重要的地方。安全与隐私要分开来说,安全就是数据不可以被窃取,隐私是数据在流通过程中不要把细节透露给不需要知道的人。在现实生活中,往往安全和隐私又是一起出现的问题,所以很多时候我们会一起来解决。

主持人(李国权):Liz,据我所知你做了许多关于异地备份的相关工作。

Liz Steininger:是的,Least Authority是关注于安全以及软件备份,安全是隐私的很大前提,一旦我们确保了安全就应该来保障隐私。所以Least Authority做安全的咨询会看区块链项目如何进一步对产品进行安全保障。另外一方面我们对于隐私保护有着非常大的规划。

宋青见:安全和隐私是不同阶段、不同角度的技术。联盟链首先要解决必须是安全地连接到联盟链,因为联盟链不像公有链。公有链是假设没有安全情况下照样能够保证网络的运行,隐私保护在公有链上往往可以单独讨论的。但是在联盟链上因为涉及到对联盟链的访问是可控的,在可控的情况下安全是第一步,在安全访问的前提下又要提供隐私的保护。

举一个供应链的例子,核心企业可以看到所有供应链的数据,但是在供应链环节里一级供应商是背靠背的,他们不希望看到互相的数据。首先所有能访问网络需要新解决安全的问题。

主持人(李国权):我们如何来实现安全以及隐私保护?

songqingjian

宋青见:如果是公链技术和联盟链结合,把联盟链作为Layer2,这样就可以有取长补短,协同提高的效应。因为我们可以用公链来做联盟链数据的存证,可以增加联盟链没有公有链可信度高的缺点,联盟链又提高了很高的吞吐量,达到了安全访问同时降低了隐私保护的难度。这两种技术如果结合起来就像Layer2基于Layer1分层的架构,适合做真正落地的实际应用。

主持人(李国权):如果是这样的话,在安全和隐私保护方面会不会有所妥协呢?

宋青见:实际上是通过Layer2弥补了隐私保护,在公链上能放到隐私保护,放在联盟链里反而可以提高性能,因为联盟链会降低实现隐私保护的难度。

主持人(李国权):如果我们把公有链跟私有链结合就需要建立更多的信任。从设计的角度出发,如何增加攻击者的成本同时保护隐私?

Liz Steininger:我们应该思考在不同层所在做的是什么以及所要架构的是什么,如果我们要保护数据隐私的话那不可能就需要一些许可的区块链,所以我们要考虑一下是把数据存储到公链还是存储到许可链,或者可以思考一下可能不会在一些特定使用案例中使用许可链。对我们来说,有一些所谓的威胁建模,可以通过建模分别解决对于数据的风险。对于一些特定的案例可以使用特定的技术、特定的结合。

李伟:不同的场景需要用到不同的技术,包括Layer 1和Layer 2是在性能、隐私的权衡,很难找到大一统的方案,既能满足性能的需求又能满足隐私保护的需求,这是非常困难的。但往往很多时候我们牺牲一点点可以得到更好的其他特性,这还是根据具体场景来确定的。

孙立林:本来我们做MPC,MPC里有不同的分法,从不同假设来说算法得到的结果是不一样的,我们对世界做了抽象,好人还是坏人,信任还是不信任。密码学、隐私保护是有大量的假设和前提的,而假设和前提在工程上得到应用以后会有很多的新情况涌现,我们的根本出发点有些不同的想法,公司内部已经不再提公链和联盟链的区分了,我个人认为分发已经过时了,我们通常的提法是现在做的新项目是完全面向全球计算的新架构,矩阵元做的事情是企业级的服务。

至于到底有没有token这件事情已经不重要,有很多企业是有token需求的。从比特币、区块链原生的设计来说就是把支付、清算、结算作为基本的账本,在设计上做了取舍,为了节省环节会给出token处理掉,变相地回到了现金时代,不能说有token就不是企业级服务。你就是发行了记账单位还处理它,否则区块链会被当成数据库或者存储过程来用,这是我们对整件事情的基本看法。第一要分前提,第二不能简单地区分是公链还是联盟链。

主持人(李国权):链上的挑战包容性的区块链是关于设计的思维,链下要把区块链和物联网、AI连接在一起,这会不会成为攻击的重点?会不会帮助我们来保护隐私呢?

liwei

李伟:这些东西只能保障在链上数据的安全或者已经数字化以后在线上的价值产地。但往往数字世界的价值希望跟物理世界进行影射不是简单的区块链的问题。

举一个现在很热的溯源例子,我们经常讲区块链可以做溯源,但区块链真的自己能做溯源吗?其实我的答案是否定的。比如说一瓶水上面贴个二维码是从加拿大雪山上运过的,到了上海的一家超市打一个孔把水抽出来罐进自来水去抹平,这个水是不是加拿大的水?区块链只能证明二维码上是加拿大的,但能否证明瓶子里的水是加拿大吗?

一些硅谷创业公司专门做了可食用硅,如果是贵的东西就需要通过辅助的IoT、生物技术、3D打印等辅助技术证明线下资产跟线上资产的对应,这才是关键。区块链本身的研究非常关键,但区块链+IoT、生物技术、3D打印等把物理世界上链的过程是非常重要的,如果这件事情做不好的话那链上的资产是否是安全的?

主持人(李国权):第一次数据被放在链上的时候需要有第三方的信任相关机构来证明放在链上的数据是正确的,很多时候在我们研究现实应用的时候这一点往往会被忽视,你如何赢得第三方信任?如何减少第三方信任的成本来确保数据是正确的,这是非常复杂的。还有没有其他的方式利用链下的技术来确保我们能够获得更高的隐私保护?

Liz Steininger

Liz Steininger:对于个人数据而言可能考量的不太一样,比如说你有一个公司对于隐私的关注是公司的商业秘密、公司的操作的专属信息,对个人数据而言还是涉及到初始设计的问题,数字来自于谁,你能不能信任数据的原始来源。一旦你有了数据以后想要进行隐私保护、安全储存,同时你依然需要利用区块链的功能和特点。一种方法就是链下的数据存储的技术可以利用哈希、加密参考到许可链或者公有链当中,因为这可能涉及到联盟链当中的隐私保护的问题。你可以利用链下的数据存储以及隐私保护的技术再影射到公有链当中,这样也可以实现确保性,从而确保隐私保护。

主持人(李国权):我们可能需要很多其他的智能合约、代码来确保能够和链下进行链接,智能合约有多透明呢?如何确保智能合约能给我们带来隐私的保护?大家对此有没有什么看法?

Liz Steininger:目前为止大多数我们所看到的智能合约是完全透明完全开放给公众的,透明代码是开源的而不是所有人都可以读取代码了解代码,这是另外一个问题。涉及到智能合约问题希望看到智能合约能够更多地在企业当中应用。而且个人数据必须要安全性,有很多项目在研究如何提升智能合约的安全性。我们还没有谈到但是零知识证明也是很有潜力的技术,能够提升数据的溯源和安全性,而并不需要去披露数据。

宋青见:说到保护隐私还有一种方法,像智能合约里面是隔离了,只是在交易方之间做私有交易,在若干个节点中可以看到。还有一种是利用安全的硬件,像微软把隐私保护的问题转换成访问控制的问题,所有信息都在安全的硬件环境里是有全量的数据。但是如何访问数据就变成了可以转化成标准传统的智能合约的方法。

现在比较先进的密码学技术像零知识证明和智能合约怎么结合还是在早期阶段,零知识证明主要还是用UTXO的方法来做隐私保护。有关在智能合约级别怎么支持都是我们拭目以待可以看公链技术在密码学方面怎么更好地发展。

李伟:我们也一直在解决这些问题,一方面通过隔离是比较简单同时写性能上又得到保障的技术,可能只有相关方有智能合约而其他方是不参与的或者最后做存证。但这很简单效果也很好但有个很大的限制是灵活性很差。不可能很多复杂参与方每两个人搞一个小的,如果是比较固定的还好说,但我们的交易是很复杂的,这样子灵活性会非常差。我们不是固定的,而是根据每笔交易可以灵活地做只有谁能参与,但相对来说还是复杂了一点,灵活性差了一点。

现在我们也在看新的论文,比如说Zacsh做了零知识证明,现在在智能合约做了零知识证明论文已经出来了,但还是偏早期并且性能比较差,隐私和性能永远不会平衡。这是我们需要重点突破和研究的地方。还是根据不同的场景选择合适的技术来保证智能合约级别的安全。

孙立林:合约实现隐私保护,性能一定会掉下来吗?今天的理论密码学有一个基本点,存在大量的前提和假设,这些假设是否真的成立很多经典的论文里并没有给出解释,甚至有时候也就糊弄过去了并没有解释。

回到理论密码学的前置问题是认为安全性和效率一定是对立的,但是现在有一组人在重新看这个问题,对立有可能不完全成立,有可能会从理论上重新构造问题,并且隐私保护的算法在智能合约不是越多越好,加了更多隐私保护和安全的考虑以后有可能系统会出现更严重的问题是我们今天想不到的,只有在工程上才能实现,不是1、2个Paper能够解决的。

主持人(李国权):MPC(安全多方计算)并不需要知道各方输入的信息或者各方的数据点,就可以计算加密数据。但我想这些实际上都是蛮高深的,因为计算的算力还没有达到水平。你们对加密数据进行计算或者实现多方计算的看法是什么?我们离这样的愿景还有多远?

孙立林:我们做MPC做了快两年的时间了,MPC多久成熟?三方以上的算法到工程化实践从推进的角度看,明年年终能够做出来,工程化实践至少还需要半年或一年。前端要做大量的数据预处理,要配合AI,工程化的实践从编译器到虚拟机到调算法又需要大量的应用,可能又是两年的时间。我算了一下乐观估计要五年的时间。但是技术的进步一定还要依赖于硬件,我们有一组人在用APG、GPU来用硬件加速处理。

MPC密码学的好处是天生是分布格式、去中心化的,所以特别适合理论架构里处理。但是SHE全同态加密太难了,今天做的计算合约化和合约计算化打成电路处理以后会为下一步全同态的处理奠定基础,这是我们的实践体会。

李伟:区块链里涉及到技术点特别多,每一个点都有很多工作要做,这些问题不是说以前不存在,以前一直有但是研究的人不多,非常感谢区块链。有了区块链现在学术圈对关键的底层问题研究论文如雨后春笋一般。

区块链不是新问题,但是解决方案要做的完美的话真的需要蛮长时间的。以前做存储有很明显的趋势,现在整个计算机体系结构是通用的结构,是否适合现在的社会是要打问号的,这种软硬一体化的趋势越来越明显,为了某种应用而定制某种越来越复杂。根据区块链的需求来定制所需要的加密芯片、加速芯片,现在我们在和英特尔合作怎么拿硬件进行加速。所以趋势是挺明显的,并且必然会引起很多的技术革新。假设不成立是不是说性能和安全可以有平衡?基于硬件来做的确有些假设可以放松,甚至有些东西不用搞那么复杂,这样的话性能、安全性会有很大的提升。一切目前还是实验室阶段,需要学术圈和工程界的人一起努力。

liguoquan

主持人(李国权):就硬件而言必须要实现大规模的生产,就生产而言开始谈到去中心化生产,开始谈到了开源的硬件,不知道我们到底离这样的目标有多远?Liz 你来谈谈,在开源领域你也工作了很长的时间,对开源硬件有什么看法?

Liz Steininger:我相信五年后会是比较安全的时间使得技术进一步发展,再进一步技术就会实现革新革命,如果如果我们能够找出来如何使得技术更加普及、惠及普罗大众就会看到行业很大的变革。

宋青见:从我做产品的角度虽然很关注成果但判断还是在比较早期,从工程角度很难准确地估计真正能够大规模应用的时间点,反过来说真正技术的大规模应用是要靠实际需求来驱动的,目前从做产品的该度最大的愿望是首先能够推广和普及区块链的应用,哪怕是最简单的区块链技术如果能够大范围广泛应用大反过来用户应用的需求会驱动更高层次的隐私保护、加密算法的发展。当务之急还是要尽快地把目前你觉得有问题比较简陋的区块链技术跟真正实际需求结合起来,已经有很大的应用空间。从做产品的角度更希望的是用实际应用来驱动的方式从而推动真正研究的落地。

分享

相关资讯

数字货币交易所

币界网 - 区块链与数字货币公司数据库

币界网·区块链·数字货币