“十大青年科学家”王东临,区块链存储商用明年爆发,加入Yotta

最有可能率先引爆区块链存储商业价值的,就是容灾备份市场。按照今年上线测试跑通,小规模应用计算,明年应该是爆发之年。

“十大青年科学家”王东临,区块链存储商用明年爆发,加入Yotta

2019年2月21日晚,猎云财经在线对话栏目猎问对话第7期在猎云财经社群进行。猎云财经主编、联合创始人吴德铨对话YottaChain创始人、中国十大青年科学家、密码学分布式存储专家王东临,探讨区块链存储的商用爆发还有多远的话题。

对话时间:2019年2月21日20:00

主社群:猎云财经猎问创始研讨群

对话嘉宾:王东临:YottaChain创始人,中国十大青年科学家,密码学分布式存储专家

吴德铨:猎云财经主编、联合创始人

以下根据猎问对话实录整理:

吴德铨:大家好!欢迎来到猎问·创世相对论第7期,这是猎云财经的深度对话栏目,聚焦于影响区块链和数字资产行业发展的热点事件、现象和命题。

2018年7月20日,IT界爆出轰动新闻,腾讯云丢失了初创公司北京清博数控科技有限公司PC网页、H5、小程序共用的核心数据,包括平台注册的精准用户数据、数十万条用户帖子、行业品牌库数据及所有录入的资讯彻底丢失,无法找回。腾讯云声称的99.9999999%数据可靠性、云硬盘三副本存储策略受到质疑。

存储是信息时代最基础的设施,最基本的需求。大众熟知的3.5吋软盘、U盘、移动硬盘、云盘,越来越可靠便利。信息爆炸对存储提出了越来越高的要求,腾讯云事件再次暴露了中心化存储的不足。在区块链时代,存储这件事有了更完备的解决方案。

目前,去中心化存储领域已出现众多知名项目,IPFS和Filecoin近来最为炙手可热。IPFS自2014年开始由Protocol Labs在开源社区的帮助下发展,最初由Juan Benet设计。IPFS协议彻底改变了网络数据的分发机制,被认为可用于创建一种比互联网更加永久的网络。为了使更多人有动力存储IPFS数据,整个网络引进了公链Filecoin进行激励。Filecoin旨在创立一个分布式的存储市场,维系IPFS生态的正常运行与发展。2017年8月Filecoin进行ICO,融资超过2.5亿美元,成为史上规模最大的公链发行之一。

猎云财经本期猎问对话荣幸邀请到王东临先生进行存储话题的研讨。王东临,知名区块链存储公链项目YottaChain创始人,中国十大青年科学家,中国软件业十大杰出青年,中国杰出工程师,密码学分布式存储专家,研究密码学应用20多年、分布式存储将近10年,拥有100多项美国、欧洲、日本、中国专利。深度参与《信息网络传播条例》的立法工作,是该法规的主要立法参与者之一,也参与了《电子签名法》的立法工作。王东临有一个重要发明,能同时拥有零知识加密和数据去重,打破了沿袭几十年写进教科书的“公知常识”。

王东临经历传奇,我们简单介绍一下(以下介绍整理自公开资料)。15岁保送到南开大学计算机系,被认为是技术天才,他用5行Fortran语句编出万年历的记录至今无人能破。27岁创办中关村IT沙龙,每月一期活动坚持超过10年,雷军周鸿祎等创业明星均是其座上客。1995年,王东临开发了SEP第一代信息数字化技术,创立的UOML标准开中国软件行业先河,第一次在核心技术领域取得了全球领先地位,成为全球唯一的文档操作标准。在涉足互联网和云服务之前,王东临和他的书生公司引领了中国无纸化办公的潮流,为国家信息化建设做出了历史性贡献。后来,他到美国硅谷创业,将先进IT技术输出到美国,打破了之前单纯从国际引入技术回中国的软件格局。

2014年,王东临决定将重心放在云领域,为企业级用户搭建云架构及提供安全服务。他创立的“书生云”是唯一获得国际认可的中国云存储品牌,被美国《CIO Story》评选为“全球二十大云公司”。书生公司也被《财富》杂志评为中国未来最值得关注的公司之一。书生云的TruPrivacy专利技术,是国际上唯一能保证后台管理员不能看到用户数据的云存储安全技术。另一项SurFS技术则变革了云平台的存储网络,将数据路径压缩至极致,不仅大幅提升了性能,还节省了硬件设备降低了成本。这两项技术创新让用户在最小的成本下获得高收益。书生集团凭借过硬的技术实力,在Google、Amazon、Microsoft以及国内BAT等巨头垄断的格局下赢得了云存储的一席之地。

2015年8月,第23届全球顶级黑客大会DEFCON在美国拉斯维加斯举行,书生安全云在这次会上发起了另类黑客挑战赛,10万美元的奖金吸引了全球顶级的黑客来破解其云平台数据,最终无人成功,书生云零封全球黑客。2016年,书生宣布将SurFS技术开源,将这一重大创新突破贡献给社会。

王东临是中国信息产业发展的全程参与者,从最早的软件、互联网,到移动互联网,再到区块链。YottaChain凭借独有核心技术和在存储、数据安全、企业服务领域的多年专业积累,成为区块链存储行业的领头羊。YottaChain被誉为最有希望超越Filecoin的存储类区块链项目。2018年10月熊市期间,YottaChain以独创的IbO模式仅用24小时募集到120多万美元的融资。

欢迎王东临先生!下面开始猎问·创世相对论的九连发对话,一起探讨区块链存储何时会商用爆发的话题。

区块链存储可靠性提升一万倍+

吴德铨:猎问第一发。年初,您在猎云财经“区块链先锋50人的一封信”中写道:2019年将是区块链的价值元年,将有很多的区块链应用落地,其中最值得期待的是区块链存储。存储不仅是必不可少的基础架构,而且还是以数字形式存在的实体经济,每年将近千亿美元市场规模,无须任何中介可直接上链。更重要的是,存储本身就有去中心化需求,以区块链的激励构建的去中心化存储系统,可以突破现有中心化存储的极限,将数据可靠性提升一万倍以上,还附带容灾和抗DDoS攻击等奢侈品质。

您描绘了区块链存储的优点和动人前景,但普通个人用户有很多低成本的存储选择,对存储的痛感不强,所以经常会有关于区块链存储有多少刚需、谁来付费的疑问。能否科普一下企业数据存储的需求、成本?区块链存储在效费比上能提高多少?

王东临:大家好,YottaChain正在紧张开发中,Q2上线测试压力大,但吴总召唤,必须得捧场。

这个问题是很常见的问题,其实是有一些误解。公链的用户其实是B端,例如DAPP,某些DAPP的用户才是C端。存储公链的主要用户也是企业用户,虽然个人云盘可以免费提供,但提供免费云盘服务的企业是需要购买存储空间的,他们才是存储公链的潜在直接用户。

数据是用户最重要的资产,数据存储一向都是重中之重。在IT基础架构三件套计算、存储、网络中,存储是最核心最重要也是最复杂的。每年企业存储市场将近千亿美元,除了AWS、阿里云等云存储外,传统企业级存储就高达600多亿美元,其中一线品牌是EMC、NetApp、IBM、HP、Dell、HDS。中国的华为经过十多年努力,进入了二线企业的前列,正在向一线企业的地位努力奋斗。

在云存储市场,一线供应商是AWS、Microsoft、Google,阿里云也在二线的前列,也在试图努力进入一线行列。这些市场,是存储公链的主要目标市场,是普通个人用户看不见的市场,但是规模很大,而且特别重要核心关键。

中兴华为被美国制裁,让大家知道了中国芯片业的短板。有个说法是中国IT业缺芯少魂,芯是芯片,魂就是IT基础架构,就是计算存储网络,其中存储最重要。中国在应用技术和市场上已经发展很好,有些领域(例如移动支付)反超美国,但在核心技术方面目前还有不足,以缺芯少魂为代表。

现在回到您的问题,企业数据存储的核心需求是可靠性、性能和价格。可靠性说简单就是数据不丢。听起来简单,实际上不简单,就像飞机不掉一样,很重要很基本,但其实很难。因为所有设备都会有故障,还经常有傻到极致的运维......各种意外情况下都不丢数据,并不容易。

性能简单说是IOPS和Latency(延时),但往往需要结合应用场景,所以不是简单两个数字的问题。IOPS有点像TPS,是每秒多少次IO,是可以花钱堆起来的数字。Latency是完成每次IO操作花的时间,是最核心的性能指标。价格倒是简单,算一下每GB多少钱就好比较了。

但现在有一个问题,就是中心化存储的可靠性已经基本上到了极致了,很难再提升了。想象一下,停电、断网、地震、火灾,无论多么天才的代码都无法解决。还有911、天津大爆炸,甚至天打雷劈,以及运维人员失误,问题中举例的腾讯云的事故,就是硬件故障加运维人员操作失误合在一起导致的。最愚蠢的运维人员失误是前苏联的切尔诺贝利......

在腾讯云事故后的一个月,Microsoft的Texas数据中心就因为天打雷劈被雷电劈坏了。不管什么样的代码,都无法解决这些问题,只有去中心化才是继续提高数据可靠性的方法。

去中心化的存储,轻易就能将数据可靠性提高1万倍以上,因为可以实现故障域的隔离。在成本方面,去中心化存储可以做到比中心化存储成本更低,例如可以省去制冷成本,利用带宽沉没成本。

但区块链存储比中心化存储更低成本的主要原因还是全球数据统一去重,以及在区块链通证经济的模式下去掉了毛利,也大幅度减少了营销费用,仅数据去重可以将成本降低5-10倍(即80%~90%)。

YottaChain致力于降低整个系统的成本,才能更好地与中心化存储争霸。由于我们自己是存储行业资深老兵,对存储成本结构非常了解,这方面是比较用心的。

经常有一种误解是以为中心化存储采购量大,成本低,其实规模化的矿机厂商的采购量也很大,这点没什么差别。所以,区块链存储可以数据可靠性提升1万倍以上,价格降低很多倍(充分发展起来后可以低到10倍(即90%))。

但性能是不如中心化存储的,所以只能用在对性能要求不高的持久化存储,以及用来做比区块链存储性能更慢的互联网访问的加速(即CDN)等市场上。这两个市场规模已经足够大,持久化存储是小几百亿美元,CDN也有将近百亿美元。剩下的几百亿美元是中心化存储占优势的市场。

区块链很伟大,但也不是万能的,区块链存储也不可能完全干掉中心化存储,毕竟连电商都还没干掉便利店呢,但能占领几百亿美元市场已经足够好了。

YottaChain对存储节点要求最低

吴德铨:猎问第二发。分布式存储概念在区块链行业广泛传播,但目前的中心化存储、云存储也会用到分布式存储技术,分布式存储并不等于去中心化存储。区块链存储常被称为分布式存储是否准确?区块链存储对分享节点的存储资源的技术要求如何?主要适用于什么类型数据的存储?能否满足低延时要求、读写频繁的金融、交易数据的存储?

王东临:在区块链行业,分布式和去中心化基本上是同义词,但在存储行业,分布式存储已经是有明确含义的专有名词了。在存储行业,分布式存储是中心化存储的一种,是在一个机房内多台存储设备通过网络连接起来构建的带冗余、可以水平扩展的存储系统,例如Ceph、HDFS、Gluster FS等。

“十大青年科学家”王东临,区块链存储商用明年爆发,加入Yotta

所以我一般会区分这两个词,使用去中心化存储来代表地理位置分散的存储节点构成的存储系统。所谓区块链存储,也是用区块链的激励构建的去中心化存储的简称(可不是将数据存在区块链上哦)。

但由于区块链行业对于“分布式”这个词也形成了约定俗成,所以区块链行业的人将区块链存储称为分布式存储也可以理解,但我还是建议将这两个概念区分开来,以避免混淆。

去中心化存储跟区块链没关系,是存储技术发展的趋势。但是利用区块链的激励,可以迅速构建规模浩瀚的去中心化存储系统,规模可以超过AWS、阿里云等巨头,区块链其中的价值也是非常巨大的。

对分享节点的技术要求取决于各存储公链,有高有低,但共同一条都是要求7x24小时在线。所以个人电脑(包括笔记本)都不适合,但家用小盒子(类似迅雷、群晖或极路由那种)是可以的。家用设备在可靠性和带宽稳定性(以及上行带宽速率)等方面都有不足,有的存储公链难以利用。

“十大青年科学家”王东临,区块链存储商用明年爆发,加入Yotta

YottaChain对存储节点的要求最低,我们耗费了极大的精力来降低对存储节点的要求,基本上一个ARM CPU加上128M内存就可以跑起来,也能容忍存储节点的不够稳定。

区块链存储有几种应用场景,一种是冷数据,需要保存但访问频度不高,对性能不敏感。冷数据的量占数据总量的百分之九十多,所以市场足够大。但是像低延时要求、读写频繁的热数据,例如金融、交易数据,区块链存储就不适合了,还得用中心化存储。不过这些热数据的备份以及离线的大数据分析,仍然可以用区块链存储。

另外一个场景是CDN,这时可以利用区块链存储节点众多而且分散的特点,选择离用户最近的节点做网络缓存,从而起到网络加速作用,这时区块链存储所存的数据反而是热数据,网络上的热数据,例如热门新闻,热播影视剧等。

“加密去重”技术对整个行业非常关键

吴德铨:猎问第三发。2015年上线的IPFS(星际文件系统Inter-Planetary File System)虽不是区块链项目,作为一种类似HTTP的互联网底层协议,在币圈已被熟知。IPFS是点对点的分布式版本文件系统,目标是为补充甚至取代互联网目前的超文本传输协议,将所有具有相同文件系统的计算设备连接在一起,用基于内容的地址替代基于域名的地址,只需要验证内容的哈希,从而让网页速度更快、更安全、更健壮、更持久。IPFS没有Token、不能挖矿,基于IPFS的Filecoin才是区块链项目,才是Token。据称,目前Filecoin的存储成本是中心化存储成本的1/3。

YottaChain与Filecoin等同类项目相比,拥有独一无二的数据去重并加密的特性,那么,是否具备完全的替代性?其他区块链存储项目,从技术和性能目标上是否还有竞争能力?

王东临:刚才提到,区块链存储是“区块链激励的去中心化存储”的简称,由去中心化存储系统和区块链激励层两部分组成。其中IPFS是去中心化存储系统,FileCoin是其区块链激励层。IPFS/FileCoin是希望利用闲置硬盘空间,从而降低存储成本,但是YottaChain能做到即使专门新购存储矿机,也能比中心化存储便宜很多。

IPFS/FileCoin是区块链存储的旗舰项目,和YottaChain是一路同行的同道人,不是竞争替代关系。我们一起和中心化存储才是竞争替代关系。

现在区块链存储的市场基本上是零,中心化存储将近千亿美元,所以竞争主要发生在与中心化存储之间,而不是区块链存储之间。我们关注的是与中心化存储相比是否有足够的竞争力,其它区块链存储项目都是友军。我经常说的话是:同行(hang)是同行(xing)。等颠覆了秦王朝,才谈得上刘邦项羽竞争。现在大家都是农民起义军,无非是他在美国起义,我在中国起义。

IPFS更多面向CDN市场,YottaChain更多面向持久化存储市场,定位上是有些差异的。YottaChain独家的“加密去重”技术,对整个行业都非常关键,可以说是决定性技术。但IPFS/FileCoin为了绕开这个问题,定位于网页这种公开数据,而不是用于个人企业数据,这也是因为技术上的差异而产生的市场差异。

YottaChain注重数据安全性,注重数据可靠性,注重企业应用无缝对接,主要面向持久化存储市场;IPFS/FileCoin主要面向CDN市场,对数据安全性没有要求,数据可靠性也要求低。

吴德铨:持久化存储这块,个人的需求场景如何?是否有付费应用潜力?

王东临:那是我们的用户的事情,现在已经有云盘厂商愿意在YottaChain上提供服务,收费还是免费,就看他们的运营策略了。反正他们是必须给我们的存储矿工付费的,但这个费用比自己建存储或者卖阿里云存储都低很多。

个人付费使用也是可以的,相当于一个小B了。YottaChain的存储服务相当于AWS、阿里云的对象存储服务,有等同替代关系,一般不是给C端用户使用的。

DApp若用 炒RAM的要哭了

吴德铨:猎问第四发。目前一些主流区块链上可存储的数据量很有限,阻碍了分布式商业应用的开发部署,因为传统区块链是单机存储架构,存储容量受单机存储上限的限制。截至2018年5月,比特币一个完整节点的数据存储达到210G,以太坊达到1T。同构多链架构的迅雷链在探索区块分区模式解决链上数据存储扩容问题。那么,如YottaChain的区块链存储系统是否能够帮助主流公链解决存储需求?YottaChain公链又是如何解决自身的数据存储问题?

王东临:虽然说YottaChain目前主要面向企业存储用户,但也同样是可以为其它公链服务的,甚至可能服务起来更合适。只是因为现在区块链上的数据量还是少,相当于5岁的童养媳,等她长大了娶她当老婆还早,所以才先追求有现成市场规模的企业应用大姑娘。

但作为区块链从业人士,希望区块链行业发展越来越好,越大越大,早日超过中心化应用。我们也愿意为此做出一些贡献,例如解决公链的存储问题。

具体方法是这样的:在公链的区块中,可以只存一堆交易(例如1亿笔交易)的hash值,然后指向YottaChain上的一个文件,这个文件记录了所有的交易记录。这样就可以将区块的大小一下降到最小,不管有多少笔交易,只要几百字节就够了。

还有公链上的DAPP也同样可以利用YottaChain提供的大容量廉价存储服务,只是炒RAM的人可能要哭了。

YottaChain自身的数据也是利用了数量众多分散的存储节点,以抵抗各种故障。我们目标是建立规模浩瀚、覆盖全球、原子弹炸不坏、黑客偷不走、低成本的存储池。

Yotta是公制的最大单位,目前全世界的数据总量大约在0.01 Yotta左右,在我们的有生之年会发展到Yotta级别,希望那时YottaChain也能达到Yotta级别,能够承载全人类的数据总量。

自修复存储保证数据可靠性

吴德铨:猎问第五发。数据安全是核心诉求,极端情况下如微型核爆、石墨炸弹等,对物理特征仍然完好的存储设备中的数据是否会造成损毁?区块链存储系统在设计存储节点分布时,是否需要考虑分散化(如同城存储需求匹配同城多个就近节点,特殊情形下有数据安全风险)?如需地理分散以确保数据安全,那么,与Filecoin等去中心化存储的就近分配资源原则是否矛盾?

王东临:就近分配存储是CDN市场的需求。CDN不需要保证数据不丢,大不了数据回源,但是比较看重离用户近,带宽好。持久化存储则数据可靠性第一位,最好是遇到各种灾难都不会丢数据。这是不同的应用场景,也就需要不同的调度策略。

FileCoin主要面向CDN市场,所以讲究就近分配。YottaChain首攻持久化存储市场,所以讲究分散化存储。

要想数据不丢,简单说有三点:1、数据要分散存储,尽量实现故障域隔离;2、任何一个存储节点出现故障(不管是某一块数据损坏还是整个节点全部down了)都要及时发现;3、对损坏的数据要及时重建。

这样就可以构建一个具有自修复能力的存储系统,保证数据可靠性。世界上最难摧毁的不是坚固的堡垒,而是有自修复能力的组织。你看施瓦辛格打不死的液态金属机器人就是类似的,不是坚硬得子弹打不穿,而是打成多少洞都能自我修复。

假设,广岛被原子弹摧毁几个小时后,广岛的1000个存储节点上的数据就在全球其它国家的十万个节点重建完成,这样的存储系统就是原子弹炸不坏的。对于没有完全摧毁的存储节点,可以通过Hash值验证来发现其数据是否完好,任何的存储错误都能被迅速检查出来,然后换节点重建。所以不仅不怕原子弹,也不怕石墨炸弹。

顺便说一下,你说的这个不是数据安全,是数据可靠性,是durability,不是security。真正的数据安全(security)是指数据不会被偷,像陈冠希那样,数据还在,没丢,但是被偷走了。

吴德铨:专业上的安全概念。

“十大青年科学家”王东临,区块链存储商用明年爆发,加入Yotta

容灾备份78%需求未被满足

吴德铨:猎问第六发。Filecoin的经济模型是矿工用低于成本的价格将存储空间卖给用户,通过币价的增值来填补中间的差价并实现盈利。您认为,Filecoin是价值支撑加上信心共识,尚未完全摆脱空气币的特征,其币价一部分靠价值支撑,另一部分仍然属于空气币成分。而YottaChain与其他项目有一个本质区别,最终是由用户买币来使用服务,而不是像其他币那样炒来炒去。并且,目前已经有一些有意向用户,等测试网上线后,他们会使用YottaChain的存储服务。

请问,这些意向用户有什么样的需求特征?经济模型具体如何设计的?普通个人无法参与贡献资源挖矿,去中心化存储需求也有限,似乎还是只能参与炒币?

王东临:这些意向用户的需求特征是:对数据可靠性敏感,对价格敏感,对性能不敏感,对品牌不敏感,还有一点就是数据存储量非常大。

典型场景是容灾备份。容灾备份数据存储量大,作为second storage而不是生产系统,对品牌不敏感,因为平常不启用所以很多用户对性能不敏感(RPO RTO要求非常高的用户对性能也敏感,但只占极少数)。

因为DR(容灾备份)主要是满足合规性要求,平常一般用不上,对很多用户都是纳入到合规成本中,所以对成本敏感。

吴德铨:细分市场很精准。

王东临:DR市场规模也不小,也将近百亿美元了。现在DR太贵,影响了市场普及。YottaChain加入进来后,与云灾备技术相结合,可以将DR成本迅速降低到十分之一,市场规模有望大幅度增加。

Gartner以前有一个统计,有DR刚需的用户只有22%满足了DR需求,还有78%没有满足。我们的目标是不仅让剩下的78%能买得起DR,连非刚需用户都愿意买,就当买一个保险一样,成为标配。

商业模型设计是通过系统设计全局优化将成本降到最低,与中心化存储的价格相比有巨大的margin,从而可以合理地将这个margin的利益分配给矿工和用户,让用户节省大量成本,矿工挣大钱。

回归商业本质的要害是打造人人都受益的商业闭环,而不是依赖低于成本销售。普通个人用户可以通过家庭存储矿机参与挖矿的,但这个设备可以很便宜,就像机顶盒那样,买一个,接上电源和网线,然后啥都不管,就可以挖矿挣钱。

其实个人用户的存储需求也是有的,例如手机上的照片视频,所以也有一部分是自用。

吴德铨:企业用户不参与挖矿的话,只能买币付费?币价炒高之后成本需要权衡?

王东临:我们有机制可以让用户的成本得到控制,同时还不影响币价炒高,这就是我们做双层通证的经济模型的缘由。一层资源通证是锚定存储空间的,购买力缓慢上升(跟着去重系数走);另一层流通币数量有上限,但系统规模扩大时,每个流通币能换到的存储空间变大,价值就变大。

吴德铨:存储空间价格跟币价脱锚?

王东临:流通币YTA的价格炒高了,只要YTA能多换一些资源通证HDD,用户最终购买存储空间的价格并不受影响。YTA和HDD是在内部交易市场上浮动汇率交易。

吴德铨:有意思。跟上期猎问的bizkey一样,都是双通证模型。

王东临:基金会将在必要时候入市调节YTA/HDD的汇率,使得每GB成本控制在一个特定范围之内。每GB价格太高了,影响用户利益;太低了影响矿工利益。系统会有一个参数,定出价格的上限和下限,超过该范围就自动调节YTA/HDD的汇率。

吴德铨:基金会具体怎么操作?

王东临:当然也是市场化方式调节,通过买进卖出来调节。不干预YTA价格,干预YTA/HDD的汇率,卖YTA买HDD,或卖HDD买YTA。当GB价格回到预定价格范围内就停止公开市场操作。这个干预将写在代码里,是自动执行的。

价格区间则由社区治理委员会共同决定,给出平衡用户利益和矿工利益的合理价格区间。反正我们比中心化存储的成本低非常多,所以有足够的空间来使存储用户和存储矿工都受益。

吴德铨:那庄家不高兴咋办?

王东临:庄家可以去炒YTA。交易所的YTA/USDT是交易所二级市场操作的,系统只管控YTA/HDD的内部交易市场汇率。而且即使是在这个受管控汇率,也是有上限下限,在此区间也是市场化操作的,超出区间才有“央行”入市干预。

所以既不影响庄家在二级市场炒YTA,还能保证用户用稳定的低价购买存储空间。

“十大青年科学家”王东临,区块链存储商用明年爆发,加入Yotta

比特币是隐形中心化治理

吴德铨:猎问第七发。您曾认为EOS的治理机制不健全,或者说是非常不健全,只做到了10%的程度,比没有好一些。YottaChain的治理机制将如何设计?区块链项目的治理机制怎样是比较理想的?

王东临:刚才也略微提到了治理机制。我认为公链的技术、商业模型、经济模型和治理机制都很重要。治理机制最重要的就是解决谁定规则,规则怎么执行,不执行怎么办的问题。例如,比特币的治理机制其实是隐形的中心化治理,由Core开发组来定规则,其它角色可以用脚投票来制衡,但这个制衡非常弱。

EOS有一个宪法,有超级节点,但并没有明确的机制解决这几个核心问题。EOS宪法并没有涵盖必须涵盖的问题。

YottaChain在这几个核心问题上有了一套初步完整的方案设计。包括全民选举的治理委员会来定规则,以及一整套完整的机制,保证定出来的规则能变成合格的代码,并得到执行。

凡是能解决刚才说的几个核心问题的区块链的治理机制,就是理想的治理机制。前不久所谓比特币扩容的传闻,其实就是比特币治理机制不健全的一个体现。这件事暴露了一个问题:谁来定规则?仅仅靠Core开发组的自律是否靠谱?

缺乏规则制定的元规则,缺乏保证元规则能执行的程序,就不是一个好的治理机制。

POC挖矿的硬盘空间也是浪费的

吴德铨:猎问第八发。POC容量证明共识机制最近在矿圈引起热议。2014年6月12日,Burst项目上线,POC共识进入大家视野,但并没有如POW机制那么受到关注。2018年,由Filecoin引发的硬盘挖矿热潮,以及BHD项目上线,POC共识机制开始逐渐引起矿圈关注。您怎么看待这一现象?YottaChain的共识机制是什么样的呢?

王东临:虽然都是用硬盘挖矿,但POC并不是区块链存储,BHD也更像资金盘游戏。FileCoin是PoSt共识,并不是POC。POC挖矿的硬盘空间也是浪费的,不产生价值。

FileCoin最伟大之处是改变了挖矿的模式,从损耗资源挖矿变为共享资源挖矿,实现健康良性发展,以及利他即利己的哲学。POC还是损耗资源挖矿的模式,显然是不如FileCoin的。这也是FileCoin当初受追捧的重要原因之一。

很多人知道FileCoin是因为ICO,因为取代http的口号,但我认为改变自残式的挖矿模式才是FileCoin的最大贡献。

吴德铨:您首创的“自残的天津混混”比喻,太生动了。摘录一下:

“别人打架是打对方,天津混混打架是打自己。”

“去年,有网友爆料:一颇有古风的天津混混,约莫五十多岁,赤膊,精瘦,花白胡子,胸前绣龙,一嘴‘介尼玛’。这位爷开始是嫌饺子馆门口一卖烤冷面的摊子占道经营,挡住道了,让人家撤摊,人家当然不乐意了。大爷也真不含糊,二话没有,拎起一啤酒瓶子就干碎在自己脑袋上,当时血就下来了,然后一声大吼——‘走不走!’看这阵势,卖烤冷面的也是二话没有,麻溜儿推车走人了。”

“这是典型的天津混混,打不死你,我吓死你。但这些爷们做梦也想不到,会有人将他们的‘优良作风’发扬光大。从比特币开始,大家比拼消耗自己的资源,谁够狠,谁消耗的资源最多,谁就是大爷,就可以得到比特币的地盘。天津混混们抢地盘,分个输赢就都撤了,但比特币世界比这还狠,这样的自残游戏日复一日,规模越搞越大,估计就算最正宗的天津混混也看不懂了。”

王东临:我在南开上的学,所以对天津有一定了解。

YottaChain的共识机制也是和FileCoin类似的,以共享资源的挖矿模式。但是FileCoin的共识机制难度有点高,不利于工程实现。

YottaChain的共识机制大大简化了,充分利用了YottaChain数据存储机制的优势(每个数据分片非常小),从而可以用非常简化的方法来达到同样目的。这就是YottaChain对存储矿机的要求非常低的重要原因之一。

我们计算过,一个存储矿工如果要作弊的话,大约只有几百万分之一的概率能够活过一天时间。所以,这种改良后的共识算法也足够有效。

我们还没有命名我们的共识算法,内部称为改良心跳法。具体算法不同,但原理都相似,都是验证存储矿工是否真的存了那么多数据,数据是否都完好无损。

今年是区块链存储元年 明年爆发

吴德铨:猎问第九发,最后一发。从storj等较早的去中心化存储平台运营情况看,目前区块链存储实际应用需求还极为有限。您认为,存储市场的核心痛点是什么?哪方面的需求将率先引爆区块链存储的商用价值?区块链存储的爆发窗口大概是什么时候?

王东临:从区块链进入到存储行业,和从存储行业进入到区块链行业,这是有区别的。缺乏行业背景的创业者,很难对接企业应用市场的。

区块链存储的实际应用需求是非常庞大的,但前提是要比中心化存储更好更便宜,而且要保证安全性,才能让个人企业数据放心地保存。可靠性、安全性、成本这三点如果做不好,那就缺乏商业价值。

所以,与企业应用的无缝对接、可靠性、安全性、成本四点是决定性的,也就是你说的核心痛点。做不好这四点,势必就难以撬动市场。storj等项目是不错的先驱,但没做好这几点,所以没能撬动市场。

最有可能率先引爆商业价值的,就是容灾备份市场。按照今年上线测试跑通,小规模应用计算,明年应该是爆发之年。

今年是区块链存储元年,几个明星项目上线运营,带动区块链回归价值的潮流,明年是爆发之年,预计是这样。毕竟B端业务不像C端那样快,需要一个过程。

吴德铨:拭目以待,乐观其成,恭喜发财。

王东临:我是想透了才开始做了,没想清楚就做的话,怕做成骗子泡沫项目了。

吴德铨:很棒,感谢王总对猎问的精彩回答!下面是自由交流时间,机会难得,欢迎踊跃发问,有机会入选精彩提问!

“十大青年科学家”王东临,区块链存储商用明年爆发,加入Yotta

社群问答:不拼性能 拼可靠成本安全

@Jimmy王运嘉:去中心化的碎片式存储有个共同的问题:就是如何保证存储同一碎片的节点永远至少有一个在线?

王东临:首先,我们是用冗余编码来做的,N+M的设计,允许同时掉线M个节点。其次,我们会要求所有存储节点都必须7x24在线,有抵押,不满足条件会被没收抵押的。再次,随时检查监控,一旦发现有一个节点不在线,马上找其它节点重建其数据。

@Jimmy王运嘉:7*24在线,这个要求会不会太高了?

王东临:不高,现在至少有几十万台存储矿机都能做到。

@Jimmy王运嘉:可是,节点也会宕机的。

王东临:宕机就重建。

@Jimmy王运嘉:宕机就不再是7*24在线了,对不?重建的机器来自何处?

王东临:假设重建需要5个小时,只有第一个节点宕了,在重建完成之前第二个节点又宕了,然后在这5小时之内又连续宕了M个节点,这时还没事,在5小时内再宕第M+1个节点时,才会丢数据。这个概率应该可以忽略了,原子弹爆炸都不会这么糟糕。

7x24在线指的是按照7x24在线来设计和运营,故障除外。本身做N+M冗余存储的目的就是实现对各种故障的容忍。

@Jimmy王运嘉:可是,管理碎片的数据库可就大了去了。

王东临:还好吧,元数据大约占1%吧。我们都估算过,完全在可以接受的范围内。

@Jimmy王运嘉:N:正常的存储节点,M:备份节点,对不?

王东临:N是还原数据所需要的数据分片的数量,M是冗余数量。每个数据分片存一个存储节点。

@Jimmy王运嘉:目前,N是多少?M是多少?

王东临:N取决于文件大小,我们是固定数据分片的大小,根据文件分块大小来计算N的数量。M为可以容忍的同时宕机节点数量。

@Jimmy王运嘉:一个分片多大?

王东临:这个参数还没最后定,M可能在10-20之间。一个分片大小也没最后定,可能是16K。我们甚至考虑过4K。

@徐栋:如果一个原文件本身只有4k呢?

王东临:那就自动改成副本模式。假如M=16,则17个副本。

@Jimmy王运嘉:所以,文件大小:n,分片大小:p,N=n/p,对吗?

王东临:大体上如此,但还要分块。最大支持128T大小的文件。大文件先分块,每块再做冗余编码。

@徐栋:最终存储可靠性要靠M、每个节点的可靠性、自我恢复的策略综合来决定?

王东临:差不多是这样。其实存储节点分配算法也很重要,尽量实现故障域隔离。

@徐栋:如果要做到9个9的可靠性,需要多少冗余?

王东临:9个9很容易吧,中心化存储都能做到。我们是要做到15个9,比你的指标要高100万倍。

@徐栋:如果都是9个9,您的方案比一般中心化存储要少多少冗余?

王东临:跟三副本比肯定要少很多,但中心化存储也可以用EC码来降低冗余。我们的优势在于地理位置分散来实现更好的故障域隔离,数据去重等降低成本的方式。

@徐栋:感觉区块链存储是要在成本、可靠性、性能、信任,这四个要素间取得平衡。

王东临:性能是没法跟中心化存储比的,主要还是在可靠性和成本上的优势,然后安全性要求更高,必须满足。

@Jimmy王运嘉:我最后一个问题:节点带宽的要求是?

王东临:带宽需求取决于应用场景。做持久化存储用,带宽要求不高,家庭用户企业用户都可以满足;在CDN用就要求比较高,建议托管IDC。

@徐栋:我们在做一些工作,让分散的数据可以高效地被访问。当M越大,性能越好。有时间咱们可以当面交流。

王东临:好啊,可以一起搞。

@徐栋:期待!

@刘曦子:王总对于下面的问题是如何考虑的。YottaChain对不良信息数据、非法信息数据上链存储会进行审核处理吗(因为某种程度上说,上链信息不可篡改,所以需要审核。当然上链的可能是哈希)?是人工审核还是技术手段审核?或者说是否有删除手段?如何满足合规要求(针对近期网信办的区块链信息服务管理规范)?

王东临:这个问题也有设计,可以在监管要求和用户利益中取得较好的平衡。但具体方式就不便公开透露。

吴德铨:数据不是被加密的吗?不被读取的话,没有明文审核问题?

王东临:对,不存在明文审核问题。任何情况下,满足监管要求也不会让用户的数据暴露给其他人,除非用户主动授权。所以我说是一个很好的平衡,我们设计系统就经常需要在各种因素中平衡。

吴德铨:感谢YottaChain创始人、中国十大青年科学家、密码学分布式存储专家王东临先生做客猎云财经猎问·创世相对论,在区块链存储的商用上分享了很多精彩见解和丰富的实践经验!谢谢各位参与猎问对话,下期见!晚安!


分享到:


相關文章: