您当前的位置:首页 >> 商户
区块链对人工智能的变革:去中心化将带来数据新范式
发布时间:2019-07-23
 

     近年来,大数据大为改观了人工智能的发展,将其推到一个几乎难以置信的高度,区块链技术同样也以它自己的特定方式变革人工智能。部分将区块链用于人工智能方式目前还很单一,如在人工智能模型上进行审计跟踪;有些应用几乎是难以置信的,如拥有自己的人工智能——人工智能去中心化自治组织(AI DAO)。

作为蓝海数据库的区块链

根据传统的数据库标准,传统的区块链(如比特币)是糟糕的:低吞吐量、低容量、高延迟、糟糕的查询支持等。但在蓝海思维中,这是可以接受的,因为区块链引入了三个新特性:去中心化/共享控制、不变性/审计跟踪和本地资产/交换。


大多数实际的人工智能工作涉及大量的数据,如大数据集训练或高吞吐量流处理。因此,对于区块链在人工智能领域的应用,需要具有大数据可扩展性和查询的区块链技术。这使得获得区块链的好处时不再需要舍弃传统的大数据数据库的优点。

人工智能区块链的概述

大规模的区块链技术解锁了其在人工智能应用上的潜力。主要包括以下方面:


去中心化/共享控制激励了数据共享


●带来更多的数据,因此可以训练出更好的模型。

●带来新的定性数据,因此新的定性模型。

●允许共享控制人工智能的训练数据和模型。


不变性/审计跟踪


为训练/测试数据和模型提供了保证,提高数据和模型的可信度。数据也需要声誉。


本地资产/交换


●使训练/测试数据和模型成为知识产权资产,这可以带来去中心化的数据和模型交换。能更好地控制数据的上游使用。


●人工智能与区块链解锁人工智能去中心化自治组织的可能性。这些人工智能可以积累财富。在很大程度上,它们就是软件即服务。


区块链还可以以更多的方式帮助人工智能。反过来,人工智能可以有许多方法帮助区块链,如挖掘区块链数据。

人工智能&数据

传统人工智能 & 数据的历史


90 年代做人工智能研究时,一个典型的方法是:找到一个固定的数据集(通常很小)。设计一种算法来提高性能,例如为支持向量机分类器设计一个新的核函数,以提高 AUC 值。这听起来很学术,那是因为它本身就很学术。


大多数人工智能工作仍然在学术界,虽然有实际的应用场景。但在许多人工智能子领域中都是这样的,包括神经网络、模糊系统(fuzzy system)、进化计算,甚至不那么人工智能的技术,如非线性规划或凸优化。


走向现代人工智能 & 数据


2001 年,微软研究人员 Banko 和 Brill 发表了一篇有着显著成果的论文,揭示了一些不同寻常的东西:当你添加更多的数据——不仅仅是一点数据,而是多达数倍的数据——并保持算法相同,那么错误率会持续下降很多。此外,来自 20 世纪 50 年代的无聊的感知器算法正在击败最先进的技术。


现代人工智能 & 数据


2007年,谷歌研究人员 Halevy、Norvig 和 Pereira 发表了一篇文章,显示数据可以如何不合理地有效跨越许多人工智能领域。


●数据才是关键。在这个新世界里,数据是壕沟,人工智能算法是一种商品。出于这些原因,更多数据是谷歌、Facebook 等公司的关键。


●越多数据,越多财富——每个人。一旦了解这些动态,具体行动就有了简单的解释。谷歌收购卫星成像公司不是因为它喜欢卫星图像;而谷歌又开放了 TensorFlow。


深度学习直接适用于这种情境:如果给定一个足够大的数据集,它能弄清楚如何获取相互影响和潜在变量。


机会 1:数据共享→更好的模型

去中心化/共享控制能促进数据共享,反过来又带来更好的模型、更高的利润/更低的成本/等。主要表现在以下方面:


人工智能热衷数据。数据越多,模型越好。然而,数据往往是孤立的,尤其是在这个新世界里,数据可能是难以逾越的鸿沟。


但是如果有足够的正面效益,区块链鼓励传统的独立体间数据共享。区块链的去中心化本质鼓励数据共享:如果没有单一的实体控制存储数据的基础设施,共享就会有更少的冲突。


数据共享可能发生在一个企业中(如在区域办公室)、一个生态系统内(如一个「财团」数据库)或整个星球(例如共享行星数据库,即公开区块链)。

机会 2:数据共享→新模型

在某些情况下,当独立的数据被合并,得到你不只是一个更好的数据集,还是一个新的数据集。这能带来全新的模型,从中可以收集新的见解、进行新的业务应用。如,去中心化系统中的一个适当的 token 激励机制可以激励先前未标记的数据集得到标记,或者是以一个更经济的方式进行标记。这基本上就是去中心化的 Mechanical Turk(亚马逊的众包服务平台)。


数据 & 模型共享会发生在三个层次:在一家企业内部(跨国公司的情况比你想象的要难);在一个生态系统或联合体中;或在这个星球中(相当于成为一个公用事业)。

机会 2A:行星层次的新数据 → 行星层次的新见解

IPDB是全球范围的结构化数据,而不是零碎的。将万维网视为互联网上的文件系统;IPDB是其数据库副本。当我们有一个行星尺度的、像IPDB那样的数据库共享服务,或是怎样一番景象?主要有以下几个参考点:


●在企业界的公共数据管理与重新包装使其更易被消费方面,从简单的天气或网络时间的 API,到股票和货币之类的金融数据 API。想象一下,所有这些数据都可通过一个单一的数据库以一种类似的结构化方式进行访问。就好像有了 1000 个彭博社。不用担心受制于某个单一的实体。


●区块链,即通过一个区块链来外部数据使其易于消费的概念。


总体而言,我们可以建立新的模型,使得之前没有联系的输入&输出之间产生关联。

机会 3:数据&模型中的审计跟踪使预测结果更加值得信赖

区块链技术可以给以帮助。在过程的每一步中都建立模型,并在该领域运行模型,该数据的创造者可以简单地为模型加上区块链数据库的时间戳,包括数字签字以声明。具体来说包括以下方面:


建模来源


●传感器数据(包括物联网)。

●训练输入/输出(X / y)数据。

●建模本身。

●模型本身。


测试过程/该领域中的来源


●测试输入(X)数据。

●模型仿真。

测试输出(yhat)数据。

机会 4:训练数据 & 模型全球共享注册系统

如果我们有一个可以方便管理另一个数据集或数据馈送(免费或其他)的全球数据库,包括一系列出自各种机器学习比赛的 Kaggle 数据集、斯坦福 ImageNet 数据集及其他不计其数的数据集。


人们可以提交数据集并使用其他人的数据。数据本身会在一个去中心化的文件系统中,就像 IPFS ;而元数据(及数据指针本身)将会在 IPDB 中。我们会获得一个人工智能数据集的全局共享空间,这有助于实现打造数据开放社区的梦想。

机会5:作为IP资产的数据&模型→数据&模型交换

数据和人工智能模型可以被用来作为知识产权(IP)资产,因为它们受到版权法的保护。在区块链技术之前是可以对数据 & 模型宣称版权与许可的。相关法律的出台已经有一段时间了。但区块链技术使它变得更好,因为版权声明提供了一张防篡改的全球公共注册表;你的版权声明是数字化/加密了的签名。此注册表也可以包括数据 & 模型。


一旦我们有了数据和模型作为资产,我们就可以开始进行资产交换。而去中心化的数据&模型交换是对「交换」过程中所共享的数据进行去中心化,更易于组织合作或数据共享。比如用于 Deep Nets 的 OpenBazaar。

机会 5A:在上游控制你的数据&模型

人工智能数据和人工智能模型同理。当创建可用于建模的数据以及创建模型本身时,可以预先指定许可从而在上游限制其他人的使用权限。在区块链数据库中,是将权限作为资产,而作为权利持有人可以将这些作为资产的权限转让给系统中的其他人,创建转让交易并用你的私人密钥签名,便于更好地从上游控制你的人工智能训练数据、你的人工智能模型等等。


政府会允许数据私有的唯一方式是一个数据共享基础设施,网络中立规则,就像 AT&T公司和原始的那种电话线。在这个意义上,越来越多的自主人工智能会要求政府接受区块链及其他数据共享基础设施,从而实现长远的可持续性。

机会 6:人工智能去中心化自治组织——可以积累财富且无法关闭的人工智能

一个AI DAO属于人工智能自身,你无法关闭它。去中心化处理过程,基本上就是一个状态机的存储状态,周围的一些基础设施做起来更容易,而那就是「智能合同技术的本质。目前,通过在过程中使用更好的 API(如智能合同语言)和去中心化价值储存(如公共区块链)就可以实现它。


一个DAO是一个体现这些特征的过程,其代码可以拥有自己的东西。一个AI DAO就是一个运行在去中心化处理&存储载体之上的AGI式控制系统。其反馈回路会自行进行继续,输入、更新状态、执行输出,循环往复地使用这些资源。

来源:IPFS大唐社区

青岛链湾研究院期待您的关注!




地址:青岛市市北区新疆路8号C座4层

电话:0532-80919522

          0532-80918251