腾云027

作者: 2014-08-12
拉动的世界

推荐人:汪云志  财讯传媒集团副总裁

 

推荐语:

互联网的世界正在由“请你推送Push”向“由我拉取Pull”转变。这一推一拉的变化,是以谁为核心的重大变化。

 

推送,以生产者为核心。拉取,以消费者为核心。

 

拉取,就是消费者按照自己的需求,将一切——产品、服务、信息、知识和建议——拉到自己身边。拉取的发展潜力是巨大的,有着巨大的应用能量。作者预言这个转变将在未来10-20年实现。要实现拉取,有一个概念不能回避:语义网。

 

语义网是将信息打包,让信息变得更有用更容易复用的新方法。互联网的很多巨大变化的起点都貌似不怎么引人注目,语义网创造的由“推”到“拉”的变化也许就是互联网下一波剧变的开端。

我们正处在这个巨大的变化之中!

 

文章内容

拉动的世界

/David Siegel/管策

拉取信息指的是在我们需要信息时,我们就能得到它。这一过程自1980年开始,将在2030年左右大致完成。这是人类使用信息的一种新方法,在我们接收和管理业务的方式上,拉取信息有着巨大的应用能量。下面我来举几个例子,展示在我们开始拉取信息时,我们的生活和商业会显现出如此的天壤之别。


      百货商店

让我们从一道问答题开始。

 

假设你经营着一家庞大的百货店,店里有多台收银机,其中有4台专为购物10件及以下的顾客而开设,以鼓励顾客进店小额购物;否则,如果等待结账的队伍排得太长,顾客就可能会畏惧进店消费而转身离开。于是,你找了个咨询师来考察自己的业务。咨询师说:“这么做,其实对你最优质的顾客很不公平。

 

为购物件数少的顾客开设专用结账通道是件好事,但你并没能从他们身上赚到很多钱,其实街边的便利店就可以满足他们的需求。而且,你让那些买了满满两购物车东西的顾客情何以堪呢?难道这样的顾客不应该被优先排到队伍前面吗?这些顾客就不是你的上帝吗?我认为,应该开设3台收银台来为购物10件及以下的顾客结账,再开设1个收银台专为购物满两车及以上的顾客结账。”

 

现在的问题是:你是否会接受咨询师的建议呢?先想想,再对比我的答案。

 


      我的答案是,如果考虑单个等待结账的顾客,这样的顾客可太多了。咨询师想的是让一个旧系统变得稍显人性化一些,更加以客户为中心,但新技术将完全淘汰收银机,既能帮你省钱,又能给顾客提供应享的服务。


      那么,该如何让顾客购物结束时,不用自己去结账呢?现在,让我们来看一个权力已经发生转移的行业。

 

保龄球馆

19世纪末,保龄球这项运动在美国东海岸的多个州普及开来。那时,每一家保龄球馆都有自己独特的规则、保龄球、球道和球瓶。在打完一次保龄球后,摆球瓶的球童要捡起球瓶,摆放到和原来差不多的位置上。1895年,乔·萨姆和一群来自各州的保龄球手成立了美国保龄球协会,将保龄球运动标准化。美国宾士域公司于1914年推出了直径为8.5英寸的橡胶保龄球,取代旧式木质保龄球。大部分保龄球馆采纳了新标准,球道也变得一样了,保龄球锦标赛变得流行起来。每年,美国有大约7千万人参与保龄球运动。

 

1952年,第一台AMC球瓶放置器生产下线并迅速取代人力,球瓶放置质量得到提升,成本有效降低。但从信息的角度来看,保龄球业仍旧处于黑暗时代。我开始打保龄球是在20世纪60年代末。和朋友到保龄球馆前台登记后,我们领了鞋子和球。当被问及谁负责记分时,所有人都看向了我,于是我另外又领到了一大张纸和一支带橡皮的铅笔。我把所有人的名字写下来,轮到谁时就叫谁。在他们投完球后,我按照记分规则,用铅笔把他们的得分记在纸上。保龄球记分规则有些地方很容易让人搞混,我时不时就会犯错,不得不重新算分。最后,满满一大张纸上全都是我记下的分数。

 


      针对这种复杂计分方式的变革发生在20世纪80年代中期,那时,保龄球馆采用了能向电脑报分的球瓶放置器,每个人投完球后都会自动显示分数。人们再也不必担心记分了,只需输入打球人的姓名就可以开始了,把球往球道里一滚,就有了分数。保龄球的复兴就得益于这一创新(当然也离不开激情的音乐和紫色灯光)。但人们仍然需要在打球前输入姓名。

 

保龄球业转变的最终阶段将是,你走进任何一家保龄球馆,从墙上取下一双鞋,找到一条闲置的球道,每打一轮,球馆就从你的账户上自动扣费,并将分数添加到你的在线个人数据库中去。你所有的保龄球运动数据都保存在那里,不管你在哪儿打球,每一轮的成绩都会记录到你的在线数据库中。你可以在个人数据库中确定自己的练习进度,利用在线工具统筹自己的保龄球生涯。得益于全球元数据标准,你可以在同一天里和来自全球数百个城市的数千名保龄球手进行比赛。软件会比较你的分数,宣布谁是赢家。

 

这就是拉取信息。保龄球业已经经历了从顾客告诉系统分数是多少,到系统告诉顾客得分的关键性转变。当其他行业依旧陷于19世纪的信息模式时,保龄球业是少数几个已经度过这一重要转折点的行业之一。而要进一步为保龄球运动锦上添花,在本世纪中开发出促进行业发展的东西,就需要日积月累了。

 

高尔夫球场

现在,我们再来看看高尔夫球。


      我们想要高尔夫球不那么令人沮丧,不是通过让高尔夫球车跑得更快,或加大球洞直径来实现,而是通过逆转记分机制。这需要数年时间来发展,但最终球杆、高尔夫球和球洞之间将能彼此沟通,并将信息传递到你的个人高尔夫球数据库,并在数据库中立即显示分数。你可以在和手机非常相似的电子记分卡上看到自己的分数。事实上,这个电子记分卡就是你的手机。你不用告诉显示屏你的分数是多少,显示屏会主动告知你。你不用数自己的杆数,你的手机会告诉你你挥了多少次杆,球离球洞还有多远。手机还会告诉你,你的某支球杆不在球杆袋里,并在地图上显示那根球杆的位置。当天气变化或有重要消息时,手机会提醒你。手机还能找到淹没在茂密草丛里的球。你可以查看每一次挥杆的轨迹图,可以将针对同一个球洞的击球与之前的比赛或其他选手进行比较。如果你愿意,其他远程观看的人也可以实时地获得你的数据。

 

从信息的角度来看,保龄球在曲线之前,高尔夫球在曲线之后。我们依旧在高尔夫球上推送信息,正如我们在生活的绝大多数领域中所做的事情一样。高尔夫球是少数几个还没应用提升信息流动技术的领域之一。我们仍然在沿用铅笔和纸质记分卡,高尔夫球运动要达到拐点至少还需要10年时间。许多行业也需要这么长时间才能到达拐点,每一个行业都有其模糊的拐点。


      什么是拉取?

拉代表了4000多年来我们使用信息的第一次改变。最早的书写文档中有一项是交易记录,记载了多少头骆驼换了多少谷物等信息。在工业革命期间,企业发展出了记录商业数据的纸质表格。而直到埃德温·G·瑟贝尔斯在1898年发明文件柜时,这些表格才有了容身之所。从发明文件柜距今已有110年,期间还发生了40年的计算机革命,但文件柜的模式未曾改变过。我们仍然会将现实世界发生的事情记录成文件,然后将文件存储在虚拟文件柜中。互联网本身是信息在速度、规模和供应上的革命,但并没有改变文件柜的模式。似乎我每次需要在网上学习一些东西时,都需要下载PDF文件来读,或者读一篇很长的维基百科文章。我们仍旧在遵循商业流程,将信息输入表格(想想你最后一次看医生时的情景)。我们仍在复制文件,并以电子邮件的附件形式寄出。我们仍在电脑的“桌面”上管理所有文件,辅之以“文件夹”和“回收站”。简言之,我们依旧在用手移动所有东西,只不过现在是用鼠标来作为数据耙子罢了。这种方式很笨,也过时了。


      拉就不同。当我们拉信息时,我们可以在需要时自动获得所需信息。比如,今天你寄了一个上面有我物理地址的包裹给我,基本上你是在将包裹推给我,猜我会在家接收包裹。在拉的世界里,你会在包裹上附上我的标识符,不管当时我在哪,我都能把包裹拉到我面前。

 

我们会看到,拉世界的效率要远比现在高,会形成绩效经济。而这都和我们处理一种名为元数据的信息的方式有关。

 

什么是元数据?

元数据能描述一件东西、一个人或一项服务。元数据的例子包括收据、名片、x光、菜单、地图、病历、发票、用户手册等。宣传手册和目录是元数据,日历和护照是元数据,只有内容不是元数据。对一种酒的评论是元数据,但和这种酒有关的论文就是内容。孩子的照片是内容吗?如果你用照片来记录孩子的成长或发型,孩子的照片就是元数据;但如果你只是用来欣赏,孩子的照片就是内容。在很多情况下,照片既是元数据又是内容。

 

如今,数码照片也有格式元数据,如能记录日期、时间、曝光、文件名和其他信息的可交换图像文件格式。人们可以在电脑上使用这些格式来检索、处理照片。所有的数码摄像头都使用这种由日本电子与信息技术产业协会管理的标准格式。

 

照片还需要能描述其内容元数据的格式。当在线照片能显示谁或什么东西在照片里、拍摄的地点、照片中事件的名称、照片中人们正在做什么时,在线照片也就语义化了。要成为语义网的一部分,上述信息要能为搜索引擎获取并理解。在全书探索元数据使用方法的过程中,我们将遇到更多元数据。

 

什么是语义网?

语义的另一种意思就是明确。在语义网中,我们要用精确的、标准化的术语表达自己想要表达的东西。对于任何使用语义化数据的系统或人而言,这些语义化数据都是一样的。

 

未来的百货店以及其背后的自动化供应链都是语义网的一部分。每过一天,它们都变得越发真实。语义网将围绕数据重新组织供应链,将产品拉到顾客面前,而非用旧式的供应链思维推产品。这一转变的关键不是购物车,而是提供了一种格式,能让购物车理解信息。以及一个能追踪从供应商到销售商,乃或家中电器等所有信息的信息供应链。美国已经开始兴建这种新型信息基础设施,并迅速从销售领域扩散至医疗、财务报告、研究、运输等领域。所有事情都在语义化,而让元数据语义化的最终结果就是,让世界从推信息转为拉信息。


      语义网试图理解书面语言和口头语言。和计算机不一样,我们天生就理解这两种语言。书面语言通常是有质量的信息,如评论、观点、描述、指示以及定义等。

 

在语义网中,信息的基层结构非常详细。一份表格就是一个结构化文件。合同、名片、目录、菜单、保险条例或一幢办公楼的销售清单都是结构化文件。语义软件能识别概念、关系、部分以及整体。语义网能详尽地解释上下文,会使用“要求”、“接近于”、“属于”等语言来表达术语的含义。联合在一起的上下文也可以得到详尽地表达,因为每一部分都会贡献自己的信息,就像资产负债率高的银行和资产负债率低的银行相比,对前者活动的监管与后者不同一样。

 

在语义网中,我们可以通过数据进行推导,进而得出结论。语义网的主要目标之一就是重用数据。你向保险公司提供的姓名和地址会直接出现在医生面前,随后会转给专家、实验室和医院。如果你的地址出现变更,你在所有系统中的地址都会即时更新。

 

语义网将绝大多数资源放在网上,众多不同的系统会根据需求在不同的方面使用它们。这也被称作“云计算”和“开放互联网”。这些在线资源会改变包括你所在行业的所有行业。

 

在语义网中,所有东西都有一个独一无二的名称,从而可以找到所有东西。各个行业正趋于对术语采用通用名称空间和通用定义,这会让每一个人都变得更有生产力。


      “语义”在计算机科学中指的是一个单词或词组的意义。“couch”和“sofa”这两个不同的单词都有同样的语义意义,都指的是沙发。此处“语义”指的就是一个术语本来的明确意义,不涉及任何人工智能或“智能”程序。明确指的是所有人所有程序都能理解该术语,并知道其代表的是同一件事。

 

20世纪90年代,蒂姆·伯纳斯·李创造了“语义网”这个术语,用来代表一个数据相互连接并能被反复重用的网络。在这个网络中,数据能形成在线数据库,而非深埋于不同网站内部的不兼容数据库“储仓”。

 

语义网使用的是自适应系统,范围要比传统程序或人工智能大得多。这些自适成系统学得越多,就会变得越智能,并与我们保持一致。随着它们收集我们行动和交易的语义信息,这些系统会让我们更具生产力。正如雷达网络公司的诺瓦·斯皮万克在其博文《智慧星球》中解释的:许多人致力于让软件变得更智能,而在语义网中,我们将会让数据变得更智能。

 

节选自《Web 3.0互联网的语义革命》

科学出版社20138

前沿杂志
互联网前沿61

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。

2023-05-12

全站精选