55小说网

手机浏览器扫描二维码访问

第十五章 构建民主化的未来 时代召唤一场数据开放的变革(第1页)

一秒记住【xiaoyanwenxue.com】精彩无弹窗免费!“中信出版2020年度好书-经济管理(套装共12册)(.shg.tw)”!

第十五章构建民主化的未来:时代召唤一场数据开放的变革

数据和人工智能将对地缘政治权力和经济财富的分配产生什么影响?这又是一个围绕中美关系展开,但广泛影响世界其他地区的动态关系结构。同时,这也是我们这个时代的首要问题之一。针对这个问题,2018年秋出现了一种悲观的论调。

我们在华盛顿特区与国会议员会面的时候,一些参议员提到他们读过《AI·未来》(AISuperpowers)的赠阅版样书。这是一本新书,作者李开复曾在苹果、微软和谷歌担任过高管。他出生于新北,现在常住北京,是风险投资界的一位标杆人物。李开复的论点发人深省。他断言:“人工智能时代的世界秩序将会兼具两大特点,一个是‘赢家通吃’的经济模式,另一个是财富空前集中在中美少数几家公司手中。”他随后指出:“留下其他国家捡拾残羹剩饭。”

这个观点的立论基础是什么?主要基于数据的力量。论证逻辑是这样的,获得最多用户的公司也将获得最多的数据,又因为数据是人工智能的火箭燃料,公司的人工智能产品也将因此变得更强。有了更强大的人工智能产品,公司就能吸引更多的用户,进而吸引更多的数据。这一周期会不断循环往复,创造规模收益,最终帮助公司挤垮市场上的其他所有竞争对手。按照李开复的话说:“人工智能天然趋向于垄断……一旦一家公司脱颖而出,抢先取得领先地位,这种持续往复的周期就会将领先优势转化为其他公司进入市场时不可逾越的障碍。”

这一概念对信息技术产业来说已属寻常,它被称为“网络效应”。以操作系统应用程序的开发为例,“网络效应”很早就已成为现实。一旦某个操作系统处于领导地位,每个人都愿意为它开发应用程序。虽然新的操作系统可能有更为出色的功能,但很难说服应用程序开发人员考虑它。“网络效应”使我们在20世纪90年代因Windows的出现而大获其利,但也使我们20年后在用Windows手机与iPhone和安卓手机竞争时头破血流,举步维艰。今天,任何想取代脸书的新社交媒体平台,也都会遇到同样的问题。谷歌自己的社交平台GooglePlus之所以失败,部分原因就在于此。

根据李开复的叙述,人工智能也将受益于类似的网络效应,而且会像打了兴奋剂一样获得更明显的效果。人工智能将导致几乎所有经济部门的权力渐趋集中。无论哪一个行业,谁的人工智能部署得最有效,谁就能获得最多的客户数据,创建最强的反馈循环。有一种情况的结果甚至还会更糟。数据可能会被一些大型科技公司锁定和处理,而其他所有经济部门只能依赖这些公司提供人工智能服务。结果,随着时间的推移,就会有大量的经济财富从其他行业部门转移到这些人工智能领导企业那里。而且,如果按照李开复的预测,这些公司大多位于中国的东海岸和美国的西海岸,那么这两个地区就将以牺牲其他所有地区为代价,赚取巨额收益。

我们应该如何看待这些预测?像许多事情一样,它们都基于一个核心真理。而且对于这个问题,真理可能还不止一个。

人工智能依赖基于云的计算能力、算法的发展和海量数据。三大要素必不可少,其中最重要的是数据——关于物质世界、经济以及我们日常生活的数据。随着机器学习在过去10年中的迅速发展,很明显,对于人工智能开发者来说,根本不存在什么数据过多的情况。

数据对以人工智能驱动的世界的影响,远远超出对科技部门的影响。想想看,到2030年,新型汽车这样的产品会是什么样子呢?最近的一项研究估计,到那时,电子和计算零部件将占到汽车整整一半成本,远高于2000年的20%。很明显,到2030年,汽车将一直保持互联网的联网状态,以便进行无人或半无人驾驶和导航,以及提供通信、娱乐、维护和安全等服务。所有这些都离不开人工智能和基于云计算的大量数据。

这样的情景提出了一个重要的问题:鉴于汽车未来将越来越像一台车轮上的以人工智能驱动的大型计算机,那么哪些行业和公司将从中获得利润?传统汽车制造商,还是科技公司?

这是一个意味深长的问题。如果这方面的经济价值能被汽车制造商保留,那么我们就有理由对通用汽车、宝马、丰田等汽车公司的长期前景表示更加乐观。当然,这些公司的薪酬和工作岗位以及占有这些岗位的人,也都有了更加光明的前景。在这种背景下,显然这些公司的股东,它们所在的社区乃至国家也必须对这个问题重视起来。毫不夸张地说,美国密歇根州、德国和日本等地的经济未来都依赖这一问题的答案。

如果这么说有点牵强,那请考虑一下亚马逊对图书出版业,以及现在对很多零售行业的影响,或者谷歌和脸书对广告业的影响。人工智能对航空业、制药业和航运业也都会产生同样的影响。这实际上就是李开复描绘的未来。至少我们有一个合理的基础可以得出以下结论:未来财富的转移,将越来越多地流向少数几家持有最大数据池的公司及其所在的地区。

不过,条条大路通罗马,通向未来的道路也不可能只有一条并且不能更改。虽然未来可能会以上面的方式展开,但我们可以设计和追求另一条道路。我们需要授权赋能,使人们能够更加广泛地使用所有必要的工具,让数据发挥最大的效能。我们还需要开发数据共享方式,为公司、社区和大大小小的国家创造有效机会,共同享受数据带来的收益。简而言之,我们需要民主化地使用人工智能及其依赖的数据。

那么,在一个由海量数据决定的世界里,我们如何为更小的参与者创造更大的机会呢?

有一个人可能有答案,他就是马修·特内尔。

特内尔是弗雷德·哈钦森癌症研究中心的首席数据官。该中心是西雅图领先的癌症研究中心,以当地一位英雄的名字命名。弗雷德·哈钦森为底特律老虎队当了10个赛季的投球手,并曾管理过三支大联盟棒球队。1961年,他率领辛辛那提红人队打进世界大赛——美国职棒大联盟的总冠军赛。

令人痛惜的是,弗雷德辉煌的棒球生涯连同生命都在1964年戛然而止。那年他因癌症去世,享年45岁。他的哥哥比尔·哈钦森是一名外科医生,也曾参与弗雷德的治疗。弟弟死后,比尔创建了这个人们俗称“弗雷德·哈奇”的研究中心,致力于攻克癌症治疗的难关。

2016年,特内尔来到西雅图,就职于哈奇中心。研究中心共有2700名员工,在位于联盟湖南岸的13幢建筑中工作,与西雅图标志性的太空针遥遥相望。

哈奇中心的使命雄心勃勃,那就是消灭癌症及其致死病例,使之不再成为人类痛苦的根源。它会集了一大批科学家(其中包括三位诺贝尔奖得主)、医生和其他研究人员,共同进行前沿研究和治疗。同城的华盛顿大学拥有全球知名的医学和计算机科学中心,也与哈奇中心展开密切合作。经过多年奋斗,哈奇中心在白血病和其他血液癌症的创新治疗,骨髓移植,以及现在新型免疫疗法等方面,都取得了骄人的成绩。

哈奇中心几乎已经成为地球上每一个领域的每一家机构和公司的写照:它的未来取决于数据。正如哈奇中心的主任加里·吉里兰德所总结的那样,数据“将改变癌症的预防、诊断和治疗”。他指出,研究人员正在将数据转化为一台“神奇的新式显微镜”,能够显示“我们的免疫系统如何对癌症等疾病做出反应”。因此,生物医学的未来不再取决于生物学本身,而是与计算机科学和数据科学的融合。

虽然特内尔从未见过李开复,但上面的认知使他走上了另一条道路,实际上挑战了李开复的论点,即未来只属于那些世界上最大数据供应源的控制者。如果真是那样,那么面对癌症这种地球上最具挑战性的疾病之一,即使是一个世界级的科学家团队,也很难在偏居北美一隅某个中型城市的情况下,敢于立志要最先找到癌症的治愈方法。原因很简单——虽然哈奇中心有权获取重要的健康记录数据集,帮助其进行基于人工智能的癌症研究,但它拥有的数据集肯定不是全世界最大的。像大多数组织和公司一样,如果哈奇研究中心想要继续引领未来,它必须在不实际拥有所需全部数据的情况下进行竞争。

好消息是,确实有一条通往成功的明确道路。它建立在两个特性之上,这两个特性将数据与其他最重要的资源区分开来。

首先,与石油或天然气等传统自然资源不同,数据是人类自己创造的。萨提亚曾在微软高管团队的周五例会上说过,数据可能是“世界上可再生性最强的资源”。还有什么其他有价值的资源是我们在一次又一次的不经意间创造出来的?人类不仅在创造数据,而且创造速度还在快速提高。与那些供应有限甚至短缺的资源不同,数据——如果一定要找句话来形容——是包裹着整个世界而且还在不断扩大的汪洋。

这并不意味着规模无关紧要,或者更大体量的玩家没有优势。它们当然重要。中国有更多的人,因此创造数据的能力也比任何其他国家都强。但是,与拥有世界已探明石油储量一半以上的中东不同,任何国家都很难在数据上垄断世界市场。世界各地的人都在创造数据,而且在21世纪的百年进程中,似乎有理由期望世界各地的国家都能生成与它们各自人口规模和经济活动相加之和大体相当的数据。

中美两国固然可能是早期人工智能的领导者。不过,虽然中国体量庞大,但却只占世界人口的18%,美国更是仅占世界人口的4.3%。从经济规模看,美国和中国更具优势。美国占世界GDP(国内生产总值)的23%,而中国占16%。但由于这两个国家走向竞争的可能性远远大于联手合作,所以真正的问题是,一个国家能否以不到全球供给量14的规模主导全世界的数据。

这个问题难有定论。不过基于数据的第二个特性,规模较小的国家甚至有更大的机会,而且事实证明,数据的第二个特性更为关键。正如经济学家所说,数据是“非竞争性的”。一家工厂需要一桶石油提供动力,那么这桶石油任何其他工厂就都用不了。与之不同的是,数据是可以反复使用的,同样一组数据可以让许多组织从中收获见解和知识,而数据的效用并不会受到影响。关键是确保数据可以在许多参与者之间共享和使用。

或许毫不奇怪,学术研究界就是以这种方式使用数据的,而且在这方面一直处于领先地位。鉴于学术研究的性质和作用,大学已经开始建立数据存储库,共享数据以实现多种用途。微软研究部也在采用这种数据共享的方法,提供一组免费的数据集开放使用,以推进自然语言处理、计算机视觉以及自然和社会科学等领域的研究。

正是这种共享数据的能力激发了马修·特内尔的灵感。他认识到,加速癌症治疗竞赛的最佳方法是让多个研究机构以新的方式共享它们的数据。

虽然这在理论上听起来很简单,但执行起来却很复杂。首先,即使是在一个单一的组织中,数据也常常被存储在一个个的数据孤岛上,必须打通彼此之间的联系通道,而如果数据孤岛位于不同的机构中,这一挑战会变得更加难以应对。此外,数据可能并不是以机器可读的形式存储的。即便机器可以读取,不同的数据集的格式化、卷标和结构化的方式也有可能不同,从而使共享和共用变得更加困难。如果数据来自个人,还需要解决有关隐私的法律问题。最后,即使数据不涉及个人信息,也需要解决其他大问题,例如组织间的治理流程,以及随着数据的增长和改进而出现的数据所有权问题。

这些挑战不仅仅是技术性的,也是组织性、法律性、社会性,甚至是文化性的。特内尔认识到,部分原因在于大多数研究机构在进行主要技术工作时所使用的是自己开发的工具。正如他所说:“这种方式不仅将数据孤立于一个组织之内,还常常导致重复收集数据,丢失患者病例和结果,以及对其他地方潜在的补充数据缺乏了解。这些问题一起阻碍了新的发现,放慢了健康数据的研究步伐,并提高了成本。”

特内尔指出,在所有这些障碍的共同影响下,研究组织和科技公司很难展开相互合作。他发现,阻力甚至使数据集的聚合规模根本不足以支撑机器学习。实际上,无法克服这些障碍,确实为李开复设想的人工智能主宰一切的未来提供了最佳注脚。

特内尔和哈奇研究中心的其他人发现了这个需要解决的数据问题,并开始着手解决它。2018年8月,作为哈奇研究中心董事会成员,萨提亚邀请了一群微软资深员工共进晚餐,了解哈奇研究中心的工作进展。特内尔谈到了他的数据共享愿景,即让多家癌症研究机构能够以新的方式共享数据。他的愿景是将几个组织聚集在一起,与一家科技公司合作,共同收集数据。

听着他侃侃而谈,我的热情越来越高。从许多方面来看,这项挑战都和我们所了解的,甚至亲身经历过的许多其他挑战别无二致。特内尔对他的计划的描述,让我想起了软件开发的演变。在微软历史的早期,开发人员将源代码作为商业机密加以保护,大多数科技公司和其他组织都是自己开发代码的,但是开源已经彻底改变了软件的创制和使用。越来越多的软件开发人员在各种开源模型下发布他们的代码,这些模型允许其他人对其进行合并、使用和完善改进,从而使开发人员之间形成广泛协作,有助于加速软件创新。

在这些趋势显露之初,微软迟迟没有接受这一变化。不仅如此,我们还积极抵制它,甚至动用我们的专利权对抗那些销售使用开源代码产品的公司。我曾是微软发动专利战的核心参与者。但随着时间的推移,尤其是在萨提亚于2014年成为公司首席执行官之后,我们开始认识到这是一个错误。2016年,我们收购了扎莫林公司(Xamarin)——一家支持开源社区的初创企业。它的首席执行官纳特·弗里德曼加入了微软,为我们的管理层带来了一个重要的外部视角。

到2018年初,微软在其产品中使用了140多万个开源组件,反哺了许多开源项目的发展。我们甚至开放了许多我们自己的基础技术的源代码。我们在开源方面取得重大进步的一个标志是,在Github这个世界各地软件开发者(尤其是开源社区)的大本营,微软已经成为最多产的开源贡献者。5月,我们决定斥资75亿美元收购Github。

我们决定由纳特来领导这项业务,在我们完成交易的过程中,我们得出结论,我们应该与关键的开源组织联手,采取与10年前截然相反的做法。我们将使用我们的专利保护那些创建了Linux和其他关键开源组件的开源开发者。当我和萨提亚、比尔·盖茨以及其他董事会成员讨论这个问题时,我指出,现在已经到了“痛下决心”的时候。我们一直站在历史的错误一边,而我们所有人的一致结论是,现在应该改弦更张,全力以赴地开放源代码。

知乎高赞答主:温酒的睡前故事(全2册)  村霸农女:傲娇夫君来种田  穿书之黑化反派自救手册  灵域战仙  末世:开局爆出一只貂蝉  全球神邸:我随机获得万界宝物  冲出豪门似鸟飞  夏元  我的竹马是哭包  魔王奶团敲凶哒  读美文库——再别康桥  谢邀:人在迪迦刚成邪神  王牌狙击手(全5册)  末日求生  上班第一天,我拒绝了无偿加班!  莲静竹衣代表作品合集(共8册)  百龙传奇:人龙传  替身的我和白月光互穿了  超能富豪养成计划  紫金陈:少年股神(全2册)  

热门小说推荐
陌路柔情

陌路柔情

丈夫家外有家,结婚四年的我,方知一切的幸福都是假象。危急时刻,丈夫用身体护住情人和孩子,而我却因为冲动把自己送进了监狱,两年后,一无所有的我迈出监狱的大门,从此开始我复仇的步伐...

兽世独宠:傲娇兽妻,要生崽

兽世独宠:傲娇兽妻,要生崽

1vs1独宠好漂亮的雄兽!好美丽的小雌性!一人一兽四目相对!他跑,她追!她爱,他躲!他被人欺负,她为他欺负别人!她为他受伤,他为她努力变强!男人,我要生崽!—男人红了脸在等等!—还等?黄花菜都凉了!—豹子狮子孔雀兔子银狼老虎狐狸熊个个干瞪眼,个个心中在骂着你不行,让我来!—云起书院正版!拒绝偷盗,转载!月亮家族群①群号码361507683...

倾城佳人

倾城佳人

当别人还在用辛勤的双手脱贫致富,赵斌已经用双手征服女人了,一百个女人就会有九十九个成为他的客户,不管是少妇萝莉御姐熟女,只要经过赵斌按摩,都会迷恋上这种感觉,没错,赵斌就是一个按摩师。...

重生成了反派的掌中娇温婉谢渊渟

重生成了反派的掌中娇温婉谢渊渟

温婉重生了,这一世,她还是温国公府的孙小姐。父亲枉死,家中男丁悉数下狱,拿得一手烂牌,温婉表示无所谓!这一世,她再也不会袖手旁观。于是抛头露面成了家常便饭,当街打马也无不可,暴揍狂徒更是手到擒来,挺不住了,以一己之身对抗豺狼虎豹也是有的,泼辣之名如雷贯耳。而当她被亲手拖出深渊的亲人背叛,反咬一口,推入那死无葬身之地时,却是那曾经一鞭子毁了她容的炮灰反派拼死为她杀出了一条生路。温婉惊讶,这世...

我的七个姐姐倾国倾城叶萧白子柒

我的七个姐姐倾国倾城叶萧白子柒

大姐白子柒,荣登福布斯富豪榜,霸道总裁。二姐夏娉婷,顶级杀手。三姐李羽真,中医圣手。四姐楚灵儿,超级大明星。五姐苏清荷,国际黑暗世界女皇,号称罗刹。六姐方涵,是个智商高达两百的天才,在各种艺术方面有超高造诣。七姐秦楚楚,身份神秘叶萧自己,全球黑暗世界的王者修罗!...

大尊主

大尊主

作者赵守中的经典小说大尊主最新章节全文阅读服务本站更新及时无弹窗广告小说试看一个小小的奴才,如何做到笑傲宇宙之内,独尊天地之间。...

每日热搜小说推荐