facebook一场与智能基础硬件有关的战意,似乎在这个春天悄然而至

来源:钛媒体APP | 2019-03-20 10:14:03 |

facebook与硬件“相爱相杀”的故事大家恐怕听到耳朵起茧了。不过,前不久facebook在开放计算项目(OCP)峰会上官宣的新硬件开源项目,依然引起不小的关注。

不仅因为这是个“组合大礼包”,包括了面向训练的Zion、面向推理的Kings Canyon及面向视频转码的Mount Shasta。更重要的是,这是facebook首次明确地表达出了从消费硬件到基础设施的转型姿态。

这张升级后的硬件“名片”,被加上了“产业基础架构”几个大字,之于facebook自然意义重大。不过,它也并不那么突出,因为谷歌、IBM、苹果等在内的巨头们也相继加入了硬件开源的大军,有的甚至比facebook还早。一场与智能基础硬件有关的战意,似乎在这个春天悄然而至。

我们不妨以这次大动作为切入点,看看facebook能否借着2.0版硬件梦一战翻身?

AI三件套:facebook的2.0版硬件梦

先来了解一下,facebook究竟放出了哪些让业界为之震动的“下一代”神器。一句话总结,就是针对深度神经网络运算的“基础设施三件套”,可以为中小企业的AI梦供能。其中主要包括了三个模块:

1. 能够进行大规模神经网络计算的训练平台Zion

Zion采用了facebook全新的OAM模块(OCP Accelerator Module),能够高效处理包括CNN、LSTM和SparseNN在内的一系列神经网络。配有两个高速结构,能够有效地使用可用的聚合内存容量,使得更频繁访问的数据驻留在加速器上,而访问频率较低的数据驻留在带CPU的DDR内存。从而为合作伙伴(目前有AMD、Haban、GraphCore和NVIDIA等)提供高容量高带宽的存储、灵活且高速的互连,以及强大的计算能力。

2. 能够执行推理任务的AI服务器Kings Canyon

和传统的CPU服务器不同,facebook开源的AI服务器由M.2 Kings Canyon加速器和连接到Twin Lakes服务器的Glacier Point v2载卡组成。其中,每个Kings Canyon模块包含了能够执行INT8半精度运算的推理ASIC芯片和其它支持组件,可以通过专门的编译器将图形转换为可以在这些加速器上执行的指令,从而不受供应商特定硬件的限制,为机器学习加速器生成高度优化的代码。

3. 可以定制转码的Mount Shasta

视频是facebook的核心业务之一,每天大约有7500万人访问相关产品。为此,facebook为不同的网络环境划分了多种分辨率和比特率的输出质量,这就是视频转码。

而其开源硬件Mount Shasta,就是一个由多个GPv2组成的高密度几何体,每块Glacier Point v2(GPv2)载卡都安装了能够高效输出视频编码的ASIC,这样就可以将视频转码工作负载平衡分布到不同数据中心位置的异构硬件上。facebook还配备了通用的界面和框架,以便于各种机器学习和视频空间供应商的能够顺滑使用。

总体来看,Zion、Kings Canyon和Mount Shasta这“AI硬件三剑客”,剑指当前爆发式增长的AI训练、AI推理和视频转码方面的需求,并试图将facebook长期以来积累的技术优势和硬件招牌相结合,以开放的姿态,打造出一块能够影响未来产业结构的“金字招牌”。

facebook为何对硬件如此执着?

屡败屡战:facebook熊熊燃烧的硬件之魂

facebook和扎克伯格一直对硬件爱得深沉。其硬件的发展之路也执着地经历了三个历史阶段:

阶段一:与谷歌打擂台的服务器之争

早在2009年,facebook就以“又一个谷歌”为目标,开启了一场关于硬件的擂台赛。从Google挖来了硬件工程师Amir Michael,主管硬件设计。2010年,又成立了第一个自建数据中心。

2011年4月,facebook发起了开放计算项目(Open Compute Project,OCP),开源了其包括数据中心、定制服务器在内的一系列硬件设计。

作为一个开源的硬件项目,OCP成为facebook向硬件厂商和社区化运营的关键载体。但随着在移动云时代的逐渐掉队,facebook只好将目光转移到了消费硬件上,以挽救华尔街投资人日益流失的心。

阶段二:押注消费硬件的社交时代

硬件+社交,成为2014-2018年facebook“自我拯救”的两大核心关键词。

2014年,facebook以20亿美元的价格收购虚拟现实头戴设备制造商Oculus,开启了“软件向下整合”制造业的里程。

2016年,成立了Building 8部门和设备阵容强大的“Area 404”硬件实验室,让自家多个部门的硬件工程师聚集在一起放飞自我,以共同催化facebook的硬件计划。

不过,最早与大众见面的,居然是2017年跟风发布的一款带有硕大触控屏的智能音箱“Portal”,当时被群嘲为“帮笔记本屏幕存货清库存”,随后又遭遇了收集用户隐私的指控。

在隐私形式更加严峻的2018年,facebook又执着地发布了内置摄像头和麦克风的硬件产品Portal及Portal Plus,用户可以在上面通过社交账号进行视频聊天。从市场的反馈来看,显然是不及格。

阶段三:伸向AI的硬件触角

消费硬件虽然步履维艰,但忙着“带货”的同时,facebook也没忘记自己的技术使命,开启了向AI大潮的坚定转型,将AI研究应用于facebook的既有产品上。

不过,扎克伯克宣布进入智能领域的时候,其实已经晚了。当时,谷歌已经将深度学习应用于多个业务线,微软更是雄踞近千名科学家和工程师,亚马逊暗自研究AI已有4年之久,中国的百度更是刚刚挖走了谷歌的深度学习领头人Andrew Ng。

“赶了个晚集”的facebook,除了在现有业务上加速上马AI 之外(成立了FAIR和AML),自然也选择了两条腿走路,跟硬件死磕到底。

2015年,facebook开源了自己的人工智能硬件服务器“Big Sur”,该服务器包含了8个图像处理单元,可以运行最新的人工智能算法,供程序猿们免费使用。此后还不间断地在GitHub这样的开源服务上发表代码,狂刷AI人设。

随着今年这一通“硬件开源大礼包”的骚操作,facebook的“硬件拯救”计划终于不再是一件强行穿上的“皇帝新衣”,而是为自己重新定位了一个新坐标:智能基础设施服务商。

硬件开源2.0,对于facebook有何意义

那么,这张2.0版本的“硬件名片”,对facebook来说究竟意味着什么?或许我们可以从三个角度来找到答案:

1. 自身AI技术的“软着陆”。

当前环境下,深度神经网络的技术门槛、应用场景和稀缺的算力资源,都在制约着开发者的手脚。其中支撑AI基础设施的就是开放硬件技术。

而对于facebook来说,其机器学习系统每天要处理超过200万亿次的预测和50亿次的翻译,积累了领先性的技术优势和应用场景,将这些产业资源(包括数据、工具、框架、硬件等)整合,并通过开源的形式共享出来,能够帮助整个AI产业链造就更有持续生命力的开发环境,降低开发成本,既是facebook作为巨头的责任,也是其技术优势在产业链的“软着陆”。

2. 提升智能基础架构的产业竞争力

谷歌、亚马逊、苹果等已经在AI基础架构领域火力全开,围绕AI芯片、专用处理器展开鏖战,facebook想要“后来居上”提高竞争力,开源自然迫在眉睫。

一是有更多的企业使用facebook统一规范的硬件,可以增大采购量,帮助facebook降低成本。正如facebook AI领域的创建者 Yann LeCun所说,“越多的人使用这项技术,它的成本就会变得越低。”另一方面,开源则可以吸引外部人才参与项目协作,并改进相关技术。减少自身科研经费压力的同时,还有可能从第三方社区中招募一些人才。这些都是AI这场“圈地战争”的关键赛点。

3. 埋藏着金矿的生态集群

AI的未来也必然需要一个集合了全球优秀开发者的庞大集群,开源恰恰就是争夺生态资源的最好办法。以安卓为例,由于开源,谷歌创建了强大的开发者社区,才有了手机市场的大半壁江山。

通过为开发者们注入基础的技术、硬件和生态能力,后续的产业融合和广告效应才是科技巨头们所期望看到的。为了在“后发”的AI基础设施领域迅速缩小与谷歌、IBM等的差距,facebook通过开源壮大自身生态系统,自然也就迫在眉睫。

综合这三方面来看,facebook的“硬件2.0计划”,既是水到渠成,也是因势利导的明智之举。对于众多AI开发者和企业来说,也确实是个福音。新的硬件解决方案和更强大的算力资源,很大程度上降低了机器学习训练的工作量,也将给AI的商业化步伐带来新的想象空间。

不过,需要正视的是,升级版硬件开源,或许能让facebook在AI领域赢得声誉和民心,却未必能保证实现扎克伯格“硬件求生”的战略雄心。

首先,硬件毕竟是通用的。一大波基础硬件厂商和初创企业之所以能风起云涌(截至2018年至少有45家),正是因为硬件解决方案的技术壁垒极容易被攻破。而谷歌和亚马逊在AI和机器学习领域的算法和软件技术,其优势可能会很快超越硬件创新所带来的提升。

在这样的高压环境下,facebook过度押注于产业生态的故事,而忽略了商业化本身的严峻现实,资本市场恐怕会率先“用脚投票”,谈及帮助开发者或许还为时尚早。

但无论如此,积极转型也预示着新的变化的开始。至于这场“硬件开源”的升级版绝地求生,到底是恢弘故事的开头,还是狗尾续貂的序章,时间终会证明一切。

关键词: facebook 智能 基础 硬件