无限可能,尽在边缘:
让数据就地变为情报
• 趋势文章
未来的数据分析将从云转向网络边缘,推动实时决策
过去十年间主要的技术趋势就是大规模迁移到云。由于在线服务的规模化经济效益和广度,不同规模的组织都已采用具有多种 IT 功能的云服务,因此构建和运行应用的现代化方法如今都称为“云原生”。
然而,企业要想在数据竞赛中保住优势位置,将一切内容集中到大型云数据中心只会束缚发展的手脚。5G 网络时代的来临,以及工业物联网 (IIoT) 浪潮下互联设备的蓬勃发展,会在环境中产生海量实时数据,企业需要快速分析这些数据,以便及时提供信息,作出商业决策。当今世界,新兴技术和强大的新分析模型不断涌现,速度和准确性变得同样重要,此时云计算将显得力不从心。
据 Gartner 报告1,对于企业生成的数据,如今仅有约 10% 在传统数据中心或云环境之外创建并进行处理,但预计到 2025 年,这一比例将飙升至 75%。Gartner 高级研究总监 Santhosh Rao 总结说,各机构须考虑“去中心化”的方法:“随着数据的生成体量和速度提高,将这些信息流式传输至云或数据中心进行处理的效率不足问题也会日益凸显。”
75%
据 Gartner 报告,到 2025 年,在传统数据中心和云环境之外创建并处理企业生成数据的比例1
这预示着从云计算转向边缘计算的颠覆性改变即将发生。
分析公司 SAS 的执行副总裁兼首席技术官 Oliver Schabenberger 认为,边缘是每一家企业机构的起点。原因在于,在数据中心之外生成数据的任何事物以及连接至互联网的内容都处于边缘层。2
“其中包括家电、机器、汽车、路灯、家用智能设备、火车、宠物和医疗器械,”他说道。
对于数据科学家来说,将智能转移至数据的收集点上,将打开探索无限可能的新世界。首先,这能够进一步激发 IIoT 的潜力,也有助于使用互联设备收集大量不同类型的数据并进行学习,而无需先对其排序。由此,数据科学家可以从风力涡轮机、门或路灯等事物中获取见解,摆脱既有目的限制。
而更直观的三大优势则是:响应更快、全网络分布式处理所带来的更好扩展性,以及减少所用带宽带来的成本节约。这些优势有助于企业开拓分析的新疆域事半功倍。
“在许多应用中,在数据收集点实施智能或知识探索的能力至关重要。”
Kirk Borne
Booz Allen Hamilton 首席数据科学家兼执行顾问
速度需求
在边缘分析的潜在优势中,数据处理的高速度不容小觑。诸如流媒体、IIoT、VR 和 AR 等应用,都需要以超低延迟率提供大量数据。如果需要亚秒级响应时间,那么仍需等待申请的云计算便不再是可行的选择。因此,那些令人振奋的新兴技术,其潜力只有在边缘才能真正实现。
Booz Allen Hamilton 首席数据科学家兼执行顾问 Kirk Borne 表示,要跟上数据积聚的步伐,数据科学须转向边缘计算。“在许多应用中,在数据收集点上实施智能或知识探索的能力实际上至关重要。因为这样的能力让我们无需再花大力气将数据带回业务中心,然后耗上一年进行分析。”对于自动驾驶汽车来说,尤其如此。前身为 Google 自动驾驶汽车项目的 Waymo 运营着多辆自动驾驶测试车辆,据估计,车上的传感器每天可产生 11 TB 至 152 TB 的数据。3 在连接足够可靠的情况下,在网络上来回发送数据至少需要 150-200 毫秒4。
152 TB
据报道,每天从 Waymo 自动驾驶测试车辆上收集到的传感器数据量。3
边缘设备是车辆成为理想 IIoT 设备的关键,因为它们会负责与周围环境进行通信,更重要的是与道路上的其他车辆进行通信,从而瞬间作出决策。在应对不断变化的路况时,是不允许出现错误或滞后的。自动驾驶汽车也不太可能停下来等待云服务器远程分析数据后发出行驶指令。只有边缘计算可实现快速决策,为自动驾驶汽车提供一个安全、光明的前景。
另一些应用虽不像自动驾驶这样引人瞩目,但重要性也不容忽视。例如,假设有人员过于靠近工业机器,操作工业机器的控制系统就需要立即停止。5 这种情况下,延迟可能就意味着生死。
在航空航天领域,边缘计算可以利用实时数据提高安全性。
“飞机引擎制造商希望在飞机上安装某种可靠的高负荷计算设备”
Todd Mostak
分析公司 OmniSci 首席执行官兼联合创始人。
“因为一旦出现问题,在目前的技术条件下,并不一定能将飞行中产生的 TB 级数据发送回地面,而人们希望在飞机上完成分析并处理异常情况。”
在另一些领域中,决策的即时性或许没那么重要,但延迟带来的累计业务风险可能会迅速升高。例如,想要避免储存不当产生浪费的连锁超市可以转向边缘计算,跨多个储存位置监控冰箱的使用性能和温度,借此为商店经理提供实时建议,以便在故障发生后立即采取行动保护商品。6
塑造客户体验
在媒体和娱乐行业,边缘技术也有助于企业满足客户不断增长的需求,实现客户体验的改善与个性化。数据科学家需要通过推荐引擎和情绪分析,加速将用户数据转化为有价值见解的压力日益增加。这就是 Netflix、Uber 和亚马逊等行业先锋选择在边缘层拓展商业模式的原因。
高速 5G 网络势必会提升用户预期,让他们期待更好的客户体验。据部分网络运营商估计,未来的网络会比现在的网络快 10 倍,甚至 1000 倍,用户将渴望随时体验增强现实或 4K 视频传输至移动设备。这需要加快数据传输速度,而这样的速度只有边缘技术能实现。
150 - 120
假设网络连接稳定,预计数据在蜂窝网络中传输只需毫秒级的时间。16
数据科学的美好未来尽在边缘技术
Kirk Borne
Booz Allen Hamilton 首席数据科学家兼执行顾问
“若要管理各种各样快速变化的数据,则需要处于数据收集点的边缘设备,而且要特定用于对应的数据收集类型。无论是成像数据,还是网络数据等数据流,任何边缘层数据均在其内。在许多应用中,在数据收集点实施智能或知识探索的能力至关重要。”
Jared Dame
惠普 Z 系列 AI 和数据科学主管
“边缘技术包括移动工作站以及 Jetson Nano 和 Intel Movidius 芯片等设备。这些设备全都远在边缘层,可以收集、筛选并产生数据,因此云不再是一切的归宿。这意味着,企业不必白白浪费时间,要等云处理好数据才能作出商业决策。”
数字游戏
这一关注点转换的迹象之一,就是相应的硬件需求也将发生变化。供应商为了响应企业对边缘技术创新的需求,也开始从提供简单的嵌入式设备和微控制器,转为提供性能强劲的系统,如工作站或微数据中心。7
对需要处理大量 IIoT 数据的企业而言,使用边缘计算的成本要比将数据传输回数据中心或云低。这也是 Seagate 执行副总裁兼运营、产品和技术主管 Jeff Nygaard 的观点。
“通过管路传输数据,将其从端点移至边缘再到云需要花钱;通过管路发送数据也需要支付费用。因此应该深思熟虑的是,我们什么时候真的需要传输数据,”他说道。8
借助边缘计算,我们可以在将数据发送到云之前对其进行筛选和处理,从而减少数据传输量,并降低可能产生的网络成本。这为企业发挥出 IIoT 设备的全部潜力开辟出无限可能,让之前无法用上的数据来源也能实时获取关键业务的建议。
“通过管路传输数据,将其从端点移至边缘再到云需要花钱;通过管路发送数据也需要支付费用。因此应该深思熟虑的是,我们什么时候真的需要移动数据。”
Jeff Nygaard
Seagate 执行副总裁兼运营、产品及技术主管
例如,在海洋偏远地区作业的石油钻井平台可能装有数千个传感器,可产生大量数据,其中可能大部分是冗余数据。这种情况下,想要可靠的连接互联网几乎不可能,而通过卫星数据连接将这些信息传回基地又是天价。相反,本地边缘计算系统可以对数据进行编译,并将每日报告发送至中央数据中心或云进行长期存储,这样便可以只传输重要数据。9
因此,边缘计算归根结底其实是实施分布式架构,这是实现可扩展性的关键,因为在接近数据源的地方进行数据处理,可以让业务用户更灵活地从所收集的数据中获取实时建议。对 IT 主管和数据策略专家而言,这种方案优于集中式架构,可以规避网络故障和延迟影响性能表现的风险,从而促进决策过程。10
但边缘与云并不是相互排斥。边缘与云的混合模型正在日益兴起。工厂环境便是很好的例子。在智能工厂中,产生的数据并不会直接传输至云,因为宝贵的工厂背景信息可能在传输过程中丢失。不同的是,数据会在经过筛选以后再在非高峰时段发送至云,也无需担忧时效性问题。11
数据科学的无限可能尽在边缘
LJ Duarte and Associates 数据科学家兼负责人 Jim Duarte 认为,数据科学家,尤其是在控制源头部署预测模型的工程师,都很拥护这种朝向边缘技术的转变。
“更多和更好的边缘应用能够随着更好的分析技术,创造出更好的模型,同时技术的可扩展性也将使其出现在更多场所。”他还预测道。“复杂的工作流程也可以得到充分的控制,从而减少阻碍优化的限制。随着控件占用空间的缩小,恶劣环境下使用性能的提高,边缘分析势必会迎来进一步发展,因为纤小外形有助于增强控件自我保护能力,并提高运行能力。”
对数据科学家而言,在边缘层进行复杂的数据分析可以取得基于预测的成果,从而帮助企业提高效率并节省成本。
比如,昂贵的大型工业机械,例如推土机。机器学习可用于识别和映射机器子组件和元件之间的关系,然后监控这些元件,并执行模拟来预测未来的运转状况。12
此类模型不仅能预测机器未来的故障,还能预测故障的大致时间。在过去,要进行这样的预测计算过于复杂。如今,有了这项能力,公司便可以安排维护、减少计划外停机时间,并高效利用备件库存。
推动明智业务决策
边缘分析为机器学习应用开拓了新的可能。例如,在金融服务行业,数据科学家可以训练算法,来实时评估某笔交易对特定客户来说是否存在异常,如果交易的欺诈可能性在 95% 以上,系统将请求验证,甚至直接阻止交易进行。13
机器学习算法也适用于金融和保险行业中常见的保险承销业务。算法可以执行保险承销和信用评分任务,帮助员工加快作出决策,并提高决策准确性。
机器学习驱动的分析技术还有望在医疗卫生行业产生巨大影响,因为除了能削减时间和成本,更重要的是有助于挽救生命。AI 既可以帮助病理学家从医学图像快速作出准确诊断,也能够判断出可能受益于新型治疗或疗法的患者。在医疗卫生专家的眼里,这项技术决定着医疗卫生行业的未来。
“目前,如果患者前往医院接受核磁共振成像 (MRI) 检查,仪器可以立即生成数据,但检查结果可能需要一周才能拿到。”Inseego Corp AI & ML 主管 Amit Marathe 说道,“我认为,医疗卫生行业需要转向实时分析。”
未来,医疗行业有望迎来紧急医疗响应 (EMR) 系统,这一应用可以在医生检查患者的同时运行预测算法。在这一构想中,系统将显示实时诊断、病理结果和治疗方案,以及每一种方案的潜在有效性。
“展望未来,边缘计算将扩展到 IoT、自动驾驶汽车和工业自动化等应用领域之外。”
Darren Seymour-Russell
Mudano 数据科学主管。
智能设备激增
这些进步将推动 AI 走出数据中心,走入我们工作和日常生活中使用的设备和机器。15 Deloitte 预测,即将到来的“普及智能时代”将以 AI 驱动型智能设备激增为标志,这些设备能够识别视觉、声音和其他模式并作出反应。越来越多的数据科学家都将能够训练机器,让它们从经验中学习、适应不断变化的情况,并预测结果。
数据咨询公司 Mudano 的数据科学主管 Darren Seymour-Russell 预测,“展望未来,边缘计算将扩展到 IIoT、自动驾驶汽车和工业自动化等‘传统’应用领域之外,进入关键的个性化用户体验领域。”
例如,在安全的银行业务交互过程中,边缘计算可以为客户提供量身定制的服务或优惠。这些设备将内嵌智能功能,而不是使用云中的智能功能,因此即使连接质量很差甚至中断,也能启动多种需要即时响应和性能强劲的应用。
技术展望
边缘层生成的数据日益增多,数据中心已不再是“主战场”,同时许多应用需要实时响应,因此数据处理也需要在边缘进行。
企业需要评估组织的数据收集和使用方式及地点,以及在网络边缘执行分析是否可以在避免数据拥塞的同时显著提高性能。然而,边缘计算并不会取代云,只是将云的功能延伸到本地,同时降低带宽成本。
要点精粹
在边缘层处理数据之所以可以削减成本,是因为其能有效降低与网络流量和延迟相关的成本
在需要快速响应或带宽受限的场景下,边缘分析具备很大的优势
从纯云端策略到边缘 + 云的混合策略,这一趋势转变显而易见