工作中的数据科学
为数据团队挑选技术设备时需要考量的 7 个方面
在执行数据建模和分析任务时,专业的数据科学工作站相较普通的标准电脑具有相当明显的优势。两者的区别远不止性能这一项,还包括软件解决方案、专用组件,以及一系列其他有助于让数据科学变得更流畅、更经济、更安全的因素。
继续阅读下文,了解相比于标准电脑,专业的数据科学工作站能够为您带来哪些优势。
软件堆栈
预加载的数据科学软件堆栈有助于节省宝贵的时间
数据科学家很依赖版本管理和一系列专业的软件工具,而保证这些工具的兼容性却是一项不小的挑战,即便是经验丰富的数据科学家也不例外。公司如果能够预先在数据科学工作站中载入版本得到妥善管理的软件堆栈,势必可以解决这一难题,从一开始就享受到出众的生产力。
标准电脑下的数据科学工作
安装、配置软件以及处理软件版本管理工作,可能会耗费大量时间,这不仅会拖慢数据科学家的工作进度,也可能导致业务流程出现中断,并增加 IT 部门的负担。
42%
的数据科学家表示,配置环境是一项极为耗时的工作。1
Z 系列工作站下的数据科学工作
预安装的基本软件以及有效的版本控制,能够让数据科学家从拿到工作站开始,就能全情投入到工作之中。
“我只需要打开工作站,然后便能立即开始工作。”
速度
即使是运行要求严苛的工作负载,一样能够展现出众的速度和性能
数据科学工作需要处理海量的数据。如今的数据规模早已从 TB 级迈向 PB 级。与此同时,CPU 和 GPU 性能也已不再是用户的唯一关注点,市场需求正在发生巨大的变化。在近期开展的一项案例研究中,Z 系列的客户反馈道,将大型项目从旧的工作站转移到 HP Z8 工作站以后,处理速度提升至原来的 150 倍。而且他们处理的是 20 PB 的超大文件,所以前后两台工作站在性能上的表现可谓是天差地别。4
标准电脑下的数据科学工作
对于一般的商业用户来说,公司部署的标准电脑可以满足日常工作所需,然而当遇上资源密集型数据科学工作负载时,这些电脑将会令他们大失所望。如果标准电脑无法提供所需的性能,数据科学家对云计算资源的依赖程度就会越来越高。
41%
的数据科学家表示,由于所用电脑的计算能力有限,他们必须把一项工作拆成好几个部分来完成。1
Z 系列工作站下的数据科学工作
Z8 及其他 Z 系列数据科学工作站可搭载英特尔® 至强® 56 核可扩展处理器5 和新一代 NVIDIA RTX™ 基于 Ampere 的专用 GPU5,专为应对繁重的工作而生。数据科学家可以运行完整的模型,无需降级采样,从而以持续不间断的分析能力改善发现过程。
“我有一台 Z8 工作站。它的超强性能让我惊叹不已,并且配有 TB 级的内存。[如果拿普通电脑与之相比],那无异于拿普通汽车与喷气战斗机相比。”
云成本
选择有助于减少云计算开支的工作站
数据科学工作或许需要天马行空的想象,但云成本却需要脚踏实地的细致规划。由于昂贵的云计算开支,企业需要尽可能地提高数据科学工作流程的效率和优化云的使用。不妨建议公司内热衷云计算服务的用户使用辅助性的本地硬件解决方案来保持成本的可预测性。
标准电脑下的数据科学工作
要知道,因为不记得自己是不是关了云端虚拟机,猛然从梦中惊醒可不是一件美妙的事。数据科学家们应该很清楚,一个小小的疏忽很容易带来代价高昂的后果。
54%
的数据收集和管理工作在云端进行,而 44% 的同类工作在本地计算机上进行。1
Z 系列工作站下的数据科学工作
与云计算相比,数据科学工作站能够以更迅捷、更经济的方式运行耗时的工作负载。这种财务上的可预测性可以让企业恢复对 IT 环境的控制,给用户多样化的选择,使他们可以挑选省时省钱的方案。
“在拥有 Z 系列工作站以前,云计算解决方案是我的第一选择,但它的缺点是成本高昂。更要命的是,这个成本会随着时间的推移而上升,
而且外汇汇率的波动也会增加成本的不可预测性。”
故障排除
随时随地获取故障排除与问题诊断支持
当出现问题时,数据团队很乐意向 IT 部门求助,但有时候他们对问题是什么以及问题出在哪里都毫无头绪。专家的帮助对于两个部门来说都是一种财富:我们的工作人员了解数据科学家的工作内容,可以为他们提供周到的全天候支持,而 IT 技术专家则有机会休息一下,以免被众多陌生而复杂的技术问题压得喘不过气。
标准电脑下的数据科学工作
遇到技术问题时,大多数的数据科学家会向计算机支持部门求助,或者尝试自己解决。因为一般的用户并不熟悉数据科学家的需求,他们绞尽脑汁也解决不了的某些问题,对专家来说就是“小菜一碟”。
是什么拖慢了日常的工作节奏?1
数据科学家这样回答:
37%
硬件需求
35%
软件需求
Z 系列工作站下的数据科学工作
惠普经验丰富的工作人员可以提供专职的支持,帮助 IT 部门维持正常运转,避免数据科学家的项目进度受到影响。专家团队对数据科学家的工作任务了如指掌,科学家们可以快速、轻松地获得他们需要的相关信息。
“如果我在使用惠普 Z 系列解决方案时遇到了问题,我知道该找谁求助。他们对数据科学的生命周期和流程很了解,可以帮助我诊断各类问题。在我看来,这样的支持简直太棒了。”
移动性
随时随地
悦享数据科学功能
在新的工作模式下,移动性至关重要。对于数据科学家来说更是如此,“即兴发挥”是他们工作的一部分,只要灵感来了,就需要登录系统去运行模型和训练数据集。他们的计算机还必须支持他们与同事进行流畅、富有成效的协作,同时不会泄露工作中的敏感数据。
标准电脑下的数据科学工作
某些性能出众的标准电脑可以处理数据科学任务,但它们通常欠缺移动性,因而无法满足当今随处办公模式的需求。为了满足办公室以外的其他场景的使用需求,将电脑连接到云端或许是一个可行的替代方案,但这会带来严重的成本和安全问题。
37%
的数据科学家认为他们采用的技术使工作变得更加困难。1
Z 系列工作站下的数据科学工作
惠普和 Teradici 的远程访问解决方案仅通过网络传输像素信息,可以提供比其他方案更突出的安全优势。这种方式让敏感的知识产权远离网络,用户可以随心所欲地工作和协作,从各种设备或系统,甚至是智能手机,通过一致且高度安全的方式访问高性能工作站。
“惠普 Z 系列远程解决方案让我可以从性能欠佳的台式电脑或笔记本电脑远程访问我的工作站,这样我就不需要在家里运行数据科学实验。”
安全性
自带超强防护力
贵公司的数据科学家很可能单日就要处理数 TB 甚至数 PB 的数据,其中大部分数据涉及敏感的个人身份信息或知识产权。保障数十款开源工具和资源库(可能未经 IT 部门批准)的安全并不是数据科学家关注的焦点,他们对此甚至知之甚少。换言之,他们的计算机需要承担起安全方面的重任,这样数据科学家们才能专注于开展研究发现。
标准电脑下的数据科学工作
数据科学家通常并非安全专家,但却经常需要为他们所用的开源软件、远程连接等内容的安全负责。让数据专家负责系统的安全,无疑会增加出现漏洞的风险。
73%
的数据科学家希望采取额外的安全措施,以保障云端数据的安全。1
Z 系列工作站下的数据科学工作
Z 系列工作站专为满足严格的安全要求而设计。这也是美国国家航空航天局等具有严格安全标准的组织使用它的原因。Z 系列工作站将数据保留在本地,防止数据暴露于网络环境,而惠普和 Teradici 的远程访问解决方案则可以保护知识产权。
“我不喜欢为安全问题劳神费力。我希望将精力放在数据科学上。惠普非常注重安全保护,我不用分心于不擅长的领域,这让我感觉如释重负。”
软件灵活性
从 Windows 切换到 Linux 只需几秒钟
Windows 和 Linux®5 都是十分实用的操作系统,各有各的优势。Linux 具有出色的兼容性,可以运行许多专用于数据科学领域的实用程序和应用,而 Windows 在安全性、可管理性以及电子邮件和协作应用等业务工具上更胜一筹。有了 Windows Subsystem for Linux 2 (WSL 2)8,数据科学家们可以兼得“鱼与熊掌”,随时根据需要在同一台工作站上无缝切换操作系统。
标准电脑下的数据科学工作
如果工作站未配备 WSL 2,许多数据科学家就不得不配置两台不同的设备,或采用双启动方法,才能同时享有 Windows 和 Linux 的优势。
43%
的数据科学家表示,他们遇到的中断增大了完成工作的难度。1
Z 系列工作站下的数据科学工作
Z 系列工作站专为满足严格的安全要求而设计。这也是美国国家航空航天局等具有严格安全标准的组织使用它的原因。Z 系列工作站将数据保留在本地,防止数据暴露于网络环境,而惠普和 Teradici 的远程访问解决方案则可以保护知识产权。
“事实上,我的 Windows 工作站上已经安装了 WSL 2,而且我也不必担心是否下载了正确的软件,因为这些工作都是由领域内的专家负责完成的,这使得一切变得非常顺利。”
为数据科学家和分析师量身打造的惠普 Z 系列工作站
使用惠普 Z 系列数据科学移动工作站和台式工作站,从要求严苛的数据集快速获得结果,妥善训练数据模型并实现数据可视化。