申请回电

支持

数据科学家
省时指南

作为一名数据科学家,您正站在科学、工程、商业智能和数学的十字路口。您需要辗转腾挪,从编程到数据可视化,再到清理数据集和完成各种临时任务,,除非详细记录工作时间,否则您可能会对自己运用时间的方式大吃一惊。在惠普近期对全世界 350 名数据科学家进行的一项调查中,48% 的受访者表示,他们在整理数据上花费的时间实际上要多于分析数据所用的时间。1

 

您的时间非常宝贵,所以效率至关重要。谁能想到,要想把工作做得出色,不仅需要熟练掌握复杂的 SQL 技能,还应该高效地管理自己的时间。以下六个建议可助您优化工作流程并充分利用时间。

积极主动的沟通有助于节省时间

建立沟通接触点对于节省时间至关重要,因为这有助于您在项目过程中持续做出正确的决策。40% 的受访数据科学家提到,他们通常会在充分理解业务目标之前便开始处理数据。1 这种缺乏沟通的情况通常会导致管理者对项目结果抱有不切实际的期望。

 

这个问题可能非常微妙。毕竟,企业利益相关方与数据科学家在某种意义上来说都属于技术人员,但他们所用的词汇和沟通方式却大相径庭,这就导致双方有时无法进行有效交流。一个重要的区别在于:企业利益相关方倾向于以二元思维模式来看待结果,而数据科学家则认为世上的一切都充满了不确定性。必须在您的数据驱动型方法与利益相关方的方法之间找到一个平衡点。

“企业利益相关方倾向于以二元思维模式来看待结果,而数据科学家则认为世上的一切都充满了不确定性。”

在谈论技术性话题时,用项目实施人员能够理解的方式进行沟通非常重要。惠普 Z 系列大使2 兼 Scouts Consulting Group 数据科学主管 Ken Jee 从事运动分析相关工作。“许多运动员都不愿意采用他们无法理解的解决方案。将简单的线性模型作为起点,即使结果可能不尽如人意,但此举可让对方了解,我们为什么要按特定方式做出不同寻常的决定。”换句话说,如果整个环节中的每个人都能理解项目的价值,那么您的项目就能快速实施。

提前了解数据可以节省时间

各种长期和短期项目经常会占用您宝贵的时间。这意味着,充分利用有限的时间非常重要,如果您能在项目之初便优化时间安排,那么您在日后项目进行过程中将获得巨大的收益。在尚未真正理解数据之前过早地开始建模,是常见的错误做法,这只会浪费您的时间。开始新项目时,您无疑希望尽快进入建模阶段,毕竟这才是工作中真正令人兴奋的环节,但是有经验的数据科学家都知道这并非最佳做法。

 

惠普 Z 系列大使2 兼法国精算数据科学家 Louise Ferbach 认为,如果数据科学家能将更多的精力放在确定相关性上,那么整个项目都将从中受益,正如 Ferbach 所言:“了解数据才是成功之道”。投入一些时间(如果可以的话,花费一到两天也是值得的)来了解数据,可以帮助您发现对建模工作非常有用的模式。最终您会发现,您在这上面投入的时间将带来巨大的收益。

 

与之类似,文档是各种数据科学项目的重要组成部分。尽早锁定适当的文档是提高效率并节省时间的关键方法。另外不可忽视的一点是,您应在项目过程中正确记录所写的代码。糟糕的代码记录是许多软件工程师和数据科学家的“通病”,您此刻的想法可能在一周后就会被遗忘,更别说一个月后了。花一些时间做好记录工作,避免出现被自己所写的代码难倒的窘境。

Louise Ferbach

Louise 近日获得了统计学、应用数学和计量金融学的理学硕士学位,随着时间的推移,她对数据科学的兴趣越来越浓厚。 

为工作空间添置合适的配件,借此节省时间

在选择硬件时,CPU 和 GPU 可能是您优先关注的重点。开箱即用的强大计算能力是满足日常工作需求和节省时间的必备条件。

 

绳锯木断,水滴石穿,细节之处见真章。许多配件选择都取决于个人的决定,人们基于舒适性、便利性和偏好做出适合自己的选择,并不存在一款能够帮助每个人节省时间、提高效率的“完美”配件。

 

例如,每个人在选择鼠标配件时都有自己的偏好。惠普 Z 系列大使2 兼波兰 LogicAI 数据科学家 Paras Varshney 很少使用笔记本电脑上的触摸板,相反,鼠标是他非常喜欢的小工具。他认为使用鼠标有助于提升工作效率。Jee 也是轨迹球鼠标的忠实拥趸。

他经常在飞机上移动办公,因此轨迹球鼠标是他的心头好,这种鼠标无需来回移动手部,让他在小托盘上使用电脑时也能高效工作。

 

Varshney 则更加看重显示屏的质量,“我喜欢分屏办公。因为我有一台 HP Z38c 曲面显示屏,可以用它来同时打开多个窗口,不需要变更窗口或切换标签页,我所需要的全部内容同时呈现在我的眼前。”为了完成工作,您需要在许多打开的窗口中进行多任务处理,包括应用、浏览器标签页和仪表板。

 

如果打开、关闭或管理工作区的操作都在笔记本电脑屏幕上进行,您的工作效率无疑会受到影响。因此,添加合适的配件,选择适合自己的鼠标和曲面显示屏等等,可以帮助您优化工作流程并节省时间。

Paras Varshney

Paras 是一名数据科学家,任职于班加罗尔的印度科学研究所,从事数据分析和研发方面的工作,致力于打造面向智慧城市的开源数据交换平台。

通过了解适合自己的工作模式节省时间

作为数据科学家,模式识别已经刻入了您的 DNA。如同每天优化模型一样,您也可以通过优化日常工作模式来提升工作效率。

 

因为没有两个人是一模一样的,同一个工作流程并不一定适合每个人。在当今这个许多人都选择居家办公的时代,惠普 Z 系列大使2 兼 LINE 机器学习工程师 Qishen Ha 意识到,孤独的工作环境并不适合他;他太容易分心了。相反,他更喜欢呆在办公室里,与其他员工身处同一个工作空间。“浓厚的工作氛围会促使我更加努力地工作。”他说。

 Qishen Ha

Qishen Ha 目前就职于 LINE Corporation,该社交平台在全世界拥有数亿用户。

与 Qishen Ha 相反,Jee 是一名全职居家办公人士,在反复研究自己的工作流程后,他在一天中划分出几个时间段,专门用来处理电子邮件。他不喜欢在处理多项核心工作的同时发送电子邮件,因为这会降低工作效率,他认为在做其他工作时查看电子邮件会浪费宝贵的时间,让他无法专注于完成主要任务。在如今的快节奏时代,每个人都希望对方即时回复自己的电子邮件或 Slack 消息,反趋势而行,在特定的时间段集中处理电子邮件有助于充分利用时间。

Ken Jee

作为 Scouts Consulting Group 数据科学负责人,Ken 每天都在分析收集到的运动员和团队的数据,全心致力于提高他们的运动表现。

借助正确的工具和配置节省时间

配置新的计算机总是让人头疼,42% 的受访数据科学家抱怨他们在配置数据环境上耗费了太多时间,平均每周在此项工作上损失 5 个小时。1

采用 Windows Subsystem for Linumx® — WSL 23 是提高效率的一个重要方法,您可以直接在 Windows 中虚拟运行 Linux 工具、实用程序和应用,无需再仰赖双启动配置或虚拟机。例如,Jee 表示,使用 Windows 台式电脑工作时,他不再需要远程访问 Linux 工作站,这不仅减少了兼容性问题,还加快了工作流程的速度。

 

同样,对于有幸使用过预配置软件堆栈的数据科学家而言,这个强大工具打开了一扇通往新世界的大门。

 

“在遇到它之前,我甚至不知道有这种东西存在,但它确实带来了改变。”Ferbach 说,“当惠普将 Z 系列数据科学计算机寄送给您时,会预装所谓的数据科学软件堆栈。”这种软件堆栈本质上是一套综合应用和环境,预加载内容均支持自动更新,避免了常见的软件不兼容问题和冗长的故障排除流程,可显著简化日常设置。

通过流程自动化节省时间

根据您在数据科学职业生涯中所处的阶段,您可能已经在某些方面优化了自己的工作流程。然而,随着技能和经验的增长,以及复杂性的增加,留意其他时间优化方法也非常重要。Varshney 在谈到如何充分利用大型显示屏时说道:“像分屏办公这种简单的技能,数据科学新手也能轻松掌握。”

 

您的工具箱中还有更强大的工具吗?自动化。处理过后视镜相关流程的数据科学家,都深知自动化工作流程的价值。毕竟,确定哪些任务需要大量人工处理,并且可能需要不断重复并非难事,因此自动化执行这些任务可以节省大量时间。只需几个命令便可实现整个流程的自主运行。

惠普 Z 系列优势

正如上述建议所言,作为一名数据科学家,您可以通过养成一些良好的习惯来提升工作效率。日积月累,点点滴滴的累积也能节省大量时间。换言之,对于数据科学家来说,最终能够节省多少时间,很大程度上取决于工作站的性能。这便是为什么 

惠普 Z 系列始终不断创新,为数据科学家带来他们需要的高计算性能工作站、显示屏和工具,力求帮助他们尽可能实现任务的无缝式管理。查看惠普 Z 系列提供的预配置软件堆栈中包含的工具和库,它们可以帮助您节省时间,或者了解指定惠普 Z 系列数据科学工作站上提供的 WSL 2。

为数据科学家和分析师量身打造的惠普 Z 系列工作站

使用惠普 Z 系列数据科学移动工作站和台式工作站,从要求严苛的数据集快速获得结果,妥善训练数据模型并实现数据可视化。

了解详情

强劲性能来自
英特尔® 至强®
和英特尔® 酷睿™ i9 处理器。

上一页 

下一页

了解产品

惠普 Z 系列移动工作站

了解详情

惠普 Z 系列台式工作站

了解详情

惠普 Z 系列显示器及配件

了解详情

VR

了解详情

有疑问?
联系销售支持。 

不知道该怎么选
Z 系列工作站?

申请回电

 需要 Z 系列工作站方面的支持?

前往支持页面

免责声明

    1. 惠普专项研究:《了解数据科学家》(Understanding Data Scientists),2021 年 11 月。
    2. 免责声明:Ken Jee、Louise Ferbach、Qishen Ha 和 Paras Varshney 都是惠普 Z 系列数据科学大使计划的成员,其所用产品由惠普提供。
    3. WSL 2 需要 Windows 10 或更高版本以及英特尔酷睿 i5 处理器或更高版本,并且仅适用于指定 Z 系列工作站。必须运行 Windows 10 21H2 或更高版本(版本编号 19044 及以上)或 Windows 11。

     

    产品的Logo及位置可能与图片有所差异,不影响产品性能和功能,请以实物为准。

     

    产品图片仅供参考,因不同国家可能存在稍许差异,实际产品以销售为准。

     

    本文所载信息如有变更,恕不另行通知。惠普产品与服务的完整保修条款见此类产品和服务附带的正式保修声明。本文中的任何信息均不构成额外的保修条款。惠普对本文包含的技术或编辑方面的错误或遗漏概不负责。

     

    英特尔、英特尔标志、酷睿和至强是英特尔公司或其子公司在美国和其他国家(地区)的商标或注册商标。Microsoft 和 Windows 是 Microsoft Corporation 在美国和/或其他国家(地区)的注册商标或商标。NVIDIA 和 Quadro 是 NVIDIA Corporation 在美国和其他国家(地区)的商标和/或注册商标。Linux® 是 Linus Torvalds 在美国和其他国家(地区)的注册商标。AMD 是 Advanced Micro Devices, Inc. 的商标。