找不到完美数据科学家?你还可以组建一支数据科学梦之队

简介:



◆ ◆ 

导读


提供洞察和分析的公司都在尽力为自己组建完美的数据科学团队,这通常有两条路可以走。


大部分公司都在挣扎中选择了第一条路:寻找这些工资非常贵又很少见的独角兽人才,即同时具备这多种技能的独立个体。


完美的数据科学家完美地掌握了数学、统计学、编程以及沟通技术。这些人不光具备完成复杂工作的专业技术能力,还能够向非技术人员解释这些技术工作可能会带来的影响。


除了这些数据科学家会很昂贵的事实之外,这些天才科学家一周7天,每天24小时连轴工作也是不太可能的。


当然这不是唯一的一条路。




人类史上最早的科学家之一亚里士多德曾经说过:“整体大于它的各部分之和”,这给了我们一些启发。与其寻找这些很受欢迎的同时具备三方面技能的人,还不如挑选分别具备其中一项技能的人来组成一个团队。毕竟,没有一个人能够永远解决组织不断增长的对数据科学研究的需求。它需要一个数学家来负责深入钻研,还需要一个具备交叉学科知识的人来进行横向整合,最终组成一个完美的团队。


◆ ◆ 

数据科学团队的活力


任何一个数据科学团队的终极目标就是要成为一个解决问题的机器,一个能在不断变化的环境中不断搅动出价值的团队。越来越丰富的数据给曾经无法回答的业务问题提供了可能,这就给客户对洞察复杂性的期待提升到了一个新的高度。但随着这一套连锁反应而来的却是没有成熟方法论和解决方案的问题。随着输入越来越多样化,所需要的匹配的技能同样需要变得多样化。“酷呆瓜”团队的三个特点没有一个是可以缺失的,因此这个团队的集体智慧才真正是当今数据世界的驱动力。


显然,完美数据科学家团队中的任意两块都无法独立于第三块运作。而且,挖掘并保持数据科学家团队的内部平衡才能带来最大程度的准确性和相关性。


  • 数学家/统计学家

这些受过训练的学者在理解了相关理论以及结果所需要的条件后,基于这些输入构建起先进的模型。


  • 程序员

这位亲自操刀的架构师负责清洗、管理以及修整数据,以及建造模拟器或其他高科技工具来使数据变得更加方便易用。


  • 沟通者/内容专家

将技术翻译为业务的专家利用自己的全局观,基于过去的知识帮助寻找技术与用户需求的连接点。


这些技能的互相支持才使得团队变得完整,并具备完美的数据交付能力:


数学家/统计学家的工作严重依赖于程序员。“垃圾进入垃圾出去”的概念在这里非常适用,也就是说如果程序员没有清晰地获取数据、管理数据,那么科学家很难构建出有用的模型。此外,数学家和程序员又依赖于沟通者的知识。即便数据是完美的,也符合统计学结论,如果其无法直接涉及到要解决的商业问题,那么这些就是没有意义的。此外,内部不平衡的团队将会面临一些无法充实准备的困难,也无法交付出完美的作品。


◆ ◆ 

是购买还是自建?


今天的世界充满了大量、高速的数据,企业都面临着一个选择。传统那些写代码来编辑调查问卷、收集数据的程序员都被整合在了具备洞察的组织中。然而,他们中的很多人都没有接受过数学或统计学的正统培训。同样地,那些面向客户并具有数值定量头脑的商务人才在团队构建中也应当有一席之地。培训现有数学或统计学人才是可行的,但漫长的过程需要极强的耐心。如果组织认可且相信他们已有的人才并且选择这条路来组建团队,这也就指向了需要填补的空白从而打造完美团队。


组织机构很久之前就知道数据的价值了,但如果没有人的参与,无论数据量有多大,细节有多深,到2019年实现数据科学300亿美金的估值都是很难的。一个互相平衡的团队对各类数据作出的解读、过滤以及修正都会加速这种成长并提升数据科学的重要性。

许多人觉得Hilary的“酷呆瓜”概念只适用于个人。但实际上,我们必须认识到团队的集体“酷”也是充满潜力的。


当组织在组建和招聘数据科学团队时,或许团队宗旨可以简单的称为“如果你能找到呆瓜,那就留住他们。但如果缺少聚集了各类独角兽人才的团队,那就创造一个。”

 原文发布时间为:2016-12-02


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
4天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
10597 53
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
10天前
|
人工智能 JavaScript API
解放双手!OpenClaw Agent Browser全攻略(阿里云+本地部署+免费API+网页自动化场景落地)
“让AI聊聊天、写代码不难,难的是让它自己打开网页、填表单、查数据”——2026年,无数OpenClaw用户被这个痛点困扰。参考文章直击核心:当AI只能“纸上谈兵”,无法实际操控浏览器,就永远成不了真正的“数字员工”。而Agent Browser技能的出现,彻底打破了这一壁垒——它给OpenClaw装上“上网的手和眼睛”,让AI能像真人一样打开网页、点击按钮、填写表单、提取数据,24小时不间断完成网页自动化任务。
2422 5
|
24天前
|
人工智能 JavaScript Ubuntu
5分钟上手龙虾AI!OpenClaw部署(阿里云+本地)+ 免费多模型配置保姆级教程(MiniMax、Claude、阿里云百炼)
OpenClaw(昵称“龙虾AI”)作为2026年热门的开源个人AI助手,由PSPDFKit创始人Peter Steinberger开发,核心优势在于“真正执行任务”——不仅能聊天互动,还能自动处理邮件、管理日程、订机票、写代码等,且所有数据本地处理,隐私完全可控。它支持接入MiniMax、Claude、GPT等多类大模型,兼容微信、Telegram、飞书等主流聊天工具,搭配100+可扩展技能,成为兼顾实用性与隐私性的AI工具首选。
24075 122
|
4天前
|
人工智能 IDE API
2026年国内 Codex 安装教程和使用教程:GPT-5.4 完整指南
Codex已进化为AI编程智能体,不仅能补全代码,更能理解项目、自动重构、执行任务。本文详解国内安装、GPT-5.4接入、cc-switch中转配置及实战开发流程,助你从零掌握“描述需求→AI实现”的新一代工程范式。(239字)
2369 126

热门文章

最新文章