数据科学的现在与未来

简介: 数据科学是截至近年来技术领域中最具热度的方向之一。如果您拥有数据科学或者相关专业的工作经验及学位,那么只要大笔一挥、简历一发,一份薪酬可观的职位就会应手而得。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

至顶网CIO与CTO频道 06月18日 编译:数据科学是截至近年来技术领域中最具热度的方向之一。如果您拥有数据科学或者相关专业的工作经验及学位,那么只要大笔一挥、简历一发,一份薪酬可观的职位就会应手而得。但是,数据科学家能成为AI领域的长青树吗?或者说,几年之后围绕数据科学出现的这股热流终将消退?

liyQiHrZsvQzE_600

Anthony Scriffignano, Dun & Bradstreet公司高级副总裁兼首席数据科学家

在日前的AI播客中,Dun & Bradstreet公司高级副总裁兼首席数据科学家Anthony Scriffignano分享了自己作为数据科学从业者的工作状态,以及人工智能如何改变金融行业的前景、经历与见解。

数据科学的当前定位

在Dun & Bradstreet公司,Scriffgnano主要负责技术创新与开发工作,同时也管理着“世界上规模最大的同类商业数据库”项目。Scriffignano解释道,这套前所未有的数据库持续从全球各个国家(除朝鲜与古巴之外)收集大量数据,日均摄取达数百万次。

这套数据库融合了每一种语言与写入系统,而且由七套不同的集成化数据库共同组成。这一综合性数据系统在跟踪企业数据的同时,亦会对总体风险及发展机遇做出全球性观察分析。以此为基础,该数据库得以实现大规模数据分析,进而检测供应链异常以及客户购买行为中发生的变化。毫无疑问,要从如此庞大的信息库当中提取价值,数据科学将成为我们不可或缺的关键武器。

对于像Dun & Bradstreet这样的组织来说,最大的挑战之一在于如何寻找经验丰富的数据科学家,保证这些既拥有从业背景、又颇具实践经验的人才处理如此巨大的研究数据集。遗憾的是,目前的人才市场还无法满足他们对于数据科学技能的需求。

Scriffignano表示,他相信AI技术正在快速发展,并必将在未来逐渐取代熟练的数据科学家,进而实现技术本身的普遍化与大众化。在Scriffignano看来,成为一名成熟数据科学家所需要的技能,在范围与深度方面都要远远超过机器学习模型开发者。从本质上讲,真正的数据科学家需要专注于立足更广泛的问题从数据中提取价值;相比之下,目前很多自称数据科学家的从业者实际上更像是机器学习工程师,也更多关注机器学习模型开发方面的工作。

Scriffignano认为,我们需要更多关注数据科学家概念中的“科学家”部分。在他看来,数据科学家必须有能力从观察到的数据中提出新的问题或者理论,对这一理论进行实验设计与具体测试,而后得出结论并分享相关结果。Scriffignano注意到,大多数组织只要求数据科学家给出可重复使用的模型,他强调只有将数据科学家视为改进与创新工作中的关键,才能帮助组织迈向成功。他还指出,正是由于不愿放权让数据科学家们接触单纯模型开发之外的新领域,才导致众多组织长期无法真正在数据科学与AI技术领域取得进展。

挑战:治理与伦理

除了从大数据集中获取价值的问题之外,Scriffignano认为,人工智能与数据科学还面临着来自治理与伦理层面的诸多挑战。这一点在涉及个人信息时体现得尤其明显。在建立大型数据库并使用私人信息建立智能模型时,我们该如何保证以负责任的方式使用这些私人信息?

目前世界各国之所以开始以愈发严格的态度审查机器学习模型,一部分原因就是这类模型往往涉及大量隐私性与安全性因素。无论模型关注哪些具体特征,隐私与安全都已经成为无法回避的现实问题。Scriffignano提出一个有趣的观点,认为AI法规终将陷入为了满足需求而努力迎合所有人、又为了迎合所有人而产生更多需求的怪圈或者说泥潭。人们希望进一步提升模型的自定义空间与开发开放式,但又不愿意在隐私权方面做出妥协。

一部分企业与个人将从使用大量数据的模型当中受益,这些模型需要庞大的数据基础以做出更精确的预测,但这同时也将以获取大量私人信息为代价。有些人可能不希望自己的数据被囊括在这些模型当中,而这又反过来导致模型的精度有所下降。结果就是,面对机器学习模型的发展与所需数据量的扩展,总会有人对现状感到不满。

Scriffignano坚信,政府监管机构如果希望在保障国家安全的同时回避与隐私相关的问题,那么最好的办法是对技术发展抱有开放的态度。在世界上的不同地区,法律与法规的制定与细则总会存在很大差异,不同司法管辖区间对于道德伦理的认识同样可能不太一致。这种现象目前已经体现得相当明确:欧洲在道德伦理方面约束得最为严格,中国对隐私保护的关注度不高,而美国则处于二者之间。某些国家更希望强调隐私保护,而另一些国家则更重视国家安全或者经济发展。

正如Scriffignano所提到,其中的核心问题是,机器学习本身并不存在地理界限。在某个区域内完全不可接受的实践,在另一个地区则可能并无不妥。因此,模型的构建位置与使用位置也可以据此有所区分。毕竟模型的传播往往很难控制,所以这种低隐私要求区域生产、高隐私要求区域消费的作法很可能成为未来的通行方案。

在本次播客节目中,Scriffignano还表达了自己对于拟人化AI的厌恶之情。他更愿意选择较为务实的思路,这不禁让我们想起由算法与流程驱动的目前这波AI技术变革。Scriffignano以人工通用智能(AGI)为例,提出了自己的具体观点。他认为,如果我们无法以所掌握的大量数据为基础提出正确的问题,那么人工智能的真正突破永远无法到来。

他还预见出一种未来,认为专业人士将与AI携手并进。只要我们保持警惕,就不必担心彻底被机器或者机器人所取代。为了实现这样的美好未来,我们当然需要保持审慎的心态并高度重视数据伦理与治理问题。只有这样,AI才能真正成为通往全新时代的桥梁。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-06-18
本文作者:Forbes
本文来自:“至顶网”,了解相关信息可以关注“至顶网

相关文章
|
存储 Dragonfly 缓存
Dragonfly 基于 P2P 的文件和镜像分发系统
业界软件生态在优化 HTTPS 的性能上也做了诸多探索,传统的软件优化方案在软件层面的优化无法满足流量日益增长的速度,CPU 硬件加速成为业界一个通用的解决方案。
Dragonfly 基于 P2P 的文件和镜像分发系统
|
Dragonfly 缓存 安全
深度解读阿里巴巴云原生镜像分发系统 Dragonfly
Dragonfly 是一个由阿里巴巴开源的云原生镜像分发系统,主要解决以 Kubernetes 为核心的分布式应用编排系统的镜像分发难题。随着企业数字化大潮的席卷,行业应用纷纷朝微服务架构演进,并通过云化平台优化业务管理。
3082 0
|
5天前
|
人工智能 自然语言处理 JavaScript
2026年Windows+Ollama本地部署OpenClaw保姆级教程:本地AI Agent+阿里云上快速搭建
2026年OpenClaw凭借本地部署、私有化运行的特性,成为打造个人智能体的核心工具,而Ollama作为轻量级本地大模型管理工具,能让OpenClaw摆脱对云端大模型的依赖,实现**本地推理、数据不泄露、全流程私有化**的智能体验。本文基于Windows 11系统,从硬件环境准备、Ollama安装与模型定制、OpenClaw部署配置、技能扩展到常见问题排查,打造保姆级本地部署教程,同时补充阿里云OpenClaw(Clawdbot)快速部署步骤,兼顾本地私有化需求与云端7×24小时运行需求,文中所有代码命令均可直接复制执行,确保零基础用户也能快速搭建属于自己的本地智能体。
6801 46
|
2天前
|
人工智能 安全 API
CoPaw:3分钟部署你的 AI助理
源自阿里巴巴开源生态的个人 AI 助理——CoPaw。作为阿里倾力打造的开源力作,CoPaw 完美打通钉钉、飞书、Discord 等多平台对话通道,支持定时任务自动化。内置 PDF/Office 深度处理、新闻摘要等强大技能,更开放自定义扩展接口。坚持数据全程私有化部署,绝不上传云端,让每一位用户都能在大厂技术加持下,拥有安全、专属的智能助手。
|
6天前
|
人工智能 JSON JavaScript
手把手教你用 OpenClaw + 飞书,打造专属 AI 机器人
手把手教你用 OpenClaw(v2026.2.22-2)+ 飞书,10分钟零代码搭建专属AI机器人!内置飞书插件,无需额外安装;支持Claude等主流模型,命令行一键配置。告别复杂开发,像聊同事一样自然对话。
3195 9
手把手教你用 OpenClaw + 飞书,打造专属 AI 机器人
|
4天前
|
人工智能 自然语言处理 机器人
保姆级教程:Mac本地搭建OpenClaw及阿里云上1分钟部署OpenClaw+飞书集成实战指南
OpenClaw(曾用名Clawdbot、Moltbot)作为2026年最热门的开源个人AI助手平台,以“自然语言驱动自动化”为核心,支持对接飞书、Telegram等主流通讯工具,可替代人工完成文件操作、日历管理、邮件处理等重复性工作。其模块化架构适配多系统环境,既可以在Mac上本地化部署打造私人助手,也能通过阿里云实现7×24小时稳定运行,完美兼顾隐私性与便捷性。
2610 4
|
12天前
|
存储 人工智能 负载均衡
阿里云OpenClaw多Agent实战宝典:从极速部署到AI团队搭建,一个人=一支高效军团
在AI自动化时代,单一Agent的“全能模式”早已无法满足复杂任务需求——记忆臃肿导致响应迟缓、上下文污染引发逻辑冲突、无关信息加载造成Token浪费,这些痛点让OpenClaw的潜力大打折扣。而多Agent架构的出现,彻底改变了这一现状:通过“单Gateway+多分身”模式,让一个Bot在不同场景下切换独立“大脑”,如同组建一支分工明确的AI团队,实现创意、写作、编码、数据分析等任务的高效协同。
5272 31
|
4天前
|
人工智能 数据可视化 安全
Claude Code小白邪修指南:一键安装+语音增效,附阿里云极速部署OpenClaw/Clawdbot攻略
对于AI工具新手而言,Claude Code的原生安装流程繁琐、终端操作门槛高,让不少人望而却步。但2026年的今天,“邪修”玩法彻底打破这一壁垒——通过开源工具实现一键部署,用语音交互提升3-4倍效率,再搭配阿里云OpenClaw的稳定运行环境,让小白也能快速上手AI编程助手。本文将详解“邪修”核心技巧、语音增效方案,以及阿里云OpenClaw部署步骤,附带完整配置代码与避坑指南,帮助你轻松开启AI辅助工作新模式。
1725 0

热门文章

最新文章