AutoML破解深度学习寒冬论,夏粉教小白5分钟搞定机器学习建模

简介: 昨天,国内AutoML领域创业公司智铀科技发布了自动化机器学习产品“小智”,据公开数据显示,这是国内首款可私有部署的AutoML商用产品。新智元创始人杨静女士作为特邀嘉宾,在智铀科技产品发布会上对AI软硬件发展现状和趋势以及AutoML应用做了主题演讲。

“AI寒冬”论调不减,但AI软硬件能力增长却是不争的事实。

OpenAI发布的数据显示,自2012年以来,AI计算力每3.5个月增长一倍,六年间这个指标已经增长了30万倍以上。

同时,AMD也在上周展示了全球首款7纳米制程的GPU芯片原型,显示硬件能力依旧与摩尔定律赛跑。

在这样的大背景下,数据挖掘和自动化建模等企业级服务迎来了巨大的市场空间,AutoML的出现则让企业能迅速投入AI应用而不过度依赖数据科学家,同时也解决了传统企业AI人才匮乏、人力成本高、时间成本高等问题。

昨天,国内AutoML领域创业公司智铀科技发布了自动化机器学习产品“小智”,据公开数据显示,这是国内首款可私有部署的AutoML商用产品。新智元创始人杨静女士作为特邀嘉宾,在智铀科技产品发布会上对AI软硬件发展现状和趋势以及AutoML应用做了主题演讲。

AI算力6年增长30万倍,软硬件能力增长破除深度学习“寒冬论”

最近,计算机视觉专家 Filip Piekniewski 的《AI Winter is Well on its Way》文章刷屏,认为深度学习的热度已经大大下降,AI寒冬将至。

“深度学习是否有天花板?”杨静在《让机器学习更智能》演讲中问道。目前,包括人脸识别或者语音识别,准确率已经达到了98%、99%的水平,“那剩下的1%、2%的话,是不是说可改进的空间比较小了?”

a47f722e4577a0fc742f0e1edf8657387a4ab116

新智元创始人兼CEO杨静女士

UC伯克利大学教授马毅最近也发微博称,越来越多的证据表明,通过拟合数据得到的深度神经网络模型(在classification,detection,segmentation等)对输入很小的数值扰动和很小的变换deformation(甚至平移)都是不稳定的(unstable),更谈不上鲁棒。

所以目前基于深度学习的“人工智能”,用在不痛不痒的应用上,也就罢了。把这样的模型用在严肃的问题上(例如需要有安全、隐私、可靠性保障的),应该是十分危险的。

b63be36e2b16969fe0eecbb36cc0cc21438cde27

杨静认为,过去几年深度学习的确出现了一个爆发的情况,但是未来,特别是到2020年是否还会有这样的一个爆发的增长速度呢?所以质疑深度学习的言论就出来了。

不过,从学术界到产业界的努力都在让深度学习保持持续的爆发力。

OpenAI最近发布的一份关于AI计算能力增长趋势的分析报告显示,自2012年以来,AI训练中所使用的计算力每3.5个月增长一倍,自2012年以来,这个指标已经增长了30万倍以上,这远远超过摩尔定律的增长。这种突飞猛进的速度让深度学习以及机器学习充满着无限的可能,充满了爆发性的增速。

06794642cbfb309199f5e6e8e3a94487fa8b0255

硬件方面,AMD在上周展示了全球首款7纳米制程的GPU芯片原型,含有32GB的高带宽内存,专为人工智能和深度学习设计。杨静认为,AI相关的硬件有非常高速度的成长,因此说其实深度学习本身的发展速度的确是比摩尔定更快。

数据挖掘和自动化建模:企业级服务市场爆发机会

AI软硬件能力增长速度为企业级的数据挖掘和自动化建模等云服务带来了巨大的市场空间,亚马逊、微软、谷歌等公司在企业级云服务都有特别强大的机器学习方面的支撑。

IDC的分析指出,人工智能硬件、软件企业级市场规模供未来几年会有四五倍的提升,目前可以看到的是,在AI云市场上亚马逊现在占了40%多的份额,微软和Google紧随其后。

f043b66615006deda531cceea4a6d63524780b63

Google在AI云服务市场上异军突起,在于它在AI云服务方面提供了全新的软硬件一体化的解决方案。

这个方案包括TPU、TensorFlow和AutoML,这种三位一体的组合形成了谷歌在企业级云软硬件的巨大优势。

杨静指出,对于中国企业来讲,开源框架和AI芯片方面都很薄弱,但AutoML真正是一个空白和机会。“我们就像中国缺少芯片一样,我们也缺开源框架,也缺自动化机器学习的自己的算法,但我们在AutoML这方面,我觉得至少智铀科技是非常值得期待的一支黑马。”

与此同时,机器学习目前严重依赖数据科学家,并且面临人才匮乏、人力成本高、时间成本高等问题,企业对无监督或者自主的学习的需求日益旺盛。

清华大学计算机科学与技术系副教授朱军认为,这是机器学习研究人员让技术推向产业要解决的一个关键的问题。“Alpha Zero是一个比较正面的例子,像在环境规则有限、能够明确表达的时候,可以通过自主学习来增强它的能力。”

智铀发布国内首款AutoML商用产品,AI小白5分钟搞定机器学习建模

智铀科技在昨天发布了AutoML产品“小智”。

AutoML 的概念源自2012年学术界提出一个新观念——Programming by Optimization(PbO),字面上的意思是指以最优化程序开发,实质上就是要解决编程时人工调校参数的问题。

与谷歌Cloud AutoML专注于图像识别领域不同,智铀科技目前主要以结构化数据为主,致力于为企业带来全流程、自动化的建模和部署能力,开发了自动化机器学习产品“小智”帮助企业构建人工智能核心,实现AI驱动。

a25ac6198bc025d4e515b2ca3ac58e6694946393

智铀科技CEO夏粉博士毕业于中科院自动化所,拥有超过15年机器学习领域的研究和应用经验,曾在百度任资深科学家,负责百度超大规模机器学习团队。(新智元此前曾独家报道智铀科技融资情况

智铀科技是少数几个掌握AutoML的公司,有以下几方面技术优势:

d60327d7dbbe457d11a6fb2911123b160401f139


d47e62d2b349aca45e42305ed6714efbe5ed61d9数据处理。 独创重要性采样技术,选择1% 样本就能达到90%随机样本效果。
d47e62d2b349aca45e42305ed6714efbe5ed61d9参数学习。 独创参数搜索算法,解决人工调参费时耗力的问题。
d47e62d2b349aca45e42305ed6714efbe5ed61d9模型算法。

模型算法优化:千层模型算法,LR收敛速度提升60%;FGBDT算法比XGBoost既快又好;

大规模神经网络:支持千亿样本、迁移特征数据量,模型从千层到深层灵活支持,可建立万亿链接神经网络结构DNN。

d47e62d2b349aca45e42305ed6714efbe5ed61d9特征学习。 独创特征工程算法:组合特征挖掘效率提升上千倍,丰富的高阶特征提取方式;支持从无标签数据中提取有效特征。

此次智铀发布的产品“小智”,可以自动构建高精度模型,为用户提供从数据预处理、特征工程、模型调参、模型评估、模型预测到结果分析等一站式服务。

除了以独创的算法实现了自动建模,小智在产品的交互方面也贯彻着简单易用的原则,直观的web界面允许任何人和小智进行交互,不需要AI背景,用户也可以一键完成建模,内置的可视化效果,如ROC曲线图和准确&召回曲线,能够使用户对自己的业务有更深刻的理解。据夏粉介绍:“在通用场景下,普通业务人员借助小智也能达到高级建模人员水平。”


据悉,小智将以产品的形式提供给行业,除了支持公有云、SAAS模式外,还提供私有化部署。


原文发布时间为:2018-06-14

本文作者:克雷格

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:AutoML破解深度学习寒冬论,夏粉教小白5分钟搞定机器学习建模

相关文章
|
1月前
|
机器学习/深度学习 存储 算法
深度学习500问——Chapter02:机器学习基础(4)
深度学习500问——Chapter02:机器学习基础(4)
34 0
|
9天前
|
机器学习/深度学习 运维 监控
TensorFlow分布式训练:加速深度学习模型训练
【4月更文挑战第17天】TensorFlow分布式训练加速深度学习模型训练,通过数据并行和模型并行利用多机器资源,减少训练时间。优化策略包括配置计算资源、优化数据划分和减少通信开销。实际应用需关注调试监控、系统稳定性和容错性,以应对分布式训练挑战。
|
10天前
|
机器学习/深度学习 人工智能 分布式计算
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
R和Python机器学习:广义线性回归glm,样条glm,梯度增强,随机森林和深度学习模型分析
15 0
|
13天前
|
机器学习/深度学习 自然语言处理 算法
探索深度学习中的序列建模新范式:Mamba模型的突破与挑战
【4月更文挑战第13天】Mamba模型,一种新型序列建模架构,通过选择性状态空间提高处理长序列数据的效率,实现线性时间复杂度。在语言、音频和DNA序列建模中展现优秀性能,尤其在大规模预训练中超越Transformer。然而,面对连续信号数据时可能不及LTI模型,且模型参数优化及硬件实现具有挑战性。
46 6
探索深度学习中的序列建模新范式:Mamba模型的突破与挑战
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
|
1月前
|
机器学习/深度学习 运维 算法
深度学习500问——Chapter02:机器学习基础(5)
深度学习500问——Chapter02:机器学习基础(5)
38 0
|
1月前
|
机器学习/深度学习 算法 数据可视化
深度学习500问——Chapter02:机器学习基础(3)
深度学习500问——Chapter02:机器学习基础(3)
47 0
|
1月前
|
机器学习/深度学习 算法 搜索推荐
深度学习500问——Chapter02:机器学习基础(2)
深度学习500问——Chapter02:机器学习基础(2)
47 0
|
3天前
|
机器学习/深度学习 存储 边缘计算
深度学习在图像识别中的应用与挑战
【4月更文挑战第23天】 随着人工智能技术的飞速发展,深度学习作为其重要分支之一,在图像识别领域取得了显著的成果。本文将探讨深度学习在图像识别中的应用,分析其优势和面临的挑战,并展望未来的发展趋势。
|
1天前
|
机器学习/深度学习 运维 监控
深度学习在图像识别中的应用与挑战
【4月更文挑战第25天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域进步的核心动力。本文旨在探讨深度学习技术在图像识别任务中的创新应用及其面临的主要挑战。我们将首先回顾深度学习的基本原理和关键技术,随后通过实际案例分析其在图像分类、目标检测及语义分割等方面的应用效果。最后,文中将讨论当前技术瓶颈,如数据不平衡、模型泛化能力以及计算资源限制等,并提出可能的解决方案。