AutoML破解深度学习寒冬论,夏粉教小白5分钟搞定机器学习建模

简介: 昨天,国内AutoML领域创业公司智铀科技发布了自动化机器学习产品“小智”,据公开数据显示,这是国内首款可私有部署的AutoML商用产品。新智元创始人杨静女士作为特邀嘉宾,在智铀科技产品发布会上对AI软硬件发展现状和趋势以及AutoML应用做了主题演讲。

“AI寒冬”论调不减,但AI软硬件能力增长却是不争的事实。

OpenAI发布的数据显示,自2012年以来,AI计算力每3.5个月增长一倍,六年间这个指标已经增长了30万倍以上。

同时,AMD也在上周展示了全球首款7纳米制程的GPU芯片原型,显示硬件能力依旧与摩尔定律赛跑。

在这样的大背景下,数据挖掘和自动化建模等企业级服务迎来了巨大的市场空间,AutoML的出现则让企业能迅速投入AI应用而不过度依赖数据科学家,同时也解决了传统企业AI人才匮乏、人力成本高、时间成本高等问题。

昨天,国内AutoML领域创业公司智铀科技发布了自动化机器学习产品“小智”,据公开数据显示,这是国内首款可私有部署的AutoML商用产品。新智元创始人杨静女士作为特邀嘉宾,在智铀科技产品发布会上对AI软硬件发展现状和趋势以及AutoML应用做了主题演讲。

AI算力6年增长30万倍,软硬件能力增长破除深度学习“寒冬论”

最近,计算机视觉专家 Filip Piekniewski 的《AI Winter is Well on its Way》文章刷屏,认为深度学习的热度已经大大下降,AI寒冬将至。

“深度学习是否有天花板?”杨静在《让机器学习更智能》演讲中问道。目前,包括人脸识别或者语音识别,准确率已经达到了98%、99%的水平,“那剩下的1%、2%的话,是不是说可改进的空间比较小了?”

a47f722e4577a0fc742f0e1edf8657387a4ab116

新智元创始人兼CEO杨静女士

UC伯克利大学教授马毅最近也发微博称,越来越多的证据表明,通过拟合数据得到的深度神经网络模型(在classification,detection,segmentation等)对输入很小的数值扰动和很小的变换deformation(甚至平移)都是不稳定的(unstable),更谈不上鲁棒。

所以目前基于深度学习的“人工智能”,用在不痛不痒的应用上,也就罢了。把这样的模型用在严肃的问题上(例如需要有安全、隐私、可靠性保障的),应该是十分危险的。

b63be36e2b16969fe0eecbb36cc0cc21438cde27

杨静认为,过去几年深度学习的确出现了一个爆发的情况,但是未来,特别是到2020年是否还会有这样的一个爆发的增长速度呢?所以质疑深度学习的言论就出来了。

不过,从学术界到产业界的努力都在让深度学习保持持续的爆发力。

OpenAI最近发布的一份关于AI计算能力增长趋势的分析报告显示,自2012年以来,AI训练中所使用的计算力每3.5个月增长一倍,自2012年以来,这个指标已经增长了30万倍以上,这远远超过摩尔定律的增长。这种突飞猛进的速度让深度学习以及机器学习充满着无限的可能,充满了爆发性的增速。

06794642cbfb309199f5e6e8e3a94487fa8b0255

硬件方面,AMD在上周展示了全球首款7纳米制程的GPU芯片原型,含有32GB的高带宽内存,专为人工智能和深度学习设计。杨静认为,AI相关的硬件有非常高速度的成长,因此说其实深度学习本身的发展速度的确是比摩尔定更快。

数据挖掘和自动化建模:企业级服务市场爆发机会

AI软硬件能力增长速度为企业级的数据挖掘和自动化建模等云服务带来了巨大的市场空间,亚马逊、微软、谷歌等公司在企业级云服务都有特别强大的机器学习方面的支撑。

IDC的分析指出,人工智能硬件、软件企业级市场规模供未来几年会有四五倍的提升,目前可以看到的是,在AI云市场上亚马逊现在占了40%多的份额,微软和Google紧随其后。

f043b66615006deda531cceea4a6d63524780b63

Google在AI云服务市场上异军突起,在于它在AI云服务方面提供了全新的软硬件一体化的解决方案。

这个方案包括TPU、TensorFlow和AutoML,这种三位一体的组合形成了谷歌在企业级云软硬件的巨大优势。

杨静指出,对于中国企业来讲,开源框架和AI芯片方面都很薄弱,但AutoML真正是一个空白和机会。“我们就像中国缺少芯片一样,我们也缺开源框架,也缺自动化机器学习的自己的算法,但我们在AutoML这方面,我觉得至少智铀科技是非常值得期待的一支黑马。”

与此同时,机器学习目前严重依赖数据科学家,并且面临人才匮乏、人力成本高、时间成本高等问题,企业对无监督或者自主的学习的需求日益旺盛。

清华大学计算机科学与技术系副教授朱军认为,这是机器学习研究人员让技术推向产业要解决的一个关键的问题。“Alpha Zero是一个比较正面的例子,像在环境规则有限、能够明确表达的时候,可以通过自主学习来增强它的能力。”

智铀发布国内首款AutoML商用产品,AI小白5分钟搞定机器学习建模

智铀科技在昨天发布了AutoML产品“小智”。

AutoML 的概念源自2012年学术界提出一个新观念——Programming by Optimization(PbO),字面上的意思是指以最优化程序开发,实质上就是要解决编程时人工调校参数的问题。

与谷歌Cloud AutoML专注于图像识别领域不同,智铀科技目前主要以结构化数据为主,致力于为企业带来全流程、自动化的建模和部署能力,开发了自动化机器学习产品“小智”帮助企业构建人工智能核心,实现AI驱动。

a25ac6198bc025d4e515b2ca3ac58e6694946393

智铀科技CEO夏粉博士毕业于中科院自动化所,拥有超过15年机器学习领域的研究和应用经验,曾在百度任资深科学家,负责百度超大规模机器学习团队。(新智元此前曾独家报道智铀科技融资情况

智铀科技是少数几个掌握AutoML的公司,有以下几方面技术优势:

d60327d7dbbe457d11a6fb2911123b160401f139


d47e62d2b349aca45e42305ed6714efbe5ed61d9数据处理。 独创重要性采样技术,选择1% 样本就能达到90%随机样本效果。
d47e62d2b349aca45e42305ed6714efbe5ed61d9参数学习。 独创参数搜索算法,解决人工调参费时耗力的问题。
d47e62d2b349aca45e42305ed6714efbe5ed61d9模型算法。

模型算法优化:千层模型算法,LR收敛速度提升60%;FGBDT算法比XGBoost既快又好;

大规模神经网络:支持千亿样本、迁移特征数据量,模型从千层到深层灵活支持,可建立万亿链接神经网络结构DNN。

d47e62d2b349aca45e42305ed6714efbe5ed61d9特征学习。 独创特征工程算法:组合特征挖掘效率提升上千倍,丰富的高阶特征提取方式;支持从无标签数据中提取有效特征。

此次智铀发布的产品“小智”,可以自动构建高精度模型,为用户提供从数据预处理、特征工程、模型调参、模型评估、模型预测到结果分析等一站式服务。

除了以独创的算法实现了自动建模,小智在产品的交互方面也贯彻着简单易用的原则,直观的web界面允许任何人和小智进行交互,不需要AI背景,用户也可以一键完成建模,内置的可视化效果,如ROC曲线图和准确&召回曲线,能够使用户对自己的业务有更深刻的理解。据夏粉介绍:“在通用场景下,普通业务人员借助小智也能达到高级建模人员水平。”


据悉,小智将以产品的形式提供给行业,除了支持公有云、SAAS模式外,还提供私有化部署。


原文发布时间为:2018-06-14

本文作者:克雷格

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:AutoML破解深度学习寒冬论,夏粉教小白5分钟搞定机器学习建模

相关文章
|
1月前
|
机器学习/深度学习 人工智能 安全
探索AI的未来:从机器学习到深度学习
【10月更文挑战第28天】本文将带你走进AI的世界,从机器学习的基本概念到深度学习的复杂应用,我们将一起探索AI的未来。你将了解到AI如何改变我们的生活,以及它在未来可能带来的影响。无论你是AI专家还是初学者,这篇文章都将为你提供新的视角和思考。让我们一起探索AI的奥秘,看看它将如何塑造我们的未来。
73 3
|
12天前
|
机器学习/深度学习 人工智能 算法
探索机器学习:从线性回归到深度学习
本文将带领读者从基础的线性回归模型开始,逐步深入到复杂的深度学习网络。我们将通过代码示例,展示如何实现这些算法,并解释其背后的数学原理。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的见解和知识。让我们一起踏上这段激动人心的旅程吧!
|
1天前
|
机器学习/深度学习 人工智能 算法
机器学习与深度学习:差异解析
机器学习与深度学习作为两大核心技术,各自拥有独特的魅力和应用价值。尽管它们紧密相连,但两者之间存在着显著的区别。本文将从定义、技术、数据需求、应用领域、模型复杂度以及计算资源等多个维度,对机器学习与深度学习进行深入对比,帮助您更好地理解它们之间的差异。
|
1月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
77 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
23天前
|
机器学习/深度学习 人工智能 TensorFlow
基于TensorFlow的深度学习模型训练与优化实战
基于TensorFlow的深度学习模型训练与优化实战
63 0
|
29天前
|
机器学习/深度学习 自然语言处理 语音技术
探索机器学习中的深度学习模型:原理与应用
探索机器学习中的深度学习模型:原理与应用
35 0
|
2月前
|
机器学习/深度学习 自然语言处理 算法
机器学习和深度学习之间的区别
机器学习和深度学习在实际应用中各有优势和局限性。机器学习适用于一些数据量较小、问题相对简单、对模型解释性要求较高的场景;而深度学习则在处理大规模、复杂的数据和任务时表现出色,但需要更多的计算资源和数据,并且模型的解释性较差。在实际应用中,需要根据具体的问题和需求,结合两者的优势,选择合适的方法来解决问题。
83 0
|
7月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
250 14
|
7月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
130 1
|
7月前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)