【独家】前百度资深科学家夏粉创业研发中国版Auto ML,两轮融资估值4亿

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 创建先进的机器学习模型既需要专业的技术人员,也非常耗时耗力,是企业在应用机器学习中的一大痛点。现在包括谷歌、Facebook在内的国际前沿企业都在探索让机器自主学习的路径。值得注意的是,中国一家成立仅半年的公司——智铀科技研发出全自动机器学习平台“EBRAIN”,让非专业人员也能够自如的使用机器学习。

昨天,谷歌正式开放免费的机器学习速成课,适用于各级别的开发者和研究者,让无数人欢呼。

原因在于,全世界只有极少数专家能创建先进的机器学习模型,企业拥有适应人工智能和机器学习高速发展所需的人才和资金预算也有限,因此谷歌的机器学习速成课一经推出便广受欢迎

实际上,现在世界上有很多前沿公司看到了这一痛点,包括谷歌、Facebook在内,都在探索让机器自主学习的路径——Auto ML。

值得注意的是,中国一家初创公司——智铀科技一直致力于Auto ML,并研发出全自动机器学习平台“EBRAIN”,不但能提升数据科学家的生产力,而且有助于让非专业人员也能够自如的使用机器学习平台,最终实现工作效益的最大化。

bae8c088829b20f142c6a31d16ea2fdb3bfd3ff8

新智元获悉,近日,成立仅半年的智铀科技宣布完成两轮融资,公司估值达到4亿。

创始人为前百度资深科学家,公司创立半年估值4亿

智铀科技的创始人兼CEO夏粉博士曾在百度任资深科学家,主要负责百度超大规模机器学习CTR团队,至今已投身于机器学习领域的研究和应用十五年以上,并在机器学习顶级会议杂志JMLR,ICML, NIPS等发表多篇文章。

0d92a741230536b249e89431102e6b71d09d2473

智铀科技创始人兼CEO夏粉

在百度期间,夏粉曾推出业界第一个基于万亿规模的深度学习网络的商用在线学习系统以及全自动机器学习平台Pulsar。Pulsar被公司各业务线广泛使用,平台覆盖公司绝大部分业务线,包括凤巢、网盟、金融和糯米等,并受到一致好评。

智铀科技成立于2017年6月,2017年8月曾获天使轮投资,本次获得的pre-A轮融资由洪泰基金领投,投后估值达4亿人民币。

智铀科技的核心成员均为来自百度、阿里巴巴、新浪等知名互联网公司,均在机器学习领域深入研究十年以上,掌握最先进的大规模机器学习技术,并拥有丰富的项目经验。

夏粉说,智铀助力企业在数据分析与预测中实现多(处理的数据多、容纳的参数多),快(自动化快速建模、部署),好(模型精度达到世界领先水平),省(节省人工,更专注于业务本身),通过高效的大规模分布式机器学习训练框架,实现自动调参、自动特征学习,降低人工智能的开发使用门槛。

自主研发Auto ML:组合特征挖掘效率提升上千倍

从理论上来说,自动机器学习(Auto ML)需要在问题、特征和数据抽取、数据、特征预处理、模型算法选择、超参数调优一个完整的循环过程中全部自动化。

问题、特征和数据抽取需要专业知识,也需要人为判断,通常需要业务人员完成。在这方面,谷歌用深度学习网络解决图像问题自动化上迈出了重要一步。

谷歌的Auto ML算法主要基于强化学习算法(reinforcementlearning algorithms)具体如下:

一种控制器神经网络能够提议一个“子”模型架构,然后针对特定任务进行训练与质量评估;而反馈给控制器的信息则会被用来改进下一轮的提议。重复这个过程数千次——从而生成新的架构,然后经过测试和反馈,让控制器进行学习。最终,控制器将学会为好的架构分配高的概率,以便在延续的验证数据集上实现更高的准确性,并且对于架构空间的差异很小。看起来就像下图:

e485402ee25f840b1249c34a5f5e5a60825330ad

谷歌于去年5月发布了Auto ML,让AI去训练AI。这款系统不但能让没有专业知识的人创建机器学习模型,还将创建机器学习模型中所有艰苦麻烦的工作,包括训练和调试,都承接了过来。

与谷歌相比,智铀科技开发的全自动机器学习平台“EBRAIN”具备第四代机器学习能力,有以下几个主要优势:

7f154d05ff418a17646f76b46bed48dfd57bf3ca

  • 数据量:千亿样本、千亿特征
  • 模型:从浅层到深层灵活支持
  • DNN:万亿链接神经网络结构
  • 调研:自动化特征学习&参数 调节
  • 时效性:模型在线更新
  • 评估:可视化模型&数据分析 

在数据处理上,EBRAIN采用重要性采样,选择1%样本就能达到90%随机样本效果;并使用特征删减算法,达到效果无损、特征删减97%;通过样本过滤算法,过滤能够随机噪音 。

在参数学习中,首创参数搜索算法:解决人工无法调参 (近百超参数的调整)的问题,自动机器学习仅需约24小时。

在特征学习中,采用组合特征学习算法:组合特征挖掘效率提升上千倍;利用半监督特征学习:从无标签数据中提取有效特征。

在模型算法中,浅层模型算法,LR收敛速度提升60%;Gbdt算法:比Xgboost既快又好。深层模型中使用首个万亿参数大规模离散DNN。

EBRAIN:支持私有化部署与SaaS服务,实现企业智能变革

今年初,谷歌又推出Cloud Auto ML,这个动作意义重大。它意味着企业直接用AI训练AI,甚至不用机器学习和数据专家,并且能在云上完成,这对谷歌本身与客户来说都非常重要。

一方面,谷歌利用Auto ML能够为企业解决机器学习的的痛点;另一方面,在Cloud上实现这一技能又能够扩展谷歌云,这代表了云计算公司的发展方向。目前,除了谷歌外,Facebook的工程师们也已经开发了称为“自动化机器学习工程师”的工具,它的名字也叫AutoML,能够就最有可能解决问题的算法和参数做出选择。

智铀科技创始人兼CEO夏粉也看到了这个趋势。他说,以“EBRAIN”机器学习建模平台为代表的平台级商用软件,支持私有化部署与SaaS服务,为客户实现智能变革建立基础。

以内容推荐应用为例,医药公司会通过微信、邮件等方式为医生推送一些内容(即文章), 推送后医生会对文章有阅读或点赞行为。现在需要根据医生的特征和历史阅读、点赞记录预测其感兴趣的内容,从而进行内容的精准推荐。

常规的做法是:对医生和文本提取大量特征,进行特征选择和变换,选择合适算法和对应的超参数,训练模型。通过在验证集上效果,挑选最优的特征、算法和超参数。所有的选择过程由人工完成,耗费大量人力和计算资源。

对此,智铀在文本结构化处理的基础上,利用云计算提供的大量计算能力,通过Ebrain在很短的时间内自动构建客户兴趣模型,并提供内容推荐核心服务能力。最终,根据医生的兴趣进行信息推荐,按照行业标准预估客户内容访问量提升50%以上。

目前智铀科技已经与金融、医疗、物联网等多个行业的公司进行合作为其提供服务,目前产品的功能应用涵盖点击率预估、反欺诈侦测、市场精准营销以及个性化推荐等,满足不同场景的不同需求,同时产品的有效性经过实践验证,不但能够为企业带来收入的增长并且节省成本。


原文发布时间为:2018-03-2

本文作者:张乾

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:【独家】前百度资深科学家夏粉创业研发中国版Auto ML,两轮融资估值4亿

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
8月前
|
机器学习/深度学习 人工智能 安全
中国信通院联合金橙果科技等十七家单位发起人工智能大模型安全基准测试
2024年2月20日下午,AIIA“SafetyAI Bench”(人工智能大模型安全基准测试)线上研讨会成功举办。来自中国信息通信研究院(以下简称“中国信通院”)、厦门大学、北京大学、北京交通大学、360、百度、蚂蚁集团、VIVO、西门​子、小鹏汽车、马上消费、浪潮科技、海信视像、交通银行、商汤科技、邮储银行、普华永道、科大讯飞、金橙果科技、万商天勤律所、中兴通讯、博特智能、开源网安、云天励飞等单位40余位科研机构专家及企业代表参加了本次会议。
|
机器学习/深度学习 人工智能 并行计算
算力中国年度突破成果出炉,PAI灵骏智算上榜!
近日,由工业和信息化部、宁夏回族自治区人民政府共同举办的2023中国算力大会在银川举行。会上公布了算力领域最具影响力专家学者共同评选出的算力中国·年度突破成果,阿里云“PAI灵骏智算服务”作为国内AI智算基础设施代表获得该重磅奖项。
|
机器学习/深度学习 人工智能 算法
智融集团获4.66亿C轮融资 李开复:人工智能在金融领域的现实案例
凭借着技术立身的坚守、对金融革新的进一步剖析,智融集团最终能像李开复先生说的那样,在自身获得长足发展的同时,也能在行业层面成为AI技术整体进步、金融科技深化发展的推动力量。
367 0
智融集团获4.66亿C轮融资 李开复:人工智能在金融领域的现实案例
|
人工智能 算法 搜索推荐
AI创业公司融资新记录,三大国有银行共同投资第四范式
2018年1月26日,第四范式宣布获得来自中国工商银行、中国银行、中国建设银行等三家国有银行及所属基金的联合战略投资。第四范式成为继“中国银联”后,三大国有银行联合投资的唯一公司,显示出领先金融机构对第四范式产品实力与发展潜力的高度认可。
175 0
AI创业公司融资新记录,三大国有银行共同投资第四范式
|
存储 Oracle Cloud Native
深度 | 凌晨4点,一场顶尖科技巨头的硬战
以下文章来源于深响 ,作者刘亚澜
5605 0
深度 | 凌晨4点,一场顶尖科技巨头的硬战
|
机器学习/深度学习 人工智能 搜索推荐
AI教育公司北极星获数千万Pre-A 轮融资,估值2.5亿元
雷锋网消息,近日,人工智能教育科技公司北极星(Polestar Ai)完成数千万Pre-A 轮融资,估值为2.5亿元。据天眼查显示,本轮融资由西电天朗创投和聚卓
355 0
重磅!2018硬科技行业投资机构30强榜单
感谢他们在过去一年对产业的支持与推动!
658 0
格力电器参与闻泰科技收购半导体,推进500亿“造芯”计划
继成立独立芯片设计公司后,格力电器已经走出了下一步。
584 0
|
人工智能 达摩院 云栖大会
【云栖大会】阿里巴巴成立“达摩院” 引入顶尖科学家3年研发投入将超千亿
今年3月,马云在公司首届技术大会上动员全球两万多名科学家和工程师投身“新技术战略”,启动了“NASA”计划,要面向未来20年组建强大的独立研发部门,建立新的机制体制,为服务20亿人的新经济体储备核心科技。
13185 0
都是第一,3143亿背后科技公司贡献了多少?
科技才是消费发展的最大驱动力!
335 0