微软打算带着R语言搞仕途?

本文涉及的产品
RDS SQL Server Serverless,2-4RCU 50GB 3个月
推荐场景:
云数据库 RDS SQL Server,基础系列 2核4GB
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

自打微软喊出开源口号的那一天,就一改往日的傲娇,除了自己参与开源还收购了一些开源公司,最有趣的当属收购Revolution Analytics,Revolution Analytics是R语言的开发公司,Revolution Analytics能够提供企业级基于R语言的数据解决方案,可以覆盖大量的数据库和Hadoop系统,同时Revolution Analytics也持续在ParallelR, RHadoop等方面支持R语言开源社区。

微软打算带着R语言搞仕途?

被微软收购之后,重新上路的R Server已经成为内部部署和云数据之间的桥梁。微软公司还宣布了一系列R语言工具的更新。R语言已经成为其数据战略的重要组成部分,在Azure和SQL Server中均提供了支持(这就是要搞仕途啊!)。更重要的是,在Azure机器学习服务中,在数据提交到机器学习管道之前,R语言用于预处理数据。可见,R俨然成为微软关键的跨平台产品之一。

R在微软的生态系统中无处不在

开源的R已经成为数据科学的关键工具(根据IEEE,它目前在所有语言中排名第五),这其中统计学专家对R格外青睐有加,因为Comprehensive R Archive Network(CRAN,一个R语言应用程序的公共库)现在有超过9,000个统计模块和算法可以使用。

微软对R的愿景是打破台式机,本地服务器和云之间的界限。在本地,有一个免费的R语言客户端,以及微软(付费)旗舰版Visual Studio开发环境中的R支持。在内部,R Server可以在Windows和Linux上同时运行。在SQL Server内部,可以访问统计分析工具以及数据,同时支持基于Hadoop和Spark的本地大数据服务。在Azure上,可以和Microsoft的HDInsight服务一起运行R Server。

R是数据科学家的工具。虽然R语言相对简单,但需要对统计分析有深入的了解才能从中获得最大利益。因为许多基本概念需要对复杂统计函数进行研究层面的理解。问题不在于能否编写R代码,而在于它是否能理解你的思想。

所有使用大数据的企业面临的最大问题是:如何获取所需的技能并生成正确的分析结果。更重要的是,可以对分析结果有一个直观的解释,R语言内置的图形工具是可视化分析的关键工具。

Microsoft R Server出道

Microsoft R Server是一款基于R的企业级大数据分析平台,支持各种大数据统计分析,预测性建模和机器学习功能。它是一个十分有用的工具,可以快速尝试新的分析算法和探索使用数据回答问题。这种方法适合作为整个分析生命周期的一部分,从数据准备开始,然后是模型开发,最后将模型转换为可构建到业务应用程序中的工具。

机器学习同样有R

R也是基于GPU的机器学习工具。R可用于帮助训练模型,Microsoft将自己的机器学习算法与最新的R Server版本捆绑在一起,因此你可以在模型上传到本地大数据实例或云之前进行测试。在最近的一次新闻发布会上,Microsoft在天文图像上演示了这种方法,在具有星系库的本地服务器上训练基于机器学习的分类器,然后在云托管的GPU上运行结果模型。

微软打算带着R语言搞仕途?

R是一种非常便携的语言,可设计用于处理离散的数据样本。这使它可扩展和解决数据并行问题。相同的R模型可以在多个服务器上运行,可以快速处理大量数据。你需要做的就是适当分割数据,然后将其传递到各种R服务器实例。类似地,相同的代码可以以不同的实现方式运行,因此针对本地数据源构建和测试的模型可以部署在SQL Server数据库内并针对Hadoop数据湖运行。

R使数据模型操作更容易

R非常容易实现,数据科学团队构建需要的模型,开发人员编写应用程序并构建可利用其代码的基础架构就可以了。一旦准备就绪,该模型可以快速部署,应用过程中也可以及时更换模型,而不影响应用程序的其余部分。总之,R允许你以相同的方式,相同的模型在不同的应用中使用相同的数据。

通用模型可以对数据主动响应,例如,当模型预测到航班延迟时,可向航空公司乘客提供延迟和重新预订信息。该模型在获得更多数据之后可以进行细化,从而降低风险。

将R支持构建到SQL Server中有很大意义。随着Microsoft的数据库平台成为内部部署和云数据以及大数据工具系统之间的桥梁,在数据库中使用细粒度的分析工具是一个明智的决定。数据库开发人员可以与数据分析团队一起实施这些模型,而不需要学习任何新技能来将其构建到应用程序中。

微软意识到,不是每个企业都需要或有预算来雇佣数据科学家。如果你正在处理常见的分析问题,例如尝试预测客户流失或检测在线商店中的欺诈行为,你可以选择包含即用模型的SQL Server R服务中的一系列预定义模板。从Microsoft的MSDN可以获得,它们可以在任何R兼容的IDE中自定义,并且可以使用PowerShell脚本部署。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6月前
|
数据采集 算法 Java
业余爱好者想入门编程,一定远离那些只会说No的家伙,尤其程序员
业余爱好者想入门编程,一定远离那些只会说No的家伙,尤其程序员
63 2
|
C++ UED Python
微软再出神器,这次终于对Python下手了!
微软又出良心工具了! 微软于7月1日发布一款新的VS Code插件,名为Pylance,这个名称是向Monty Python的Lancelot致敬。
微软再出神器,这次终于对Python下手了!
|
Java
磊哥工作十几年了,竟没有用过do-while!(文末送书)
磊哥工作十几年了,竟没有用过do-while!(文末送书)
175 0
磊哥工作十几年了,竟没有用过do-while!(文末送书)
微软资深软件工程师:阅读代码真的很难
导读:原文作者Eric Lippert是一名资深软件设计工程师,从1996年起一直在微软开发部门任职,协助设计并实现VBScript、JScript、JScript .NET、Windows Script Host、Visual Studio Tools for Office和C#。
1163 0
|
C# 数据安全/隐私保护 内存技术
|
安全 Linux 数据安全/隐私保护