2017谷歌火力全开:瞄准机器学习与数据分析

简介:

2016年,Google将赌注的筹码放在了机器学习和数据分析上,以此来区分它的云平台,从而在企业客户中产生重大影响力。

2016年,Google消除了其在云承诺上所有持续问题,因为其战略在未来几年将成为企业市场的主要参与者。

该公司花了数百亿美元,为Google Cloud Platform(GCP)建立基础设施、服务和人才库。因此,它不再强调价格是主要的区分因素,而是侧重于企业需求、数据分析和一套用于推动应用的技术。Google 表示未来主导将这一行业。

机器学习对于许多IT企业来说仍然太新,但Google已经把它作为云计算的未来。2016年,它增加的新服务包括用于服务和新版翻译的机器智能套件、文本分析,以及图像和语音识别。

TensorFlow 是2015年的一个开源机器学习框架,且获得了Tensor处理单元的大力支持。针对TensorFlow量身定制的专用集成电路已经在Google内部使用一年多了,并且承诺每瓦更好 的性能。2017年,Google计划为其机器学习和Google Compute Engine客户添加GPU。

Kubernetes是Google内部编排工具的开源版本,巩固了其在过去一年中作为容器主要技术的地位。Kubernetes集群在设置和升级是存在挑战,因此Google Container Engine (GKE)获得了更的注意力,因为它处理这些问题,并提供与Kubernetes发布周期紧密一致的更新。

Lytics 公司的CEO兼联合创始人Aaron Raddon说,“GKE扩展了,而还有效运行了。这是无后顾之忧的,很难与之竞争。

Vendasta Technologies为媒体企业构建了销售和营销软件,它是Google App Engine的重要用户,但它已经转移到了微服务模型和GKE上。Saskatoon公司 首席架构师Dale Hopkins说,该公司将API从JSON转换为gRPC,极大地改善了客户的存档和交付。

“我们没有把一切都放在容器中,但我们联系的很紧密,”他说。

2017年,企业的舞台在哪里

Google在全球扩张方面进行了大量投资,以解决数据距离和数据驻留问题;并在2016年增加了两个新区域,使其总数达到了六个。该公司计划在2017年每月开设一个新区域。

Google通过Spotify和Evernote高调地赢得了胜利;同时,花旗、高盛和其他金融行业的重量级公司已经认可了它的技术。其他的大客户还包括可口可乐、迪斯尼、梅西和索尼,但谷歌仍然缺乏传统旗舰 企业使用其平台。

为了专门应对企业市场,Google和埃森哲 将为零售、医疗、能源、金融和其他行业开发特定行业的服务。

“你开始看到更多的对市场和参与市场的承诺 。”埃森哲云部门的全球总经理Michael Liebow表示:“他们正在加倍,甚至三倍努力,以吸引更多的合作伙伴和更多的客户。”

Googlege还添加了对企业很重要的新安全功能,用于身份和访问管理以及客户提供的加密密钥,同时它也满足国际合规标准,保护客户数据。

2016年的多重收购对GCP起到了支持的作用,最值得注意的是Apigee公司,它提供了一系列API管理服务,比Amazon Web Services(AWS)上的内容更加企业友好。

Google将多个不同的业务单元归入Google Cloud下,这些业务包括:更名为GCP 的G Suite应用、机器学习工具,API和连接到云端的Google设备 。新的有限访问咨询服务,即客户可靠性工程,为应用的可靠性提供了共同的责任模型,旨在帮助Google和企业客户彼此了解操作技能。

当然,如果Google希望赶超竞争对手并满足企业需求,它仍有大量工作要做。行业观察者通常将它与AWS和微软Azure看作三个超大规模的提供商,虽然它是千年老三。

与不建议反对多云策略的亚马逊不同,Google 需要这种模式,来避免AWS在市场上大规模领先的东西。 为此,它推动了Kubernetes等服务,如Stackdriver,它监测日志,并执行GCP和AWS上的应用诊断。

谷歌也遇到了成长的烦恼,就如同AWS早期时候一样。 最值得注意的是,由于2016年的网络故障,GCP经历了多次中断和服务中断。

Google:大数据也是大事件

数据分析仍然是GCP的关键,包括Dataflow、Dataproc和Pub / Sub等服务。BigQuery206年已经升级,支持了StandardSQL,并与Microsoft Excel这样的工作集成,改进了监控和精细安全策略,简化的了特定日期 数据分区。

此外,还增加了多区域存储和流水线存储类。 除了Coldline之外,Google还增加了生命周期管理来自动化 数据转换;另外,Coldline冷存储提供了快速的检索时间。

除了使用GKE之外,对于大数据服务的改进,和GCP已经在其工作负载中集成的机器学习(包括Bigtable,Pub / Sub和Vision API),Lytics 看到这些感到很高兴。 Raddon说,Google已经稳步地进行了改进了,平台现在更简化,核心服务功能更丰富,并没扩展太多不同类的服务。

本文转自d1net(转载)

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
实战派教学:掌握Scikit-learn,轻松实现数据分析与机器学习模型优化!
【10月更文挑战第4天】Scikit-learn凭借高效、易用及全面性成为数据科学领域的首选工具,简化了数据预处理、模型训练与评估流程,并提供丰富算法库。本文通过实战教学,详细介绍Scikit-learn的基础入门、数据预处理、模型选择与训练、评估及调优等关键步骤,助你快速掌握并优化数据分析与机器学习模型。从环境搭建到参数调优,每一步都配有示例代码,便于理解和实践。
99 2
|
2月前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
54 2
|
2月前
|
机器学习/深度学习 算法 数据挖掘
从零到精通:Scikit-learn在手,数据分析与机器学习模型评估不再难!
【10月更文挑战第4天】在数据科学领域,模型评估是连接理论与实践的桥梁,帮助我们理解模型在未知数据上的表现。对于初学者而言,众多评估指标和工具常令人困惑。幸运的是,Scikit-learn 这一强大的 Python 库使模型评估变得简单。本文通过问答形式,带你逐步掌握 Scikit-learn 的评估技巧。Scikit-learn 提供了丰富的工具,如交叉验证、评分函数(准确率、精确率、召回率、F1 分数)、混淆矩阵和 ROC 曲线等。
43 1
|
3月前
|
机器学习/深度学习 算法 数据挖掘
Python数据分析革命:Scikit-learn库,让机器学习模型训练与评估变得简单高效!
在数据驱动时代,Python 以强大的生态系统成为数据科学的首选语言,而 Scikit-learn 则因简洁的 API 和广泛的支持脱颖而出。本文将指导你使用 Scikit-learn 进行机器学习模型的训练与评估。首先通过 `pip install scikit-learn` 安装库,然后利用内置数据集进行数据准备,选择合适的模型(如逻辑回归),并通过交叉验证评估其性能。最终,使用模型对新数据进行预测,简化整个流程。无论你是新手还是专家,Scikit-learn 都能助你一臂之力。
146 8
|
3月前
|
机器学习/深度学习 数据可视化 数据挖掘
数据可视化大不同!Python数据分析与机器学习中的Matplotlib、Seaborn应用新视角!
在数据科学与机器学习领域,数据可视化是理解数据和优化模型的关键。Python凭借其强大的可视化库Matplotlib和Seaborn成为首选语言。本文通过分析一份包含房屋面积、卧室数量等特征及售价的数据集,展示了如何使用Matplotlib绘制散点图,揭示房屋面积与售价的正相关关系;并利用Seaborn的pairplot探索多变量间的关系。在机器学习建模阶段,通过随机森林模型展示特征重要性的可视化,帮助优化模型。这两个库在数据分析与建模中展现出广泛的应用价值。
50 2
|
4月前
|
数据采集 机器学习/深度学习 算法
"揭秘数据质量自动化的秘密武器:机器学习模型如何精准捕捉数据中的‘隐形陷阱’,让你的数据分析无懈可击?"
【8月更文挑战第20天】随着大数据成为核心资源,数据质量直接影响机器学习模型的准确性和效果。传统的人工审查方法效率低且易错。本文介绍如何运用机器学习自动化评估数据质量,解决缺失值、异常值等问题,提升模型训练效率和预测准确性。通过Python和scikit-learn示例展示了异常值检测的过程,最后强调在自动化评估的同时结合人工审查的重要性。
105 2
|
4月前
|
机器学习/深度学习 搜索推荐 数据挖掘
【深度解析】超越RMSE和MSE:揭秘更多机器学习模型性能指标,助你成为数据分析高手!
【8月更文挑战第17天】本文探讨机器学习模型评估中的关键性能指标。从均方误差(MSE)和均方根误差(RMSE)入手,这两种指标对较大预测偏差敏感,适用于回归任务。通过示例代码展示如何计算这些指标及其它如平均绝对误差(MAE)和决定系数(R²)。此外,文章还介绍了分类任务中的准确率、精确率、召回率和F1分数,并通过实例说明这些指标的计算方法。最后,强调根据应用场景选择合适的性能指标的重要性。
539 0
|
7月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
248 14
|
7月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
128 1
|
7月前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)