Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

简介:

各位周末好!对 AI 开发者来说,本周发生了不少大事值得关注,重点包括:Facebook 开源全新算法库 FAISS 和新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会,宣布收购 Kaggle,并发布视频搜索 API;英伟达针对 AI 发布全新嵌入式开发组件 Jetson TX2;以及百度发布 PaddlePaddle 全新 API 大幅减少代码冗余等。下面我们将完整梳理本周内与开发者息息相关的 AI 大事件,并推荐几个 AI 研习社编译整理的开发者资源,祝大家周末愉快。

Facebook 开源聚类和相似性搜索库 FAISS

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

雷锋网消息,FAIR(Facebook 人工智能实验室)上周发表了一篇论文,提出一项针对聚类和相似性搜索的新算法设计。新架构比此前最先进的算法更快更高效,并使用 GPU 来获得更高的内存带宽和计算吞吐量。

基于此项研究,FAIR 近日在 Github 开源了一个名为 FAISS 的库,相关文档已陆续完成上传,并于昨日更新了安装文件。能进行聚类和相似性搜索的算法已有不少,FAISS 对它们进行了优化,以便更高效地在 GPU 上运行。FAISS 整合的部分算法有: 

Fast K-Nearest Neighbour

QuickSelect

Warpselect

K-Means clustering

FAIR 表示,FAISS 有五大特性:

使用 C++ 编写,有完整的  Python/numpy 封装。

支持单个、多 GPU。

优异的可扩展性,通常情况下能支持最多 100 个维度。

基于 BLAS 和 CUDA。

比当前最先进的库速度提高 8.5 倍。

详情:http://www.leiphone.com/news/201703/lzEITGcs5Miuh8k5.html 

GitHub:http://www.leiphone.com/news/201703/lzEITGcs5Miuh8k5.html 

论文:https://arxiv.org/abs/1702.08734 

谷歌开放大规模音频数据集 AudioSet,助力 AI 音频算法研究

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

在 Google Cloud Next 云技术大会之前,谷歌通过开发者博客公布了一个可以媲美图像识别领域 ImageNet 的大型音频数据库 AudioSet。据称,该数据库包含了 632 个音频类别以及 2084320 条人工标记的每段 10 秒长度的声音剪辑片段(来自 YouTube 视频),覆盖范围包括人声、动物声、各种乐器与音乐流派,以及日常生活环境的声音等。总体量为:2100 万标注视频、5800 个小时的音频,以及 527 种类型的标注声音。

论文:https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/45857.pdf 

详情:https://research.google.com/audioset/ 

IBM 语音识别能力逼近人类水平

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

去年十月,微软人工智能与研究部门的一个研究者和工程师团队报告他们的语音识别系统实现了和专业速录员相当甚至更低的词错率(WER)——达到了 5.9%。本周 3 月 7 日,IBM 在官方博客发文称人类的水平实际上应该是 5.1%,同时表示 IBM Watson 的词错率已经超越了之前微软报告的最佳水平,达到了 5.5%。

详情:http://www.leiphone.com/news/201703/bJaCYcArDJIenrAC.html 

英伟达发布全新 Jetson TX2 嵌入式开发组件,强化 AI 智能运算

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

3月7日,英伟达发布了全新的嵌入式开发组件 Jetson TX2。据报道,这块全新发布的开发板只有一块信用卡大小,但提供了超过前代产品近两倍的运算性能。按照公司高管的说法,之所以提供如此强劲的运算性能,就是为了助力开发者在深度神经网络等 AI 智能领域的研究。

详情:http://www.leiphone.com/news/201703/MJ1rgDpXMzUENYtF.html  

Google Cloud Next 云技术大会

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

Google Cloud Next 云技术大会于当地时间3月8日上午8:30在美国加州旧金山开幕(北京时间约为9日凌晨1点)。

大会上,谷歌宣布收购大数据竞赛平台 Kaggle,但并未公布具体交易条款。报道称,被收购后 Kaggle 将会保留独立团队和品牌,并接入谷歌云服务,继续举办大数据相关的竞赛。

此外,谷歌还推出了全新视频搜索 API :Video Intelligence API 。报道称,Video Intelligence API 的主要功能是标注视频中的物体和场景,即实现了自动化的视频标记,从此开发者可以像搜图片一样轻松地搜索视频中的内容。目前该 API 尚处 Private Beta 阶段,并未完全公开。

收购 Kaggle 详情:http://www.leiphone.com/news/201703/ZjpnddCoUDr3Eh8c.html 

视频搜索 API 详情:https://cloud.google.com/video-intelligence/ 

Facebook 开源新一代机器学习 GPU 服务器 Big Basin

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

继 2015 年发布开源机器学习 GPU 服务器 Big Sur 并将其成功应用之后,今天(3 月 9 日) Facebook 通过官方博客宣布 Big Sur 的升级版 —— Big Basin 已经研发成功,并在 Open Compute Project 开源。据称,通过将内存从 12 GB 增加到 16 GB ,以及提高算数吞吐量(arithmetic throughput),Big Basin 可以处理的机器学习模型规模增加了 30%。

详情:http://www.leiphone.com/news/201703/MJ1rgDpXMzUENYtF.html  

百度发布 PaddlePaddle 新 API

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

3 月 9 日,百度宣布已完成 PaddlePaddle 新 API 的内测版本。PaddlePaddle 是百度研发的深度学习开源平台,于去年 9 月对公众开放,称得上是国内机器学习开源项目的领军者。雷锋网获悉,该新 API 接口大幅精简了 PaddlePaddle 的代码量。下面百度官方公布的对比图,左为旧 API 上的 CNN 程序,右为新 API。

如图所示,新 API 的代码非常简洁。百度表示,这主要是由于三个方面的改进:

新的概念模型

提供“训练、“测试”、“推理”等新的高级 API,并支持 Kubernetes 。

组合的 data bricks

此外,百度还开放了《使用 PaddlePaddle 进行深度学习》的使用手册,其中有示例教程。

手册下载地址:http://book.paddlepaddle.org/index.en.html 

详情:http://research.baidu.com/paddlepaddles-new-api-simplifies-deep-learning-programs/   

大会预告:IBM InterConnect 2017 

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

IBM InterConnect 2017 开发者大会将于 3 月 19-23 日在拉斯维加斯举行。日前为了吸引更多的开发者参与,IBM 在官方博客中总结了此次会议对 Java 开发者而言的 6 大亮点:

1. Code Rally 编程拉力赛

2. DevZone 开发者社区

3. 微服务(Microservices)专题讨论

4. Open Tech Summit 技术开放峰会

5. 基于 IBM WebSphere Liberty 和 MicroProfile 的敏捷开发

6. 基于 IBM WebSphere Liberty 和 Node.js 的本地云微服务

详情:https://www.ibm.com/blogs/cloud-computing/2017/03/java-developer-interconnect-2017/ 

开发者资源推荐

最近很火的《计算机科学的数学》是本什么样的书?

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

本文详细介绍了《计算机科学的数学》这本书的来龙去脉,并推荐了其他一些相关资源,包括一个权威的机器学习入门书单和十大机器学习公开课等。

地址:http://www.leiphone.com/news/201703/1ywNOxhiSuX3pNJZ.html 

数据科学入门难?老司机为你盘点 24 门精品课程

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

本文盘点了 24 个高品质的在线数据科学入门教程,原作者是一位自学成才的数据科学大牛,文中汇总的课程不但参考了在线慕课社区 Class Central 成千上万的课程评分和评论数据,更是原作者的经验之谈,因此非常具有参考价值

地址:http://www.leiphone.com/news/201703/gCpBclh3rST2rHzc.html 

盘点近年来引用最多的深度学习论文

Facebook 开源新一代机器学习 GPU 服务器 Big Basin;谷歌召开 Google Cloud Next 云技术大会等 | AI 研习社周刊

原文来自滑铁卢大学的博士研究生 Terry Taewoong Um,他搜集整理了 2012 年以来在深度学习领域被引用次数最多的一百多篇论文,值得深入研究。

地址:https://github.com/terryum/awesome-deep-learning-papers 






本文作者:恒亮
本文转自雷锋网禁止二次转载, 原文链接
相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
19小时前
|
机器学习/深度学习 人工智能 并行计算
Unsloth:学生党福音!开源神器让大模型训练提速10倍:单GPU跑Llama3,5小时变30分钟
Unsloth 是一款开源的大语言模型微调工具,支持 Llama-3、Mistral、Phi-4 等主流 LLM,通过优化计算步骤和手写 GPU 内核,显著提升训练速度并减少内存使用。
69 3
Unsloth:学生党福音!开源神器让大模型训练提速10倍:单GPU跑Llama3,5小时变30分钟
|
23天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
117 11
|
1月前
|
人工智能 文字识别 异构计算
NVIDIA-Ingest:英伟达开源智能文档提取及结构化工具,支持 GPU 加速和并行处理
NVIDIA-Ingest 是英伟达开源的智能文档提取工具,支持 PDF、Word、PPT 等多种格式,提供并行处理和 GPU 加速,适用于企业内容管理和生成式应用。
112 18
NVIDIA-Ingest:英伟达开源智能文档提取及结构化工具,支持 GPU 加速和并行处理
|
2月前
|
人工智能 JSON Linux
利用阿里云GPU加速服务器实现pdf转换为markdown格式
随着AI模型的发展,GPU需求日益增长,尤其是个人学习和研究。直接购置硬件成本高且更新快,建议选择阿里云等提供的GPU加速型服务器。
利用阿里云GPU加速服务器实现pdf转换为markdown格式
|
2月前
|
机器学习/深度学习 人工智能 编解码
阿里云GPU云服务器优惠收费标准,GPU服务器优缺点与适用场景详解
随着人工智能、大数据分析和高性能计算的发展,对计算资源的需求不断增加。GPU凭借强大的并行计算能力和高效的浮点运算性能,逐渐成为处理复杂计算任务的首选工具。阿里云提供了从入门级到旗舰级的多种GPU服务器,涵盖GN5、GN6、GN7、GN8和GN9系列,分别适用于图形渲染、视频编码、深度学习推理、训练和高性能计算等场景。本文详细介绍各系列的规格、价格和适用场景,帮助用户根据实际需求选择最合适的GPU实例。
|
3月前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器架构有啥区别?X86计算、Arm、GPU异构、裸金属和高性能计算对比
阿里云ECS涵盖x86、ARM、GPU/FPGA/ASIC、弹性裸金属及高性能计算等多种架构。x86架构采用Intel/AMD处理器,适用于广泛企业级应用;ARM架构低功耗,适合容器与微服务;GPU/FPGA/ASIC专为AI、图形处理设计;弹性裸金属提供物理机性能;高性能计算则针对大规模并行计算优化。
153 7
|
3月前
|
弹性计算 固态存储 Linux
阿里云服务器、轻量应用服务器、gpu云服务器收费标准与实时活动价格参考
云服务器ECS、轻量应用服务器和gpu云服务器是阿里云的主要云服务器产品,目前轻量应用服务器2核2G收费标准为60元/月,活动价格只要36元/1年或68元1年,云服务器1核1G包月收费标准最低为24.0元/月,GPU云服务器中gn6i实例4核15G配置月付1681.00/1个月起,gn6v实例8核32G配置月付3817.00/1个月起。本文为大家整理汇总了阿里云服务器、轻量应用服务器、gpu云服务器的最新收费标准与活动价格情况,以表格形式展示给大家,以供参考。
|
3月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云GPU服务器全解析_GPU价格收费标准_GPU优势和使用说明
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等场景。作为亚太领先的云服务商,阿里云GPU云服务器具备高灵活性、易用性、容灾备份、安全性和成本效益,支持多种实例规格,满足不同业务需求。
729 2
|
3月前
|
机器学习/深度学习 人工智能 弹性计算
什么是阿里云GPU云服务器?GPU服务器优势、使用和租赁费用整理
阿里云GPU云服务器提供强大的GPU算力,适用于深度学习、科学计算、图形可视化和视频处理等多种场景。作为亚太领先的云服务提供商,阿里云的GPU云服务器具备灵活的资源配置、高安全性和易用性,支持多种计费模式,帮助企业高效应对计算密集型任务。
448 6
|
3月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
604 0

热门文章

最新文章