百度将 HPC 技术引入深度学习;卡巴斯基操作系统;AMD Ryzen 预售等 | AI 开发者头条

简介:

百度将 Ring Allreduce 算法引入深度学习

Ring Allreduce 本是 HPC (高性能计算)领域的一项技术。日前,百度硅谷 AI 实验室已成功将其移植到深度学习平台,借此来加速 GPU 之间的数据传输速率。目前,在 GPU 并行计算中,它们之间的通信瓶颈是制约深度学习模型训练速度的主要障碍之一。百度宣布,Ring Allreduce 算法的引入将移除该瓶颈,大幅提升多 GPU 和分布式计算环境下的深度学习模型运算效率。雷锋网获得消息,该技术已被百度成功应用于语音识别。

该算法以库和 Tensorflow 补丁的形式向开发者开源,分别为 baidu-allreduce 和 tensorflow-allreduce,已在 GitHub 上线。

 GitHub:https://github.com/baidu-research/baidu-allreduce

https://github.com/baidu-research/tensorflow-allreduce

详情:http://www.leiphone.com/news/201702/QaSmvdQNbiY4CxBy.html

百度博客(英文):http://research.baidu.com/bringing-hpc-techniques-deep-learning/

卡巴斯基发布操作系统 Kaspersky OS

百度将 HPC 技术引入深度学习;卡巴斯基操作系统;AMD Ryzen 预售等 | AI 开发者头条

与 Linus、Windows,Mac OS 等优先系统兼容性和通用性的考虑不同,Kaspersky OS 的设计目的有且只有一个:最大化安全。因此 Kaspersky OS 采用了 Flux 高级安全内核架构(FLASK)。卡巴斯基不但表示 Kaspersky OS 要做世界上最安全的操作系统,还宣称, Kaspersky OS 的密钥只有量子计算机级别的计算能力才能破解。

雷锋网获知,该系统面向的并非消费者终端(PC),而是网络设备、工业控制系统和物联网设备。它同时兼容 X86 和 ARM 两大架构平台。值得注意的是,卡巴斯基声称该系统和 Linux 没有任何关系,从头到尾完全自行设计,并因此耗费了巨大人力——公司 CEO Eugene Kaspersky 表示,该系统秘密研制已有 14 年。

谷歌发布全新 TensorFlow 库“tf.Transform”

谷歌表示,tf.Transform 将改善 TensorFlow 的数据预处理和格式转化难题。

以下是谷歌对tf.Transform 的技术介绍:

“今天我们正式发布 tf.Transform,一个基于 TensorFlow 的全新功能组件,它允许用户在大规模数据处理框架中定义预处理流水线(preprocessing pipelines),同时还可以将这些流水线导出,将其作为 TensorFlow 计算图(TensorFlow graph)的一部分。


用户可以通过组合 Python 函数来定义该流水线,然后在 Apache Beam 框架下通过 tf.Transform 执行。(注:Apache Beam 是一个用于大规模的、高效的、分布式的数据处理的开源框架)目前,基于 Apache Beam 框架的流水线可以在 Google Cloud Dataflow 平台上运行,并计划在未来支持更多的平台(可能包括 Apache Apex,Apache Flink 和 Apache Spark 等)。值得一提的是,通过 tf.Transform 导出的 TensorFlow 计算图还可以在模型预测阶段将这种数据预处理步骤复用(例如,通过 Tensorflow Serving 提供模型时)。”

GitHub:https://github.com/tensorflow/transform

谷歌博客:http://research.googleblog.com/2017/02/preprocessing-for-machine-learning-with.html

法国研究人员实现用深度学习预测衰老长相

百度将 HPC 技术引入深度学习;卡巴斯基操作系统;AMD Ryzen 预售等 | AI 开发者头条

众所周知,此前的深度学习技术虽然能将输入的年轻人脸图像,输出为老年图像,但在这过程中会失去一些面部特征与识别信息,其结果并不准确——严格来说,输出的图像不能说是对同一个人衰老长相的预测。

但现在,法国的一组研究人员成功实现了用深度学习算法,将同一个人的面部照片做“衰老”或“年轻化”处理。换句话说,既能预测老年相貌,也能重现年轻时的面容。上图是研究结果示范。

该研究发表于 ArXiv,题目为“Face Aging With Conditional Generative Adversarial Networks”。

“老得不敢拍照片”或许将退出历史舞台。美图对此怎么看?

ArXiv:https://arxiv.org/abs/1702.01983

AMD 八核十六线程 Ryzen“锐龙”CPU 全球同步预售

百度将 HPC 技术引入深度学习;卡巴斯基操作系统;AMD Ryzen 预售等 | AI 开发者头条

AMD 于昨晚 AMD Ryzen Tech Day 正式发布 Ryzen。这来得有些突然——此前媒体与行业人士普遍估计 Ryzen 将在 MWC 发布。不过,Ryzen 发货时间仍然是 3 月 3 日(国行),目前预售开启。

我们来看看预售的三款 7 系 Ryzen 的国行售价:

  • Ryzen 7 1800X 3999 元

  • Ryzen 7 1700X 3099 元

  • Ryzen 7 1700 2499 元

不同电商平台上有 200~300 元不等的预订优惠,感兴趣的可关注。

雷锋网(公众号:雷锋网)提醒:由于事出突然,全世界范围内 Ryzen 的评测还没有放出。目前我们对于它的所有了解,完全基于 AMD 官方宣传信息,以及此前泄露的工程版本芯片跑分。因此,对于这三款芯片之间的性能差距到底有多大、是否值得这中间的差价,尚无定论。业内对“X ”版本性能强在哪里、与非 X 版本的超频潜力差别也尚有疑虑。仅给正在选择的买主做个提醒。

顺便说一句,苏妈给出的官方 Cinebench R15 nt 跑分是:

Ryzen 7 1700:1410 ;

Ryzen 7 1700X:1537;

Ryzen 7 1800X:1601 

根据得分,大家最关心的 1700X 比 1700 有约 9% 的性能提升。与之对比的英特尔跑分:

酷睿 i7 7700k:967;

酷睿 i7 6800k:1108

酷睿 i7 6900k:1474 

史上最强凌动 英特尔发布 Atom C3000

百度将 HPC 技术引入深度学习;卡巴斯基操作系统;AMD Ryzen 预售等 | AI 开发者头条

这是凌动产品线首个 16 核 CPU,它整合了多项多见于服务器芯片中的技术:比如 RAS 功能,该功能可即时修正数据错误,并防止网络和存储设备崩溃。 与现有凌动产品线面向移动设备的定位不同,Atom C3000 的服务对象将是存储阵列、网络设备和物联网设备。将为它们带来更强大的数据处理能力。

简而言之,这是款与消费者无关、但关乎网络设备开发商的凌动。 





本文作者:三川
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
1月前
|
缓存 人工智能 架构师
龙蜥社区走进中国农业大学,共探“AI+生命科学” 操作系统优化实践
“AI+生命科学”这一跨学科领域的巨大潜力与重要意义。
|
1月前
|
人工智能 搜索推荐 API
🚀 2小时极速开发!基于DeepSeek+智体OS的AI社交「头榜」震撼上线!
基于DeepSeek大模型与DTNS协议的革命性AI社交平台「头榜」震撼上线!仅需2小时极速开发,即可构建完整社交功能模块。平台具备智能社交网络、AI Agent生态、Prompt市场、AIGC创作等六大核心优势,支持低代码部署与个性化定制。开发者可快速接入DeepSeek API,体验去中心化架构与数据自主权。官网:[dtns.top](https://dtns.top),立即开启你的AI社交帝国!#AI社交 #DeepSeek #DTNS协议
72 4
|
2月前
|
机器学习/深度学习 编解码 人工智能
计算机视觉五大技术——深度学习在图像处理中的应用
深度学习利用多层神经网络实现人工智能,计算机视觉是其重要应用之一。图像分类通过卷积神经网络(CNN)判断图片类别,如“猫”或“狗”。目标检测不仅识别物体,还确定其位置,R-CNN系列模型逐步优化检测速度与精度。语义分割对图像每个像素分类,FCN开创像素级分类范式,DeepLab等进一步提升细节表现。实例分割结合目标检测与语义分割,Mask R-CNN实现精准实例区分。关键点检测用于人体姿态估计、人脸特征识别等,OpenPose和HRNet等技术推动该领域发展。这些方法在效率与准确性上不断进步,广泛应用于实际场景。
415 64
计算机视觉五大技术——深度学习在图像处理中的应用
|
4月前
|
人工智能 Linux API
Omnitool:开发者桌面革命!开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台,本地运行不联网
Omnitool 是一款开源的 AI 桌面环境,支持本地运行,提供统一交互界面,快速接入 OpenAI、Stable Diffusion、Hugging Face 等主流 AI 平台,具备高度扩展性。
562 94
Omnitool:开发者桌面革命!开源神器一键整合ChatGPT+Stable Diffusion等主流AI平台,本地运行不联网
|
1月前
|
人工智能 自然语言处理 安全
💻 Codex 来了:OpenAI 推出多任务软件工程 AI 代理,开发者工作方式将被重塑?
Codex 是 OpenAI 推出的一款云端智能开发代理,基于优化后的 Codex-1 模型,能够执行从代码编写、Bug 修复到 PR 提交的完整工程任务。通过 ChatGPT 的界面,用户可向 Codex 分配任务,它将在独立沙盒中运行并返回结果。Codex 支持多任务异步处理,遵循项目规范(AGENTS.md),并生成日志与测试报告以确保透明性。作为“AI 参与式开发”的里程碑,Codex 不仅提升效率,还可能重塑开发者角色,使他们从具体编码转向指导 AI 完成任务,推动软件工程进入意图驱动的新时代。
150 15
|
1月前
|
人工智能 并行计算 监控
在AMD GPU上部署AI大模型:从ROCm环境搭建到Ollama本地推理实战指南
本文详细介绍了在AMD硬件上构建大型语言模型(LLM)推理环境的全流程。以RX 7900XT为例,通过配置ROCm平台、部署Ollama及Open WebUI,实现高效本地化AI推理。尽管面临技术挑战,但凭借高性价比(如700欧元的RX 7900XT性能接近2200欧元的RTX 5090),AMD方案成为经济实用的选择。测试显示,不同规模模型的推理速度从9到74 tokens/秒不等,满足交互需求。随着ROCm不断完善,AMD生态将推动AI硬件多元化发展,为个人与小型组织提供低成本、低依赖的AI实践路径。
305 1
在AMD GPU上部署AI大模型:从ROCm环境搭建到Ollama本地推理实战指南
|
2月前
|
人工智能 供应链 Cloud Native
中国AI编码工具崛起:技术突围、生态重构与开发者新范式
中国AI编码工具如通义灵码、百度Comate等,正从西方产品的主导中突围。通过大模型精调、中文友好型理解及云原生赋能,构建差异化优势。这些工具不仅提升效率,还推动中国软件产业从使用者向标准制定者转变。然而,技术原创性、生态碎片化和开发者信任危机仍是挑战。未来目标不是取代现有工具,而是定义适合中国开发者的智能编码新范式。
182 24
|
2月前
|
人工智能 安全 测试技术
通义灵码:AI重构编码范式,开发者如何迎接“人机共生”时代?
本文探讨了以通义灵码为代表的AI编码助手如何推动软件开发从“人驱动工具”向“人机协同创造”演进。文章分析了其技术突破,如意图理解、上下文感知和可解释性,并讨论了开发者价值链条的重构,包括需求抽象、架构设计与代码审查能力的提升。同时,文章展望了行业变革对开发者身份、云生态竞争及技术伦理的影响,强调在AI驱动的“寒武纪大爆发”前夜,唯有持续进化才能适应未来软件工程的“人机共生”文明。
179 16
|
2月前
|
人工智能 算法 IDE
通义灵码:以AI重塑开发者生产力,解锁智能编程新范式
通义灵码是阿里云推出的一款AI智能编程助手,基于通义大模型打造,深度集成于主流IDE。它不仅提供全场景智能代码生成、对话式开发体验和工程化智能重构等功能,还通过百亿级参数大模型底座、企业级环境适配、私有化部署等优势,重新定义人机协作边界。在真实开发场景中,通义灵码显著提升API开发与算法优化效率,助力开发者从机械劳动转向创造性对话,开启人机协同的新时代。
177 9
|
2月前
|
人工智能 自然语言处理 Java
通义灵码:AI编程助手如何重塑开发者的效率革命?
通义灵码是阿里云推出的一款基于通义大模型的智能编程助手,支持Java、Python、Go等主流语言,并深度适配VSCode、JetBrains等开发环境。其核心功能包括自然语言转代码、跨文件上下文理解、行级/函数级实时补全、自动生成单元测试及性能优化建议等。此外,还提供知识问答引擎、文档智能生成和研发大数据分析等进阶功能,助力开发者提升效率。通过重构生产关系,将重复劳动转化为创造性工作,使技术债务可视化,推动人机协同编程新时代的到来。
167 1

推荐镜像

更多