一张图看懂数据科学;惊曝英特尔 72 核 Xeon Phi 处理速度 | AI 开发者头条

简介:

内容预览:

  • 一张图看懂数据科学

  • 72 核的英特尔 Xeon Phi,数据处理速度赶上 GPU?

  • Linux 4.10 的三大改进之处

  • GitHub 邀请更多开发者参与其开源指南 

  • 每日推荐文章:如何设置 Linux 虚拟机进行机器学习开发?

一张图看懂数据科学

一张图看懂数据科学;惊曝英特尔 72 核 Xeon Phi 处理速度 | AI 开发者头条

这几天,该图在国外 LinkedIn 的开发者圈子中频频曝光。它标题为“什么是数据科学?”,将数据科学知识体系以尽可能简单、结构化的方式呈现出来,降低入门者梳理知识点的难度。雷锋网提醒,这张图由于力求简洁而有所疏漏,并没有覆盖所有核心知识点。比如美国数据科学家 Vincent Granville 就指出,他认为该图还可以加入 automated data science 。后者指的是机器到机器、或设备到设备之间的信息传递以及自动交易,比如广告网络中自动购买关键词的算法。

由于经过多重转载,最初发布者已不可考。

72 核的英特尔 Xeon Phi,数据处理速度赶上 GPU?

一张图看懂数据科学;惊曝英特尔 72 核 Xeon Phi 处理速度 | AI 开发者头条

前天,美国数据服务商 Kx Systems 再次以跑分来秀肌肉——宣传自家数据处理工具的优越性。由于本次跑分使用了英特尔的旗舰机器学习 CPU,事情变得有些意思。

雷锋网了解到,此次评测使用了他们开发的 q 语言和 kdb+ 数据库, 运行于英特尔为并行计算而专门优化的旗舰 72 核 Xeon Phi 处理器平台,来处理 11 亿次纽约出租车运营的数据集(2009-至今)。

Kx 宣布:

"我们的数据处理速度,超出其它 CPU 技术不止四个量级,可与基于 GPU 的代码‘相提并论’。对于大多数数据科学家来说,他们需要快速载入、分析大型数据集,CPU 仍然是主流的选择。有的数据科学家为了更快的速度转到 GPU 平台。但他们往往发现:编写基于 GPU 的代码,为数据分析任务增添了额外的复杂性,并且推高了资源需求。因此无法在基于 CPU 的 kdb+/q 数据处理,与其他基于 GPU 的技术之间做公平对比。"

当然,这只是 Kx 的一家之言,也只是一个独立的案例,未必能够客观反映 Xeon Phi 的运算性能(更关键的问题还有性价比)。在 GPGPU (GPU 通用计算)浪潮之下,CPU 在人工智能、机器学习、深度学习和大数据处理中到底会担任何种角色,尚待我们进一步观察。

详情:

Kx Systems:https://kx.com/2017/01/25/kx-1-1-billion-taxi-ride-benchmark-highlights-advantages-kdb-architecture/

英特尔:https://software.intel.com/en-us/blogs/2017/02/24/superior-kdb-performance-on-intel-xeon-phi-product-family

Linux 4.10 的三大改进之处

一张图看懂数据科学;惊曝英特尔 72 核 Xeon Phi 处理速度 | AI 开发者头条

  1. 虚拟 GPU

    针对 GPU 在虚拟机环境运行的低效问题,英特尔此前发布了一系列处理器扩展包:GVT-G。Linux 4.10 版本内核,终于加入了对 GVT-G  的原生支持。

  2. 更好的缓存控制技术

    加入对英特尔 Cache Allocation Technology(CAT)技术的支持,并加入新系统工具  “perf c2c”。后者将改善在 NUMA 环境下,多个线程同时修改内存中的同一部段带来的效率问题。这两者都只支持英特尔 CPU。

  3. Writeback  管理

    KernelNewbies.org 评论道:“从诞生之日起,Linux 把内存数据同步到硬盘的方法一直很差劲。”而这将在 4.10 版本得到改善。导致系统延迟的运算,将会遭到节流,以让位于其它线程。

详情:http://www.infoworld.com/article/3174088/linux/3-little-things-in-linux-410-that-will-make-a-big-difference.html

更多关于 perf c2c:https://joemario.github.io/blog/2016/09/01/c2c-blog/

GitHub 邀请更多开发者参与其开源指南 

一张图看懂数据科学;惊曝英特尔 72 核 Xeon Phi 处理速度 | AI 开发者头条

雷锋网(公众号:雷锋网)此前报道,GitHub 发布开源指南 “Open Source Guides”,指点开发者如何参与新项目。日前在与 InfoQ 的对话中,GitHub 开源部门负责人 Brandon Keepers 表示,这份指南本身就是一个开源项目,希望能反映出社区的呼声和多年实践中总结的智慧。GitHub 希望更多开发者参与进来,提出开源指南的改进建议,分享他们的经验与技巧。

详情:https://www.infoq.com/news/2017/02/github-open-source-guides?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global

http://www.leiphone.com/news/201702/7CV4bGMMWttx1I3U.html

每日推荐文章:

如何设置 Linux 虚拟机进行机器学习开发?

澳大利亚机器学习专家 Jason Brownlee,再次为大家奉上 ML 干货教程。相比 Windows 和 Mac OS,在 Linux 平台上进行机器学习开发具有许多天然优势,尤其在开发工具方面。

本教程基于 Python,分为三部分:

  1. 下载安装 VirtualBox。

  2. 下载 Fedora Linux,然后在虚拟机中安装

  3. 安装 Python 3 机器学习环境。

地址:http://machinelearningmastery.com/linux-virtual-machine-machine-learning-development-python-3/





本文作者:三川
本文转自雷锋网禁止二次转载, 原文链接
相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
6天前
|
人工智能 数据管理 API
阿里云百炼又获大奖!阿里云百炼入选 2024 最受开发者欢迎的 AI 应用开发平台榜15强
2024年最受开发者欢迎的AI应用开发平台榜单发布,阿里云百炼入选15强。持续推动AI开发者生态建设,提供开放平台、培训支持、行业解决方案,注重数据安全与合规,致力于生态合作与共赢,加速企业数智化转型。
|
2月前
|
人工智能 开发框架 搜索推荐
AI 骁龙 PC 开发者 技术 沙龙
AI 骁龙 PC 开发者 技术 沙龙
35 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索未来AI趋势:掌握Function Calling技巧,解锁大模型精度提升的秘密武器,让你的数据科学项目事半功倍!
【10月更文挑战第6天】随着深度学习技术的发展,神经网络模型日益复杂,Function Calling作为一种机制,在提升大模型准确度方面发挥重要作用。本文探讨Function Calling的概念及其在大模型中的应用,通过具体示例展示如何利用其优化模型性能。Function Calling使模型能在运行过程中调用特定函数,提供额外的信息处理或计算服务,增强模型表达能力和泛化能力。例如,在文本生成模型中,根据上下文调用词性标注或实体识别等功能模块,可使生成的文本更自然准确。通过合理设计条件判断逻辑和功能模块权重,Function Calling能显著提升模型整体表现。
75 3
|
2月前
|
人工智能 安全 自动驾驶
【通义】AI视界|英特尔和AMD“史无前例”首次合作,组建X86生态系统咨询小组
本文概览了近期科技领域的五大热点新闻,包括联想与Meta合作推出个人AI智能体“AI Now”,英特尔和AMD首次合作组建X86生态系统咨询小组,特斯拉计划大规模生产自动驾驶出租车,前Palantir首席信息安全官加盟OpenAI,以及Meta因涉嫌损害青少年心理健康面临美国多州诉讼。更多资讯,请访问通义平台。
|
2月前
|
机器学习/深度学习 人工智能 监控
利用AI提升代码质量:现代开发者的利器
【10月更文挑战第4天】在软件开发中,代码质量是项目成功的关键。本文探讨了如何利用AI提升代码的可读性、可维护性和性能。AI可通过代码审查自动化、自动化测试、性能优化和安全漏洞检测等多种方式帮助开发者。具体实践步骤包括选择合适的AI工具、集成工具、训练模型以及持续监控改进。实际应用案例如SonarQube、DeepCode等展示了AI在现代开发中的巨大潜力,预示着AI将在未来软件开发中扮演更重要角色。
|
3月前
|
人工智能 物联网 开发者
魔搭上线AIGC专区,为开发者提供一站式AI创作开发平台
魔搭上线AIGC专区,首批上架157个风格化大模型,专业文生图全免费~
141 16
|
3月前
|
人工智能 运维 云计算
阿里云无影AI云电脑亮相 体验大幅升级
9月20日,2024云栖大会上阿里云无影AI云电脑全新亮相,基于最新的终端云计算技术和AI大模型能力,无影的综合体验大幅提升,新增了弹性升降配、双网自由切换、多端操作系统知识库问答、编码大师等AI智能体功能,为安全办公、个人娱乐带来全新的云上流畅体验,更可畅玩《黑神话:悟空》等3A游戏大作。同时,无影还宣布向开发者全面开放应用中心生态,开发者可免费入驻。
1309 15
|
3月前
|
人工智能 数据中心 芯片
【通义】AI视界|英特尔推出新一代AI芯片挑战英伟达
今日科技热点包括:OpenAI CTO 米亚·穆拉蒂宣布离职,Meta发布多功能Llama 3.2语言模型,扎克伯格因Meta的人工智能策略使个人资产突破2000亿美元,星纪魅族展示AI生态新品如Lucky 08 AI手机及智能穿戴设备,以及英特尔发布Xeon 6 CPU和Gaudi 3 AI加速器挑战英伟达市场地位。这些动态展现了人工智能领域快速发展的趋势及其对科技巨头的影响。
|
4月前
|
人工智能 Anolis
展示全栈式AI平台,探讨软硬件技术!英特尔分论坛议程来啦 | 2024 龙蜥大会
英特尔分论坛将依托英特尔云到端的全面产品组合,围绕至强可扩展处理器、AI 加速器、以及 oneAPI、OpenVINO 等软硬件技术展开探讨。
展示全栈式AI平台,探讨软硬件技术!英特尔分论坛议程来啦 | 2024 龙蜥大会
|
2月前
|
机器学习/深度学习 人工智能 测试技术
AI是在帮助开发者还是取代他们?
AI是在帮助开发者还是取代他们?