暂无个人介绍
BERT 成为了你做 NLP 时不得不用的模型了……吗?
传统计算机硬件的计算单元与控制单元一样,都是数字电路,能够轻易集成在一块处理器上;传统软件输出的二进制代码则可以直接在处理器上运行。量子计算机与此不同,其计算单元是量子比特,而控制媒介是模拟信号,通常需要由独立于量子芯片的控制单元产生。额外的量子控制架构,作为量子软件与量子硬件之间的桥梁,构成了量子计算机与传统计算机在系统结构上最核心的区别之一。但在量子计算工程领域,以往量子软件与量子硬件的研究相对独立,这导致二者的设计及实现难以有机地联接在一起。
为了规范大家文明过马路,不少城市(深圳、天津、 莆田、新疆库尔勒、广州……)上线了「行人闯红灯曝光台」。顾名思义,闯红灯的行人会被曝光在大屏幕上。
在遭到抵制、更名投票,直至赞助商撤出的威胁之下,人工智能顶级会议 NIPS 今天悄然在官方网站上线了新的大会名称:NeurIPS。反正我是不会读……
「有百分之 46% 的公司 CIO 制定了与 AI 相关的发展计划,但真正得以落地的只有 4%。」14 号,在英特尔人工智能大会(AIDC)的开场演讲中,英特尔公司全球副总裁兼中国区总裁杨旭给出了这样一项调查结果。
字节跳动 AI Lab 近日组织了 AI 开放日,他们展示了各种视觉和语言方面的炫酷应用,这些应用很多都已经嵌入了字节跳动的产品中,例如今日头条、抖音和西瓜视频等。此外,字节跳动 AI Lab 主任马维英还重点分享了实验室的招人准则,跃跃欲试的小伙伴们,你们准备好了么。
数天前,机器之心发布了 Simon S. Du 等人的论文《Gradient Descent Finds Global Minima of Deep Neural Networks》引起了大家激烈的讨论。对此论文,读者们褒贬不一。此外,机器之心通过读者留言了解到微软研究院 Zeyuan Allen-Zhu、斯坦福 Yuanzhi Li、德州大学奥斯汀分校 Zhao Song(共同一作)稍微早些时候也发布了一篇类似的论文,但有更好的结果。后经沟通联系,机器之心对微软的这篇论文进行了跟进报道,希望能为读者提供更全面的内容参考,更好的理解两篇论文。
作为(伪)AI 行业从业者,之心编辑部里的小伙伴们自认都能够以不错的置信度人工识别「人工智能与人工智障」。但是,当我把下面这张爱奇艺 app 的截图放在大家面前时,编辑部的「识别器」们纷纷表示,这次置信度不高。
ResNet、r-Net,在人工智能迅猛发展的今天,微软研究之花可独表一枝
机器学习研究不是关于 AI 应该具备哪些知识的研究,而是提出优秀的学习算法的研究。
就此,我们采访了微软语音、自然语言与机器翻译的技术负责人黄学东,他向我们展示了一系列 TTS 生成的「真假难辨」的语音样例,并分享了微软在 TTS 一途上的经历与考量。
过去十年,谷歌在人工智能领域的重重突破,有很大一部分和 Quoc Le 有关。这位出生在越南的谷歌研究员像是一个人工智能的信徒,坚信机器学习能够解决一切让人烦恼的问题,即使存在失败的可能性,他也乐在其中。AutoML 则是他最新的研究方向,也是被认为将改变整个深度学习发展进程的技术。正如此,我们希望从和 Le 的采访中探寻围绕在 AutoML 的真相和未来。
挖掘机技术哪家强?北京后厂村找百度。
最近谷歌发布了基于双向 Transformer 的大规模预训练语言模型,该预训练模型能高效抽取文本信息并应用于各种 NLP 任务,该研究凭借预训练模型刷新了 11 项 NLP 任务的当前最优性能记录。如果这种预训练方式能经得起实践的检验,那么各种 NLP 任务只需要少量数据进行微调就能实现非常好的效果,BERT 也将成为一种名副其实的骨干网络。
余承东用行动告诉我们那句「稳了」的含义:不仅配置到位,价格也到位。
10 月 24 日,2018 GeekPwn 国际安全极客大赛在上海展开角逐,在众多极具创意的网络安全破解展示之中,由 FAIR 研究工程师吴育昕、约翰霍普金斯大学在读博士谢慈航组成的团队获得了最为令人瞩目的「CAAD( 对抗样本挑战赛)CTF」的冠军。
今年 2 月,来自微软 Bing 的研究人员在今年的 KDD 会议上发表了论文《Recurrent Binary Embedding for GPU-Enabled Exhaustive Retrieval from Billion-Scale Semantic Vectors》。该论文提出了能够生成紧凑语义表征的「循环二分嵌入」(RBE),这些表征可存储在 GPU 上,RBE 使得十亿级的检索能够实时进行。机器之心对这篇论文进行了解读。
今年四月,Michael Jordan 在 Medium 上发表了一篇名为《人工智能:革命尚未到来》的文章。
十几个小时前,一位机器学习工程师在 reddit 上发帖求助:ML 领域浮躁、门槛低、产品差,无法专心做东西,该不该换个领域?帖子一经发布,立刻引起了大量讨论。
一个历时 4 个多月、吸引了 5618 位参赛选手、Michael I. Jordan 和蚂蚁金服 CTO 亲自在证书上签名的大赛。
10 月 12 日,华为在全联接大会上正式发布了量子计算模拟器云服务平台 HiQ,包括基于华为云经典算力构建的量子计算模拟器及量子编程框架。
今年 5 月份,大家熟知的机器人公司波士顿动力在 YouTube 上放出两段视频,展示了 Atlas 和 SpotMini 机器人的最新进展。这两段视频没有展示多少新鲜的东西,但让我们看到了这些机器人的活动是多么自然。今日,波士顿动力机器人再次吸引了大家的注意:会跑酷的 Atlas。
最近机器之心发现谷歌的 Colab 已经支持使用免费的 TPU,这是继免费 GPU 之后又一重要的计算资源。我们发现目前很少有博客或 Reddit 论坛讨论这一点,而且谷歌也没有通过博客或其它方式做宣传。因此我们尝试使用该 TPU 训练简单的卷积神经网络,并对比它的运行速度。
今天要介绍的 Python 3 Cheat Sheet 由法国国家科学研究中心(CNRS)的法国机械工程与信息技术实验室(LIMSI)的工程师 Laurent Pointal 总结。这个简单的 Cheat Sheet 专注于从算法/编程开始所必需的语言部分,提供了学生入门所需的一般信息。注意:它不涉及面向对象的编程。
8 月份,Julia 1.0 发布,在社区内引发了极大的关注。之后不久,机器之心推荐了一篇简单的中文教程。在最新的这篇文章中,作者对 Julia 的众多特性进行了介绍,同时简略介绍了 Julia 在机器学习和深度学习方面的资源储备。
昨日,Facebook 在首届 PyTorch 开发者大会发布了 PyTorch1.0 预览版,标志着这一框架更为稳定可用。从去年年初发布以来,PyTorch 已经成为明星框架,发展速度甚至有力压 TensorFlow 的趋势。据网友统计,在最新的 ICLR 2019 提交论文中,提及 TensorFlow 的论文数量从 228 升到了 266,而提及 PyTorch 的论文数量从 2018 年的 87 激增到了 252,这是否也是 PyTorch 即将赶超 TensorFlow 的又一证明?
一场高质量的分享会应该具备哪些特征? 一位在某个领域足够资深的演讲者,就一个值得探讨的行业话题,用一套逻辑严密的演讲框架,在可以充分表达的 2 个小时里,向近千位专业听众完整分享他的看法与见解。 这就是 DTalk。
今年 5 月份,F8 大会的第二天中,Facebook 曾宣布 PyTorch1.0 即将与大家见面,这是继先前发布 0.4.0 后的一次较大调整。今日,在首届 PyTorch 开发者大会上,Facebook 宣布了有关该框架生态一系列更新,包括软件、硬件和教育方面的合作。于此同时,PyTorch 1.0 预览版也正式发布了。
很多人工智能学者都在抱怨目前的 AI 顶级会议接收论文数量大幅膨胀,论文质量也显著下降,其中有一部分经不起复现的推敲。最近,在 Reddit 上一个「较真」的网友就对 CVPR2018 的一篇大会接收论文进行复现,发现了其中的问题。此贴在 Reddit 上引发了众人的热烈讨论,其中包括对学术会议同行评审机制的审视。
「全国各行业的销售大概有 8000 万人,他们每天都面临着同样的问题:我的客户在哪里,我如何能接触到我的客户。而百炼的思路是,利用互联网公开信息来解决这一问题,只不过需要非常深度的提取与推理。」百炼智能的 CTO 姚从磊这样介绍他们的产品所解决的问题。
去年 10 月,英特尔发布了面向服务器的 FPGA 计算卡 Arria 10,并于今年 4 月宣布其已被部署在主流服务器中。时间仅过去不到一年,我们就看到了 Arria 的继任者。9 月 26 日,这家芯片科技巨头宣布推出 Stratix 10 SX FPGA 的全新可编程加速卡。
为了应对日益增长的安全威胁,该公司还在加大其对应各方面的研究投入,其中在人工智能方面的投入尤其突出。机器之心在拉斯维加斯最近举办的 DEF CON 黑客大会上采访了百度公司总裁张亚勤博士,本文为相关内容的中文版。
8 月中旬,谷歌大脑成员 Martin Wicke 在一封公开邮件中宣布,新版本开源框架——TensorFlow 2.0 预览版将在年底之前正式发布。今日,在上海谷歌开发者大会上,机器之心独家了解到一个重大的改变将会把 Eager Execution 变为 TensorFlow 默认的执行模式。这意味着 TensorFlow 如同 PyTorch 那样,由编写静态计算图全面转向了动态计算图。
今年 7 月,海外媒体 The Information 曝光了华为神秘的「达芬奇计划」,其中包括人工智能应用和 AI 云端芯片。华为的 AI 战略会是怎样的?对于现在已经竞争激烈的 AI 市场又会产生怎样的影响?这一消息引起了人们的议论和猜测
又一家企业紧跟 IBM、谷歌的步伐,踏入了量子硬件全球巨头竞技场。「这次我们是正式研发量子芯片,硬件实验室在阿里杭州总部!」自称「科学家保姆」的阿里达摩院量子实验室(AQL)主任施尧耘一边描绘着自己对阿里量子计划的憧憬,一边与机器之心讲述加盟阿里这一年里在阿里内部「创业」的成绩与挑战。
ECCV 2018 如期而至,旷视科技在首席科学家、研究院长孙剑博士的带领下获得 2018 COCO+Mapillary 联合挑战赛四项第一。机器之心专访 2018 COCO+Mapillary 挑战赛&旷视科技 Detection 组负责人俞刚,从算法模型与团队创新等方面讲述构建多项冠军方案的秘诀。
9 月 19 日上午,由杭州市政府与阿里巴巴主办、最具影响力的云计算峰会——「云栖大会」在杭州开幕。大会首日,阿里巴巴发布了城市大脑 2.0 版,宣布成立「平头哥」半导体公司开发 AI 芯片,吸引了众人关注。
贾佳亚是 2017 年 5 月加入优图实验室,担任总经理一职的。1 年 3 个月之后,他以「可以看到、可以感受到、可以用到」为标准,精选了优图实验室的一众技术,在上海完成了实验室的第一次对外公开亮相。
随着短视频的兴起,如何使用算法理解视频内容,并对其进行描述与检索就显得非常重要。最近快手多媒体内容理解部的语音组提出了一种能使用下文信息的门控循环单元,该模型能为快手大量的短视频提供语音识别、语音特效和语音评论等优秀的应用。快手提出的该论文已经被 Interspeech 2018 接收为 oral 论文,目前它同样也部署在了快手的各种语音业务中。
英特尔与南京大学联合成立了一个「人工智能联合研究中心」。9 月 12 日,英特尔中国研究院院长宋继强与南京大学人工智能学院院长周志华在南京为这个名为「英特尔-南京大学人工智能 IPCC 中心」的机构揭了牌。
一年一度的科技春晚开始变得无趣,苹果的「one more thing」的惊喜不再有——新品的使命转为刺激销量。围观的二级市场用脚为这场发布会投上了一票,截止发稿前,苹果股价跌幅 1.24%。
部署深度学习服务非常困难,因此简单易用的图形化系统就显得极为重要。本文介绍了百度的图形化深度学习系统 EasyDL,用户可以不需要机器学习背景知识而搭建优秀的深度学习服务。本文重点讨论了 EasyDL 系统的技术模块与优势,它大量采用了迁移学习与自动模型搜索,并针对不同的定制化任务学习不同的深度模型。
对于裴健教授来说,过去的一年是极为充实的一年。他在去年 7 月成为新一届 ACM SIGKDD 主席,任期两年,在今年 1 月,他又出任了京东集团副总裁,负责大数据平台与智能供应链事业部。
阿基米德的杠杆给了我们力量,伽利略与达芬奇的动力学给了我们速度与空间,而计算机科学将取之不尽的信息从广阔的世界里吸收过来呈现在我们眼前:它试图让人类更「渊博」,用可以无限扩充的存储帮助大脑去记忆;也试图让人类更「聪明」,能够用可叠加的算力帮助人跨越自身处理大量数据和高维数据的极限。
我们与华为芯片和硬件的产品和技术规划负责人,华为 Fellow 艾伟聊了聊,深入了解了麒麟 980 更多的细节,以及华为在新一代芯片背后的研发历程。
去年,华为发布的全球首款 AI 手机芯片麒麟 970 让世人惊艳。刚刚,在德国 IFA 2018 展会上,余承东发布了它的继任者:第二代 AI 芯片麒麟 980。这款芯片采用 7nm 工艺,搭载业内首款双核 NPU,将旗舰手机 CPU 的水平再次提升到了一个新高度。(注:文中图片大多来自「华为终端公司」微博账号)
2016 年 5 月 6 日,英伟达推出了 GeForce 10 系列,Pascal 架构的首款显卡,GTX 1080。两年又两个月过去了,今天在德国科隆游戏展上,黄仁勋终于为 GeForce 系列揭开了新的一页,为世人带来了搭载 12 纳米制程 Turing 架构的全新消费级显卡 RTX 2070、RTX 2080 和 RTX 2080Ti。
利用机器学习技术审阅文档,生成摘要,提高文字工作效率是人工智能的重要发展方向。近日,达观数据推出了文档智能审阅系统 2.0 版,吸引了德勤、平安信托等众多公司的青睐。
每个人都知道人工智能是未来科技的方向,但每个人对于学 AI 都持有不同的态度。近日,Twitter 上有一张图火了,引来 Yann LeCun 等大牛、CSAIL at MIT 等账号争相转发。这张图把深度学习学者分为了四种人,描述了四种类型学习者的特征。机器之心读者们可以对号入座,看自己是 Cann YeLun 还是 LeiLei Fi。
一场高质量的分享会应该具备哪些特征? 一位在某个领域足够资深的演讲者,就一个值得探讨的行业话题,用一套逻辑严密的演讲框架,在可以充分表达的2个小时里,向近千位专业听众完整分享他的看法与见解。 这就是 DTalk。