暂无个人介绍
你的朋友圈被换脸视频刷屏了吗?昨天,一款换脸手机 APP——Zao 在各大应用商店上线,还不到一天的时间就在微博、朋友圈等各大平台刷屏。和此前大热的各种 deepfakes 视频一样,这款 APP 也可以实现换脸功能。不同的是,这次,换脸的门槛再一次降低,每个人都可以在手机上制作换脸视频了。但是,在上传照片之前,请详细阅读《用户协议》。
8 月 29 日,「ABC SUMMIT 2019 百度云智峰会」在北京国家会议中心举行。百度副总裁、智能云事业群组总经理尹世明一口气发布了 18 大智能计算新品及 7 大场景解决方案,讲述了 6 个典型客户案例,宣布成立了 1 个生态联盟。
完全通过光学,不要计算机也能构建个神经网络?港科大的研究团队提出了一种全光学神经网络,所有线性变换、激活函数通过光学模块就能实现。
也许我们以后能拜 AI 为师学习打麻将,成为雀坛冉冉升起的一代新星?
随机梯度下降 (SGD) 是深度学习的标准算法,但是它存在着梯度消失和病态条件等问题。本文探索与反向传播(BP)完全不同的方向来优化深度学习模型,即非梯度优化算法,提出了「反向前向的交替方向乘子法」的深度模型优化算法,即 dlADMM。该方法解决了随机梯度下降存在的问题,在多个标准数据集上达到并超过梯度下降算法的效果,并且第一次给出了全局收敛的数学证明。同时增强了算法的可扩展性,为解决一些当前重要的瓶颈问题提供了全新视角,比如复杂不可导问题以及非常深的神经网络的高性能计算问题。目前,该论文已被数据挖掘领域顶会 KDD 2019 接收。
活跃在美国著名学府加州大学伯克利分校(UC Berkeley)校园的「明星」外卖机器人 Kiwibot,尽管看起来像是自动驾驶,实际上却是雇佣了远在哥伦比亚的真人进行远程人工操纵。最近,创业公司 Kiwibot 也陷入了用真人冒充 AI 的舆论漩涡。
ICCV 2019 将于 10.27-11.2 在韩国首尔召开,本次会议总共接受 1077 篇,总提交 4303 篇,接收率 25%。厦门大学媒体分析与计算实验室共有 6 篇论文接受其中两篇为 oral。
用来刷脸解锁的 Face ID 也可以被「对抗样本」攻击了。最近,来自莫斯科国立大学、华为莫斯科研究中心的研究者们找到的新型攻击方法,让已经广泛用于手机、门禁和支付上的人脸识别系统突然变得不再靠谱。
近年来最新的一系列实例分割模型,例如 Mask R-CNN 等,其高准确度很大程度上依赖于大量的训练数据(COCO 数据集包含 20 余万张训练图片)。但是获取像素级别的标注是一项成本高昂且复杂精细的工作。为此,上海交通大学 MVIG 实验室(卢策吾团队)提出了 InstaBoost——一种基于 crop-paste 的实例分割数据增强方法。实验表明,在 Mask R-CNN 和 Cascade R-CNN 等框架中应用 InstaBoost,可以在 COCO 实例分割数据集上达到 2.2 mAP 的提升。同时,该方法还能够将物体检测的精度在 COCO 数据集上最高提升 4mAP。该论文已被I
自然语言理解和生成对于 AI 系统来说是一大难题,语言的复杂性和模糊性对 AI 系统提出了很大挑战。今天,斯坦福教授、IJCAI 卓越研究奖得主 Yoav Shoham 创办的公司 AI21 Labs 提出一种能够显著提升词汇消歧能力的新模型,并发布了可控性优于其他前沿文本生成系统的「HAIM」。AI21 Labs 的愿景是构建「具备前所未有的优秀自然语言理解和生成能力」的 AI 系统。
澳门举行的人工智能顶会 IJCAI 2019 因为正值大会创立 50 周年而备受瞩目。在这场盛会上,国内科技巨头阿里巴巴展示了自己面向文娱和安全两大方向的最新技术。
可以「欺骗」神经网络的对抗样本是近期计算机视觉,以及机器学习领域的热门研究方向。为了让 AI 能够抵御攻击,研究人员一直在寻找构建稳固机器学习算法的道路。最近,在国际顶级人工智能大会 IJCAI 上,一场有关人工智能安全的攻防战落下了帷幕。
本文介绍了计算机视觉在实际场景和实际任务中存在的三种困境,以案例详细说明,并给出了潜在的解决方案。
机器学习怎样帮助英语学习?查词、翻译、标准发音都少不了:OCR(光学字符识别)实时识别单词与句子,NMT(神经网络翻译)自动翻译语句,TTS(语音合成)合成最真实的标准读音。那么这些是不是能集成到一个硬件中,成为智能的英语学习利器,这就是网易有道词典笔 2.0。
想要试试模型攻防战,成为深度学习时代的 Hacker?那么参加安全 AI 挑战者计划吧,图像、文字和语音等多种攻防挑战赛的你来,在这里选手们共同探索共同进步,挑战及成长。针对第一期人脸识别对抗任务,本文将从背景、赛题和解决方案出发扫清你的疑惑。
华为自研的鸿蒙系统究竟有多强大?刚刚,余承东在 HDC 2019 上为我们揭开了它的面纱——鸿蒙 OS,是一个划时代的全新操作系统。
60+模型架构,历年十几个 SOTA 模型,这 21 秒带你纵览图像识别的演进历史。
Transformer XL 和 XLNet 是最近自然语言处理(NLP)领域里最热的话题之一,而它们都是 CMU 博士生 戴自航、杨植麟等人的工作。今年 6 月,CMU 与谷歌大脑提出的 XLNet 在 20 个任务上超过 BERT,并在 18 个任务上取得当前最佳效果的表现。
7 月 30 日,今日头条宣布正式推出新版「灵犬」反低俗助手,新工具除了文本内容识别功能的进化以外,首次加入了图片识别功能。这是时隔半年,「灵犬」的又一次重大升级。
今天,百度 ERNIE 再升级,发布持续学习语义理解框架 ERNIE 2.0,同时借助飞桨高效分布式训练优势发布了基于此框架的 ERNIE 2.0 预训练模型。该模型在共计 16 个中英文任务上超越了 BERT 和 XLNet,取得了 SOTA 效果。
贾佳亚是香港中文大学终身教授、腾讯优图实验室联合负责人、腾讯杰出科学家、IEEE Fellow,是计算机视觉领域著名专家,由他创立的图像滤波和逆向视觉问题解法已经被许多高校教科书和开源视觉代码库收录,同时也在视觉商业系统中得到广泛应用。在今年上海召开的市北•GMIS 2019 大会上,我们邀请到了贾佳亚教授,分享人工智能多模态的现状、挑战和未来。
「2019 年将会是云计算市场的重要拐点」,阿里巴巴集团 CTO、阿里云智能总裁张建锋以「拐点」拉开阿里云峰会上海站的序幕。
2019 年 5 月 ACM 图灵大会上,朱松纯教授(加州大学洛杉矶分校)与沈向洋博士(微软全球执行副总裁)在谈到「人工智能时代的道路选择」这个话题时,沈向洋博士认为人工智能发展在工业界将会迎来黄金十年,而朱松纯教授也表示人工智能的发展趋势将会走向大一统,从小任务走向大任务,从 AI 六大学科走向统一。
成立两年,马斯克著名的脑机接口研究公司 Neuralink 终于在刚刚发布了其首款产品。与人们的想象相同,第一款产品果然是「脑后插管」的新技术。
随着机器学习模型应用到生活生产中,如何获得更多的数据训练更好的模型成为了关键,而有助于解决该问题的联邦学习也就受到越来越多的关注。在本文中,我们将一同了解联邦学习,概览第一个联邦学习开源框架 FATE。
据路透社报道:一名美国高级官员称,美国政府即将批准科技公司在两周内重启对华为的销售许可。此举预示着美国政府对华为的解禁即将出现实质性内容。
手握腾讯全系广告资源位,百亿级的日均曝光,腾讯广告可谓是一个被忽视的大规模 AI 技术「练兵场」。
据华尔街日报等媒体报道,美国联邦贸易委员会(FTC)本周五刚刚批准了与 Facebook 达成的约 50 亿美元和解协议。这一高数额罚款是针对 facebook 近两年来违反用户隐私保护策略,特别是「剑桥分析」事件的处罚。
近年来,深度学习在计算机视觉的重要领域——三维重建中取得了一系列成果。然而,最近有论文指出,深度学习的 3D 重建表现甚至不如某些基线模型。而 CVPR 2019 最佳论文使用的是传统的三维重建方法,并不依赖深度学习模型。
「我们希望让人工智能技术为所有人造福,」Jeff Dean 说道。「谷歌认为,AI 应该对社会有益,并避免创造或加剧所有不公平现象。」
美国东部时间 7 月 3 日早上 8 点,Facebook 服务器遭遇了大面积停电,这一事件使得全球 Facebook、Instgram 和 WhatsApp 受到影响——除了很难登录,全球范围内很多用户在超过 11 个小时的时间里都无法上传图片和分享故事。
7 月 3 日,百度 AI 开发者大会在北京开幕。在大会上李彦宏展示的百度 AI 语音识别能力之外,最为引人注目的就是新任 CTO 王海峰向我们揭幕的,最新升级的百度大脑 5.0。新一代大脑在算法和算力上都有了重大突破。
今天的 AI 开发者大会上,百度又一款语音 AI 芯片「鸿鹄」亮相,宣布百度飞桨与华为麒麟芯片达成深度合作,首次亮相了无人驾驶出租车项目「Apollo Go」。一手技术新进展,一手 AI 商业落地,这届百度开发者大会的亮点全在此文。
那些大公司的大模型到底有多贵?我们帮你算了一笔账。
全球计算机视觉顶级会议 CVPR 2019 已于今日在美国长滩落幕。从日前公布的获奖论文中,我们能够发现华人声音在该领域愈为响亮,研究成果也备受关注。作为今年大会的黄金赞助商,码隆科技在 CVPR 2019 上不仅发表了优秀的研究工作,同时还与 Google Research 等合办了 FGVC6 Workshop,主办了细粒度商品识别挑战赛。本文将对码隆科技的 CVPR 2019 论文进行解读,介绍码隆是如何为图像搜索任务提出一个通用的损失函数框架,并将该领域近十年的损失函数都统一在该框架下。
走进今年 CVPR 的工业展区,映入眼帘的是熟悉的 MEGVII 字眼和以蓝色为主基调的展位,蓝白相间的 booth roof 甚是亮眼,这多少让记者有些惊讶。旷视,这家来自中国的计算机视觉独角兽公司,竟然「霸占」了全世界顶尖学术会议的 C 位。
6 月 17 日,以色列芯片公司 Habana.ai 发布了 Gaudi HL-2000,这是一款定制化 AI 处理器。该公司称,全新的 Gaudi 处理器性能超过了目前在训练神经网络任务中最为强大的英伟达 Tesla V100——而且性能是后者的近四倍。
随着深度模型越来越强大,它的通讯成本和需要的算力也急剧增长。因此,设计一个高效的分布式训练框架非常重要。那么什么是分布式计算,它又是怎样利用多个工作站加速训练呢?在本文中,我们将概述分布式计算的核心概念,并讨论一篇优秀的 ICML 2019 论文,该论文提出一种压缩梯度算法,可以将通讯成本降低 95%。
今年初,百度联合「深度学习技术及应用国家工程实验室」成立「黄埔学院」,旨在为各行各业培养第一批「首席 AI 架构师」。 第一期学员共 35 人,分别来自不同企业和单位(包括国家卫星气象中心、中油瑞飞、中信银行、神思电子、OPPO、广东电网、广东长隆集团、中国联通软件研究院、华为、米文动力、爱奇艺等),当然杨鋆源是其中之一。 他们在北京进修半年,在半年时间里,他们结合自身行业和企业需求,使用飞桨(PaddlePaddle),将 AI 结合到业务实践中应用落地。
AMD 在展会上的 Keynote 或许无法说服所有人——对于芯片来说我们更想看到实际性能的测试。昨天终于有人把新一代顶配消费级 CPU,AMD Ryzen 9 3950X 的跑分放上了 Geekbench,其领先优势甚至比 AMD 宣传的还要夸张。
自然语言处理领域顶级会议 ACL 将于 7 月 28 日至 8 月 2 日在意大利佛罗伦萨举行。今天,ACL 2019 官方网站公布了接收论文列表,机器之心对今年接收论文的关键词等信息进行了可视化分析。
近日,2019 菜鸟全球科技挑战赛在杭州落幕。在菜鸟柔性自动化实验室资深总监寒帅、菜鸟人工智能部研究员徐盈辉、旷视南京研究院院长魏秀参、阿里集团高德视觉技术攻坚小组研究员任小枫、菜鸟北京技术中心资深技术专家陈罡等评委的审议下,比赛最终决出了前三名。这些队伍获得了共计 60 万元的高额奖金。
声音秒变志玲姐姐,秒变「矮大紧」,秒变萝莉、正太,现在通通不是问题!
作为全球最大的互联网公司之一,腾讯的产业互联网之路,必然是要符合当下市场底层逻辑和基因优势的。 梳理出这条路子,不仅对于腾讯自身至关重要,也能够让外围看清时代潮水的流向,深刻理解互联网下半场的机会窗口。以及更重要的,意识到五到十年后变化所带来的价值。
梯度下降或最速下降法,是机器学习最为重要的模块之一。尤其是在深度学习时代,梯度下降已成为不可或缺的组成部分。但同时,梯度下降也限制了机器学习推广到更广泛的一些任务中,例如不可微的目标函数。这一缺陷,却正好能被本书的主题「演化学习」解决。
昨日(5 月 21 日),清华大学「智能人机交互研究中心」成立仪式在清华大学李兆基科技大楼举行。这是继「知识智能研究中心」、「听觉智能研究中心」、「基础理论研究中心」后,清华大学 AI 研究院第四个研究中心。
OpML 2019 全称是 2019 USENIX Conference on Operational Machine Learning,将于 2019 年 5 月 20 号在美国加州的 Santa Clara 举办。会议旨在提供科研人员和产业从业者一个交流合作的平台,为机器学习生产生命周期管理的普遍挑战开发并带来有影响力的研究进展和前沿解决方案。
微分方程真的能结合深度神经网络?真的能用来理解深度神经网络、推导神经网络架构、构建深度生成模型?本文将从鄂维南、董彬和陈天琦等研究者的工作中,窥探微分方程与深度学习联袂前行的路径。
内存单元可以执行计算吗?物理学与深度学习会碰撞出哪些火花?本文将介绍 Qualcomm AI Research 的最新 AI 研究成果。
北京时间 5 月 8 日凌晨,一年一度的谷歌 I/O 大会在加州山景城如期开幕。今年的大会上,除了常规的安卓 Q 版本更新以外,新手机和「家庭智能设备中心」Nest Hub 显得更加引人注目。而去年惊艳的「能和人打电话的 AI」Duplex 也有了新升级。