暂无个人介绍
INTERSPEECH 是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议。历届 INTERSPEECH 会议都备受全球各地语音语言领域人士的广泛关注。 本文介绍一种具有高识别率与计算效率的单轮非自回归模型 Paraformer。该论文已被 INTERSPEECH 2022 接收。
语音识别技术,也被称为自动语音识别 (Automatic Speech Recognition,ASR),其目标是将语音转成文字。
7月7日消息,国际权威研究机构 Gartner 近日公布《云 AI 开发者服务关键能力报告》,阿里在语音语义领域位居全球第二,超越亚马逊 AWS、微软等企业。
语音合成技术作为人机交互的重要环节,终极目标即达到媲美真人的合成效果。高表现力语音合成逐渐成为未来的趋势。高表现力语音有三个显著的特点:韵律自然、情感风格丰富和音质清澈。 需要认识到的是当下的技术水平在韵律自然表示、情感风格丰富度上和真人之间还存在着较大的、人耳容易分辨的差距。 因此,我们针对这三个特点,进行算法上的探索,形成达摩院第五代语音合成技术——基于韵律建模的 SAM-BERT、情感语音合成 Emotion TTS 和高清语音合成 HiFi-TTS 的 Expressive-TTS。
过去十年,语音AI从实验室走向应用,语音搜索、交互早已融入日常。本文一览达摩院语音AI技术创新全景,一起体会能听、会说、懂你的语音AI。
多模态流式 AI 编排平台,大规模减少新应用开发成本
Speaker Diarization 中的无监督聚类算法
ICASSP 2022 论文分享:基于 HRR 的非对齐序列多模态情感分析
Contextual Transformer端到端语音识别文本定制技术,可显著提升热词召回及整体识别率
本文通过拆解原始问题、发散思路优化等方式,记录了扫一扫从单码到多码识别的技术框架改造及多码识别率优化方案。其中涉及解码SDK的能力、码处理技术链路、码转换算法、降低漏检率策略等设计与实现。
本文将介绍淘宝 APP 统一网络库演进的过程,讲述如何围绕体验持续构建南北向从监测到加速一体化的终端网络架构,通过构建 NPM 弱网诊断感知能力,落地原生多通道技术/多协议择优调度手段,贴合厂商附能网络请求加速,实现去 SPDY 及规模化 IPv6/H3 协议簇的平滑过渡,为用户提供弱网更好、好网更优的 APP 加载浏览体验,支撑业务创造更多的可能性。
今天,我们想分享来自大淘宝技术工程师们的《人间清醒语录》,这些金句里凝结了他们多年实践经验的智慧,希望可以给你“打怪升级”的过程带来一些帮助。
我们结合逛逛推荐场景中的具体问题,从多场景全域表征的视角进行了一系列的探索与内容推荐场景的应用,从全域表征的范围、信息迁移方式以及模型框架的应用等维度展开我们的优化工作,取得了阶段性的优化经验和业务效果。
近日,CVPR NTIRE 2023 Quality Assessment of Video Enhancement Challenge比赛结果公布,来自大淘宝音视频技术团队的同学组成「TB-VQA」队伍,从37支队伍中脱颖而出,拿下该比赛(唯一赛道)冠军。此次夺冠是团队继MSU 2020和2021世界编码器比赛、CVPR NTIRE 2022压缩视频超分与增强比赛夺魁后,再次在音视频核心技术的权威比赛中折桂。
每日好店作为一个独特的店铺导购场景,希望能够“帮助用户发现更多好店”。目前每日好店的主要入口包括首页宫格和信息流,用户在店铺精选流中发生点击行为后,会进入主题二级承接页,店首页以及全部宝贝等页面。 本系列共两篇内容,上篇:每日好店——淘宝店铺推荐系统实践
今天是4月23日了,是联合国教科文组织规定的“世界读书日”。 大淘宝技术的工程师们精心挑选出7本技术类书籍, 有机器学习方面的、推荐系统方面的,分布式领域的,等等。每一位工程师都根据自己真实的阅读心得写了推荐语,希望能帮大家更快挑选到对自己有用的书籍。
画面模糊问题的源头也是来自用户的微距体验不佳,我们对问题深入分析,适当拆解。通过 Apple Development Doc 的查阅及实践,一步步抽丝剥茧,最终完美解决用户的体验痛点,也为我们自身沉淀了展示微距的能力。
本文作者永霸负责了淘宝PC改版,他坚信历史的发展是螺旋式上升的,那些只要认为是对的事情,未来一定会发生/被证实的。 文章指路:淘宝PC改版!我们跟一位背后付出6年的男人聊了聊……
BBC 发现其网站加载时间每增加一秒,用户便会流失 10%。为提高页面的秒开率,我们不断探索着优化策略,仅仅在浏览器领域下的优化已经满足不了我们的极致要求,开始往服务端方向不断探索。本文将讨论业务接入SSR的几个问题: 1.SSR究竟适合哪些业务? 2.接入SSR后,性能带来了哪些提升? 3.业务接入SSR有哪些成本?
基于 Git 的开发工作流——主干开发特性总结
通过改变3D场景制作流程复杂、成本高、门槛高、流动性差的现状,让商家像玩转2D一样去玩转3D,让普通消费者也能参与到3D内容创作和消费中,真正实现内容生产模式从PGC/UGC过渡到AIGC,是我们3D场景智能创作引擎一直追求的目标。
公开下载 | 300+页《服务端开发与面试知识手册》,12.8w字经典架构知识
每日好店——淘宝店铺推荐系统实践
今天,我们想分享来自大淘宝技术工程师们的《人间清醒语录》,这些金句里凝结了他们多年实践经验的智慧,希望可以给你“打怪升级”的过程带来一些帮助。
Web 平台规模化部署高效编码格式的实践和思考
《淘宝交付之道》新书发布会直播预告!
做为服务端同学,接触前端代码较少,刚毕业的时候用过 jQuery + Bootstrap2/3,当时的感觉就是,容易上手,学习门槛相对较低,另外就是有一个非常成熟的 jQuery 插件库,在这里,几乎可以找到日常需要的大部分插件(这里的插件,不是简单的按钮/表单组件,而是像抽奖/大转盘/推箱子游戏这样的完整的功能块,这些避免了自己去写“困难”的 CSS),组合组合就可以搭出一个完善的页面,改改 Ajax 请求,就能实现一个小项目了。 前端技术日新月异,用 jQuery 的日渐变少,现在有两个流行的技术框架 Vue 和 React。个人选择学习了解相对简单的 Vue,目的是可以独立做一个简单的
本文详细介绍了淘宝首页大促新玩法“首页即会场”项目,从开放模式、复用粒度、交互实现、性能、可扩展性等技术角度来说明“猫头”是怎样炼成的。
AIGC,这个当前的现象级词语。本文尝试从文生图的发展、对其当前主流的 Stable Diffusion 做一个综述。以下为实验按要求生成的不同场景、风格控制下的生成作品。
近日,阿里巴巴大淘宝技术题为《MD-VQA: Multi-Dimensional Quality Assessment for UGC Live Videos》—— 适用于无参考视频质量评价的最新研究成果被计算机视觉领域顶级会议IEEE/CVF Computer Vision and Pattern Recognition Conference 2023(CVPR 2023)成功收录。
淘宝App搜索业务侧采用的是局部动态化的跨端技术架构,客户端提供丰富的基础能力与视图组件的API,前端负责业务视图搭建与业务逻辑实现。
本文将分享来自淘宝人生团队齐力打造的新玩法——“人生小屋”背后的技术方案,详细介绍如何使用3D渲染引擎从0到1搭建虚拟场景、控制虚拟角色、实现人景交互、优化渲染效果等。笔者在其中主要负责了小屋3D室内场景的搭建部分。非常欢迎大家给我们提出建议,探讨交流。
3D模型在智能设计领域以其可塑性,可编辑性有着属于自己的独特优势,扩展了2D设计的上限。但是其目前存在的局限性也是显而易见的:建模的效率,模型的数量,以及3D设计的成本。
越来越多的团队开始使用 TS 写工程项目, TS 的优缺点也不在此赘述,相信大家都听的很多了。平时对 TS 说了解,仔细思考了解的也不深,借机重新看了 TS 文档,边学习边分享,提升对 TS 的认知的同时,也希望能在平时的工作中能用上,少写一点 any。
目前widget生态已经做了大量的基建工作,同时在widget生态的演进过程中我们发现如何匹配用户的偏好一直以来是一个挑战工作,本文介绍了widget的整体链路。
《淘宝交付之道》出版!大淘宝技术36个月匠心之作
“写代码的时候,不能对自己「妥协」” | 技术人金句系列
2023年3月29日,国际标准组织电气与电子工程师标准协会(IEEE-SA)正式通过了阿里巴巴牵头的《数字内容中数字水印实现的鲁棒性评估方法》(立项编号P3361)。
4月13日,第六届云安全联盟(CSA)大中华区大会在上海成功举办,阿里云零信任安全——办公平台SASE荣获最高荣誉奖项“安全磐石奖”,以过硬的技术实力获得广泛的市场认可,在AI时代正徐徐拉开帷幕的当下,零信任体系下的数据安全正在变得愈发重要。
打破边界,谁来定义未来云上攻防?
集结未来科技力量,培养更多云上安全人才,阿里云依托天池平台联合清华大学以“Capture the flag. Catch the future”为口号共同发起的2023首届CTF大赛(以下简称为“大赛”),已于4月1日顺利在杭州启动。
暌违三年,再聚杭州 立足业务众测与全平台风险发现, 整合ASRC与先知社区全量白帽伙伴, 2023阿里白帽大会,正式回归。
安全防护需要与企业云IT基础设施深度结合,这是云原生安全的基本思想。 想要在云时代保持竞争力,企业在专注于构建云原生业务应用的同时,需要在快节奏更迭的网络环境中快速理解并使用能够动态扩展、灵活保护的云原生安全体系。
2023年2月16日到23日,第二届阿里云RASP挑战赛顺利举办,来自全球的205位顶级白帽子与独立安全研究员,共发起模拟攻防400万次,累计触发防护检测3000万次。
3月10日14:00 阿里云安全联合云网络 举办高防EIP2.0升级版本线上发布会, 会上将详细解读产品升级后的能力亮点! 低延迟防护架构、支持多区域的按量计费模式 以及各个场景下安全防护能力! 并送上双重优惠福利,诚邀您观看。
由工业和信息化部、四川省人民政府主办的2023年中国网络和数据安全产业高峰论坛在四川成都拉开序幕。 阿里作为云计算和网络安全企业代表,受邀参加本次大会,并在工业互联网安全、车联网安全等领域荣获重磅荣誉奖项。
在产品设计领域,曾有无数前辈大佬留下过被用户捶打后的至理名言。其中,著名硅谷产品培训师Lea Hickman曾说过: 「Move away from output to outcomes. 从产出转向成果」 在概念、能力层出不穷的安全领域,格外适用。就像近几年甚嚣尘上的「零信任安全」,秉持着「永不信任,始终验证」的理念,,一项项能力的背后,能真正落地的寥寥无几。
2022年,是跌宕起伏的一年。 一方面,数字化经济的蓬勃发展:元宇宙、VR游戏、NFT等概念方兴未艾,线上消费、远程办公、数字化系统进一步发展。 另一方面,世界经济还在经历疫情带来的阵痛,全球黑产动作频频,阿里云在四层检测到了史上最大的流量攻击,攻击手段更加智能化、隐蔽化,单一的防护策略遭遇瓶颈。
近些年,勒索软件产业随着技术的不断进步,加上外部环境压力和勒索即服务(RaaS)的模式加持,已然站在了网络安全威胁的顶端。
新年话安全(速领2023限定红包封面)