云栖运营小编~
小叽导读:响应时间直接决定在线响应系统的效果和用户体验。比如在线展示广告系统中,针对一个用户,需要在几ms内,对上百个候选广告的点击率进行预估。因此,如何在严苛的响应时间内,提高模型的在线预测效果,是工业界面临的一个巨大问题。
基于时间碎片化、视频交互强、内容丰富、体验好等因素使得短视频近几年处在流量风暴的中心,各大平台纷纷涉足短视频领域。因此,平台对短视频内容的推荐尤为重要,千人千面是短视频推荐核心竞争力。短视频一般从“点击率”与“观看时长”两方面优化来提升用户消费时长。
本文主要介绍了Wide&Deep、PNN、DeepFM三个模型以及1688CBU事业部的顾海倩同学提出的Wide&Resnet模型结构,并尝试在1688猜你喜欢的真实数据场景中进行应用。文内有一些实验结果,也提出了一些遇到的问题,希望能与大家一起分享讨论。
尽管业界对于图像处理和自然语言处理领域,在算法可解释性方向上已经取得了一些进展,但对于电商与广告领域,目前还是空白。另一方面,深度学习技术已经开始被大规模应用到广告业务中。广告是很多互联网现金流的重要来源,是核心业务。
〔小叽导读〕:在淘宝网等电子商务网站中,品牌在用户对商品做点击、购买选择正起着越来越重要的作用,部分原因是用户现在越来越关注商品的质量,而品牌是商品质量的一个保证。 但是,现有的排序系统并不是针对用户对品牌的偏好设计的。
在双11的购物环节中,平台与商家为了激发用户的购买欲望,在不同品类或卖家店铺下存在各种满减优惠活动。在已加购一些目标商品的情况下,一部分用户会选择加购一件额外的商品,在符合购物计划的同时满足特定的满减条件,收获一件物美价廉的商品;还有一部分用户在选择额外商品的时候,会无意间发现一个惊喜的商品,甚至更改之前的购物计划;凑单作为购物环节重要的环节,具有帮助用户提高优惠购物效率与购物探索性两大重要角色。
在时间就是金钱的时代,降低搜索时间成本,迅速找到目标产品具有重要意义。如今的电商平台已不仅仅是一个摆放商品的货架,“智能推荐”成为电商的一个重要功能。今天,我们来看看强化学习是如何帮助用户与平台实现互动,让用户在商品的海洋中迅速找到心仪的“它”。
小叽导读:国际支付是指在国际经济活动中的当事人以一定的支付工具和方式,清偿因各种经济活动而产生的国际债权债务的行为。在支付中,如果伪造、冒用他人的卡进行支付或者用自己的信用卡进行恶意透支,就构成了欺诈。
在今年的拉动手淘用户增长战略中,支付宝小程序作为日活2亿同时包含大量手淘新用户的场景,在拉新中承担着十分重要的作用。我们的目标人群是将用户转化为淘宝用户,阿里工程师是用什么方法完成这样的转化呢?今天的文章,马上为你揭晓! 作者 | 亦汀、吴越、一尘、理欣 一、背景 “支付宝拉新”依托“绿洲”营销算法平台,精选淘抢购、天天特价、聚划算等营销商品,在支付宝首页进行个性化投放,旨在给支付宝用户一个非常好的购物初体验,进而引导用户安装手淘app体验更多精彩。
在线推荐服务根据商品的特征和用户的信息推荐多个商品。 现如今很大比例的用户通过手机访问电商平台。 但是一些推荐的商品并没有被用户看到。为了解决在线推荐场景中的伪曝光问题并提高推荐商品的CTR,我们首次尝试了bandit框架,并且在传统的bandit算法上进行了多项改进,取得了不错的效果。
阿里小蜜是2015年阿里发布的一款智能客服机器人。2017年双11期间,阿里小蜜的服务量达到643万,其中智能解决率达到95%,占整体服务量的95%。经过近几年的发展,能否更进一步解决智能客服机器人的压力成为当前我们思考的问题。
复杂的深度模型中,如果效果不好,是因为网络设计的欠缺?还是数据天然缺陷?是训练代码的bug?还是Tensorflow自身的问题?基于此,阿里工程师推出了DeepInsight深度学习质量平台,致力于解决当前模型调试和问题定位等一系列问题。
闲鱼是一款闲置物品的交易平台APP。通过这个平台,全国各地“无处安放”的物品能够轻松实现流动。这种分享经济业务形态被越来越多的人所接受,也进一步实现了低碳生活的目标。 今天,闲鱼团队就商品与商圈的匹配算法为我们展开详细解读。
提到调度,大家脑海中可能想起的是调度阿里云的海量机器资源,而对于阿里集团客户体验事业群(CCO)而言,我们要调度的不是机器,而是客服资源。今天,我们邀请阿里高级技术专家力君,为大家分享自动、智能的客服调度系统——XSigma。
类目-属性项-属性值体系(简称CPV)是淘宝建设中非常重要的基石,在商品的发布、管理,以及搜索场景下都大量应用。比如每个商品都有自己的类目、以及属性,而且需要发布在适合自己的类目下,才能够方便管理和搜索;在用户搜索的过程中,对Query的类目预测也是相关性中非常重要的一环。
搜索排序的传统方法是通过各种方法对商品进行打分,最后按照每个商品的分数进行排序。 针对传统搜索排序方法的缺陷,本文首次提出了考虑商品间相互影响的全局排序方法。本篇内容已被国际人工智能联合会议(IJCAI)收录,下面,我们一起来共同探讨。
双十一是网购的狂欢节,每到大促的时候,平台就会发放数量不少,金额不同的优惠券给用户带来实惠,比如今年就有满400减50的优惠券等。满减常常会涉及到凑单这个环节,如何用凑单撬动更多的成交,让买家拥有更好的线上购物体验,下面,搜索事业部的算法专家云志将为我们详细解读。
本篇文章全面阐述了“机器阅读理解综述及在电商领域的探索”主题,总字数近五千字,预计需要10分钟左右的阅读时间。推荐对深度学习、大数据、自然语言处理感兴趣的童鞋收藏。
在高风险分类(例如:高死亡率疾病监测、自动驾驶等场景)中控制假阳性率是非常重要的,由算法得出的结果将对个人产生巨大的影响。遗漏一名潜在病人的风险,远远高于误诊一名正常人。因此,我们希望在保证分类器假阳性率(即错误地将负样本分类为正样本的概率) 低于某个阈值 τ 的前提下,最小化其误分正样本的概率。
深度网络对机器学习研究和应用领域产生了巨大的影响,与此同时却无法很清晰地解释神经网络的来龙去脉。迄今为止,深度学习不够透明,神经网络整体看来仍然是一个黑箱。因此,人们一直致力于更透彻地去理解其中复杂的过程,从而达到进一步优化的目的。
淘系购物平台主要依靠淘宝达人撰写商品推荐文案以吸引买家,但这项工作需要高昂的人力成本,且对于同一件商品,无法为偏好不同属性的买家创作有针对性的推荐文案。
电商平台中,商品标题是用户认知商品的第一渠道。为了更好地描述商品属性,吸引买家注意,商家往往会在标题中堆砌大量冗余词,导致标题过长无法完整展示,给APP端用户带来不好的体验。如何在不影响商品成交转化率的前提下,将长标题变成短标题?本文将带你找到答案。
命名实体识别是自然语言处理的一个重要问题,指的是在文本中识别出特定意义的实体,包括识别出人名、地名等专有名词。为了能用较低的成本获取新的标注数据,我们采用众包标注的方法来完成这个任务。如何让众包标注提高中文命名实体识别的正确率是我们要解决的问题,下面的文章将会带领我们一步一步找到答案。
信息抽取主要解决从海量文本中快速、准确地抽取出需求信息。关系抽取是信息抽取的关键技术之一,主要任务是从文本中识别出实体,并抽取实体间语义关系。把句法信息加入到实体的表示模型里是本文的创新之处和研究重点,下面,我们一起深入了解。
我们提出了一种基于深度前馈序列记忆网络的语音合成系统。该系统在达到与基于双向长短时记忆单元的语音合成系统一致的主观听感的同时,模型大小只有后者的四分之一,且合成速度是后者的四倍,非常适合于对内存占用和计算效率非常敏感的端上产品环境。
情感识别(即,识别开心,忧伤等)现在愈来愈受到人们的关注,因为它可以提升人机交互界面的用户体验,进而提升产品的用户粘性,并在心理医疗健康方面等具有独特价值。基于语音的情感识别尤其具有现实意义,因为基于语音的人机交互界面具有相对较低的硬件要求。
本研究我们提出了一种改进的前馈序列记忆神经网络结构,称之为深层前馈序列记忆神经网络(DFSMN)。进一步地我们将深层前馈序列记忆神经网络和低帧率(LFR)技术相结合构建了LFR-DFSMN语音识别声学模型。
长短期记忆网络(LSTM)隐含了这样一个假设,本层的现时状态依赖于前一时刻的状态。这种“一步”的时间依赖性,可能会限制LSTM对于序列信号动态特性的建模。本篇论文中,针对这样的一个问题,我们提出了高级长短期记忆网络(advancedLSTM (A-LSTM)),利用线性组合,将若干时间点的本层状态都结合起来,以打破传统LSTM的这种局限性。
语音合成的主要目的是让机器将文字变为人可以听得懂的声音。针对某个人,如果希望机器比较好地发出他的声音,那么需要录制这个人大量(几千到几万句话不等)的音频。很多时候,用户没有时间也没有精力录制这么多的音频。
IEEE CVPR-18是计算机视觉领域最具影响力之一的学术会议。本次会议阿里巴巴有18篇优秀论文被收录,本篇就是其中之一。本文讨论了场景分割问题,场景分割需要进行像素级别的分类,上下文语境和多尺度特征融合对实现更好的场景分割至关重要。
本篇论文收录于ACM MM 2017,论文中我们为城市大脑提供监控交通异常的方法。受动作识别等领域的最新研究成果启发,设计了一种时空自编码进行视频异常检测,同时提出一种权重递减的预测误差计算方法。经真实的交通场景评测,该算法在重要指标上已经超过了此前的最好方法。
行人重识别是指给定一个摄像头下某个行人的图片,在其他摄像头对应的图片中准确地找到同一个人。行人重识别技术有十分重要的科研和实际应用价值,近来广泛应用到交通、安防等领域,对于创建平安城市、智慧城市具有重要的意义。
视觉-文本跨模态检索已经成为计算机视觉和自然语言处理领域结合的一个热点。对于跨模态检索而言,如何学到合适的特征表达非常关键。本文提出了一种基于生成模型的跨模态检索方法,该方法可以学习跨模态数据的高层次特征相似性,以及目标模态上的局部相似性。
在实际应用中,我们发现城市大脑交通视频数据样本不足的问题,因此提出了一种图像生成算法。受条件对抗生成网络和风格迁移学习的启发,采用内容提取网络和风格提取网络分别从内容图片和风格图片中提取特征,将两者融合后,通过图片生成网络获得融合相应内容和风格的图片。
近年来,深度卷积神经网络(CNN)方法在单幅图像超分辨率(SISR)领域取得了非常大的进展。然而现有基于CNN的SISR方法主要假设低分辨率(LR)图像由高分辨率(HR)图像经过双三次(bicubic)降采样得到,因此当真实图像的退化过程不遵循该假设时,其超分辨结果会非常差。
以CNN为代表的深度神经网络作为通用的函数映射关系拟合器在对图像数据的处理中展现了广泛的优越性。本工作针对图像到图像的转换问题,利用图像的尺度空间(scale space),设计了一个基于图像尺度空间分解的通用神经网络,刷新了图像分解问题在标准数据集上的测试性能,并可见用于深度重建和像素标记等常见视觉问题。
在线行为预测指的是当一个动作还未执行完之前,算法使用已经观测到的这些片段来预测该动作的类别。这个问题有几个关键点:首先,它是“在线”的,这表示算法得足够快,以实现在线应用;其次,算法需要在动作发生的早期(比如只完成了10%)便进行类别预测;此外,算法处理的是未分割的视频,这意味着视频可能包含多个动作实例,比如下图的视频序列就包含了多个动作。
从电影、电视到电脑、手机,人们获取视频信息的方式越来越方便、快捷。时下较热门的视频通话、互动直播时长占据了当下年轻人很大一部分的生活时间,可见实时视频技术在生活中的重要性。今天,蚂蚁金服高级技术专家樟松将为我们揭秘“蚂蚁实时视频通话系统”的技术架构及特点,讲述实时视频通话的底层技术以及其运用。
2019年2月1日,上海社会科学院智库研究中心发布《2018年中国智库影响力评价与排名》。阿里研究院入围三项排名榜单,位居企业智库系统影响力榜单第2位,中国智库社会影响力榜单第13位,中国智库综合影响力排名榜单第42位。
导语:读一本意义方长的书,能加深我们的理解能力,让灵魂感到冲突。“读书百遍,其义自现”。每次读书,都能秒趣横生,并从中得到可贵的知识。我们整理出2019年2月值得一读的十本技术书籍,其中涉及Python、算法、设计、历史等方面。这个春天就让书陪你度过吧。
很多小伙伴在后台发信息,表示一天一篇技术干货看不过瘾
PostgreSQL: 线上直播: 直播主题:PostgreSQL多场景阿里云沙箱实验(第9讲):PostgreSQL 时空业务实践直播回顾: https://yq.aliyun.com/live/794讲师:德哥 — 阿里云数据库专家,PostgreSQL中国社区校长学习资料:https://yq.
今天是个粉红色日子,我们来聊聊和技术无关的“技术活”
37岁的黄文静来自武汉,从小身患先天性脑瘫,说话口齿不清,四肢活动不便,但凭借坚强乐观的心态克服重重困难,成为一名设计师,开起了淘宝店。2018年8月,她还荣获湖北省残疾人岗位精英职业技能选拔赛电子商务项目一等奖,在当地传为佳话。
新的一年,相信很多产品技术团队把研发效能提升列为重要的目标,甚至还有团队为此专门成立了项目组。然而,到底什么是好的研发效能,却很少有人能够表达清楚。标准不清晰,又何谈提升?
每一次语言或框架的革命都是冰与火的较量,血与泪的洗礼。笔者出道不早不晚,经历了轰轰烈烈的 EJB 时代。
2018年云攻略十二篇精选文章等你来撩
从美国常春藤名校毕业后,同学们都去了华尔街,周宇翔却在机缘巧合下进入工业物联网行业。创业4年来,他经历过闭门造车项目失败的痛苦,痛定思痛后也曾下到车间与工人同吃同住,最终找准行业痛点,研发出黑湖智造协同系统。
大年初七,话说今天叫醒你的除了闹钟,还有梦~想~和~红~包,对吧!像橙子我,早早到了园区,为啥,阿里老传统——开~门~红!抢~个~好~彩~头~呀~
年底了,橙子在内网里发起了一个话题, 想带大家一起,通过手机里的一张照片,梳理过去一年。