深度学习模型实战-深度学习模型在各大公司实际生产环境的应用讲解文章

简介: 建这个仓库的是因为工作之后发现生产环境中应用的模型需要做到速度和效果的平衡,并不是越复杂越好。所以一味的追求新的模型效果不大(并不是不追,也要多看新东西)。学到模型最终是要用,而且要用好,于是就建了这么个仓库,积累一下深度学习模型在各个公司中的应用以及细节,这样在自己工作中可以做到借鉴。主要是罗列一些各大公司分享的文章,涉及到搜索/推荐/自然语言处理(NLP),持续更新...仓库地址:https://github.com/DA-southampton/Tech_Aarticle/edit/master/README.md

最近更新文章


因为下面的文章是按照领域划分的,顺序是按照我自己觉得不错的文章在前面,所以担心我最近更新的理解的文章大家看不到,所以单开一个版块,把最近读的文章迭代列出来,保持五篇吧。


最近更新文章 简单介绍 进度(粗度/精读)
精读-Embedding技术在民宿推荐中的应用-原文发表时间201907 使用item2vec对app内房源进行embding,然后进行推荐,细节比较多,包括训练细节,数据构造细节等等,推荐看一看,我自己有精读,大家可以对照着看一看 精读完成
精读-ALBERT在房产领域的实践-原文发表时间202005 讲的是贝壳用ALbert做意图分类,和Fasttext相比,提了大概8个点,推理速度耗时20ms 精读完成


部署



在我实际工作中,一般来说部署就是Flask+负载均衡,或者Grpc来提供服务。这个模块积累一下我看到不错的模型部署不错的文章


部署领域相关文章 简单介绍 进度(粗读/精读)
蘑菇街自研服务框架如何提升在线推理效率? 使用协程解决并发问题,使用FLask提供Restful接口,进行容器化部署
如何解决推荐系统工程难题——深度学习推荐模型线上serving? 介绍了几种serving方式,值得一看
爱奇艺基于CPU的深度学习推理服务优化实践-201904 爱奇艺主要是在算法,应用以及系统三个方面对模型的部署进行优化。系统级主要是针对硬件平台上做的一些性能优化的方法,应用级是跟特定应用相关的分析以及优化的方法,算法级是针对算法的优化,例如模型的裁剪,模型的量化,在四个任务上提升了10倍左右(引自原文)


搜索:


搜索领域文章 简单介绍 进度(粗读/精读)
Albert在房产领域的应用-202005 讲的是贝壳用ALbert做意图分类,和Fasttext相比,提了大概8个点,推理速度耗时20ms 精读完成
DSSM文本匹配模型在苏宁商品语义召回上的应用-201909 详细介绍了DSSM模型在苏宁召回的使用,细节很多,居然还点出用的hanlp做的分词(也太细了吧),推荐大家看看
Transformer在美团搜索排序中的实践-202004 (引用文中原句)本文旨在分享 Transformer 在美团搜索排序上的实践经验。内容会分为以下三个部分:第一部分对 Transformer 进行简单介绍,第二部分会介绍 Transfomer 在美团搜索排序上的应用以及实践经验,最后一部分是总结与展望。希望能对大家有所帮助和启发。
深度学习在文本领域的应用-201808 美团的文章,主要是讲了基于深度学习的的文本匹配和排序模型。其中讲了DSSM和变种,引申出来美团自己的ClickNet,基于美团场景进行了优化,大家可以细看一下
基于BERT,神马搜索在线预测性能如何提升?-201908 讲了一下在神马搜索中bert的性能优化细节,大致就是使用了知乎的cuBert,然后重写了预测逻辑
阿里文娱搜索算法实践与思考-202006 (引用文中原句)本文将以优酷为例,分享视频搜索的算法实践,首先介绍优酷搜索的相关业务和搜索算法体系,从搜索相关性和排序算法的特点和挑战到技术实践方案的落地,最后会深入介绍优酷在多模态视频搜索上的探索和实践。
视频搜索太难了!阿里文娱多模态搜索算法实践-202005 对比上一个看
XGBoost在携程搜索排序中的应用-201912 如题
爱奇艺搜索排序模型迭代之路-201909 如题
滴滴搜索系统的深度学习演进之路-201908 如题
深度学习在 360 搜索广告 NLP 任务中的应用-201907 本文作者比对了DSSM 和 ESIM 以及Bert三种模型,介绍了三种模型在实际工作中的应用细节
小米移动搜索中的 AI 技术-201906 大概讲了一下搜索中用的技术,比如文本相似度-dssm,具体的看文章吧
深度学习在搜索业务中的探索与实践-美团-201901 (引用文中原句)本文会首先介绍一下酒店搜索的业务特点,作为O2O搜索的一种,酒店搜索和传统的搜索排序相比存在很大的不同。第二部分介绍深度学习在酒店搜索NLP中的应用。第三部分会介绍深度排序模型在酒店搜索的演进路线,因为酒店业务的特点和历史原因,美团酒店搜索的模型演进路线可能跟大部分公司都不太一样。最后一部分是总结。
深度学习在搜狗无线搜索广告中的应用-201803 (引用文中原句)本次分享主要介绍深度学习在搜狗无线搜索广告中有哪些应用场景,以及分享了我们的一些成果,重点讲解了如何实现基于多模型融合的CTR预估,以及模型效果如何评估,最后和大家探讨DL、CTR 预估的特点及未来的一些方向。
百度中文纠错技术 主要讲了中文纠错技术,接下来会重点精读中文纠错方面的。
达观数据搜索引擎的Query自动纠错技术和架构详解
搜索中的 Query 理解及应用
搜索中的Query扩展技术
京东电商搜索中的语义检索与商品排序
搜索相关性算法在 DiDi Food 中的探索
滴滴搜索系统的深度学习演进之路
说一说视频搜索


推荐:


推荐领域文章 简单介绍 进度(粗度/精读)
Embedding 技术在民宿推荐中的应用-201907 使用item2vec对app内房源进行embding,然后进行推荐,细节比较多,包括训练细节,数据构造细节等等,推荐看一看,我自己有精读,大家可以对照着看一看 精读完成
双 DNN 排序模型:在线知识蒸馏在爱奇艺推荐的实践-202002 还没看。。但是看文章写得效果很厉害,“其中,在爱奇艺短视频场景时长指标 +6.5%,点击率指标 +2.3%;图文推荐场景时长指标 +4.5%,点击率指标 +14% ”(引用自原文)
美团BERT的探索和实践-201911 Bert在美团场景中的改进和优化,很厉害,细节很多
wide&deep 在贝壳推荐场景的实践-201912 如题,看了之后感觉还不错,
贝壳找房的深度学习模型迭代及算法优化-201910 (引用文中原句)第一阶段:建立初版模型系统,采用 XGBoost 模型,完成项目从 0 到 1 的过程; 第二阶段:深度学习模型,采用 DNN+RNN 混合模型; 第三阶段:效果持续优化,也是业务需要。
千人千面营销系统在携程金融支付的实践 (引自原文)支付中心数据组开发的一套用户精准营销系统
爱奇艺个性化推荐排序实践-201907 还没看
强化学习在携程酒店推荐排序中的应用探索 (引用原文)我们尝试在城市欢迎度排序场景中引入了强化学习。通过实验发现,增加强化学习后,能够在一定程度上提高排序的质量。
搜狗信息流推荐算法实践-201904 还没看。。。
深度学习在美团点评推荐业务中实践-201901 (引用文中原句)在推荐平台的构建过程中,多策略选品和排序是两个非常重要的部分,本文接下来主要介绍深度学习相关的推荐算法,主要包括 DSSM、Session Based RNN 推荐召回模型与 Wide Deep Learning 的排序模型,我们会介绍深度学习模型在推荐业务应用及实现的相关细节,包括模型原理、线上效果、实践经验及思考。
美团“猜你喜欢”深度学习排序模型实践-201803 (引用文中原句)目前,深度学习模型凭借其强大的表达能力和灵活的网络结构在诸多领域取得了重大突破,美团平台拥有海量的用户与商家数据,以及丰富的产品使用场景,也为深度学习的应用提供了必要的条件。本文将主要介绍深度学习模型在美团平台推荐排序场景下的应用和探索。
优酷视频基于用户兴趣个性化推荐的挑战和实践-201802 简单介绍:(引用文中原句)本文将介绍一下优酷个性化搜索推荐的服务,优酷在视频个性化搜索推荐里用户兴趣个性化表达碰到的挑战和问题,当前工业界常用的方法,以及我们针对这些问题的尝试。
深度学习在58同城智能推荐系统中的应用实践-201802
携程个性化推荐算法实践-201801
深度学习在美团点评推荐平台排序中的运用-201707
Embedding技术在房产推荐中的应用
智能推荐算法在直播场景中的应用--花椒推荐系统


多模态:



多模态相关文章 简单介绍 进度(粗读/精读)
爱奇艺短视频分类技术解析 全文重点在三个,一个是爱奇艺视频分类体系,一个是层次表示模块,一个是特征模块,介绍的比较详细,需要精读一下
爱奇艺短视频质量评估模型 介绍封面文本视频内容质量评分,大概读一下就可以
阿里文娱多模态视频分类算法中的特征改进 主要介绍类目体系构建介绍,模型特征调优,模型调优,值得精读一下
爱奇艺短视频软色情识别技术解析 很细致,看一下
优酷在多模态内容理解上的研究及应用 主要是一些多模态概念的讲解,干货不多,大概看一下就可以
多模态商品分类解决方案-深度学习在真实NAVER购物网站的应用 细节点比较多,偏实战,精读一下
FashionBERT 电商领域多模态研究:如何做图文拟合?
阿里文娱搜索算法实践与思考
NLP 技术在微博 feed 流中的应用
5G 时代下:多模态理解做不到位注定要掉队
短视频数据补充1补充2
UC信息流视频标签识别技术
技术动态-多模态学习调研 (附完整PPT)
多模态情感分析简述


NLP其他领域:



2020303


搜素


搜索中的 Query 理解及应用

https://mp.weixin.qq.com/s/rZMtsbMuyGwcy2KU7mzZhQ


搜索中的Query扩展技术

https://mp.weixin.qq.com/s/WRVwKaWvY-j-bkjxCprckQ


京东电商搜索中的语义检索与商品排序

https://mp.weixin.qq.com/s/4UBehc0eikVqcsFP7xL_Zw


机器学习在高德搜索建议中的应用优化实践

https://mp.weixin.qq.com/s/D3qxlzZgwnMprzEVuMpmgg


再谈搜索中的Query扩展技术

https://mp.weixin.qq.com/s/q4aPtUYi27h-0sqD4bokQQ


搜索query意图识别的演进-微信AI

https://mp.weixin.qq.com/s/0Hh_iV8tNFd0eEpXSxy9nA


阿里文娱深度语义搜索相关性探索

https://mp.weixin.qq.com/s/1aNd3dxwjCKUJACSq1uF-Q


阿里文娱算法公开课#04:算法工程师的核心技能-搜索推荐篇

https://mp.weixin.qq.com/s/vgrWwSZLbl5svAcrxNuJpg


图谱


百度事件图谱技术与应用

https://mp.weixin.qq.com/s/A3uqaQcJz0UHpdgKggi_9w


知识图谱在小米的应用与探索

https://mp.weixin.qq.com/s/GbZK9U-ePx3zyUjnw8vvUA


视频


阿里文娱多模态视频分类算法中的特征改进

https://mp.weixin.qq.com/s/6kTb6r3Vj3mgQn90UsZ1nw


美团本地生活场景的短视频分析

https://mp.weixin.qq.com/s/UyMDskA0eGN-NmiifwQF6Q


爱奇艺视频精彩度分析

https://mp.weixin.qq.com/s/hDqyItDxBfJ652BI0OT4dA


推荐


美图个性化推送的 AI 探索之路

https://mp.weixin.qq.com/s/HRGk5bfaOdj-6X4opEYA-w


深度召回在招聘推荐中的挑战和实践

https://mp.weixin.qq.com/s/mcETNOICbabRRq9BBdL4zw


推荐系统 Embedding 技术实践总结

https://mp.weixin.qq.com/s/7DXVrJUU-PvKiQnipJKVtw


网易严选画像建设实践

https://mp.weixin.qq.com/s/pmovTV3TIoB6oA60pL_zeg


网易大数据用户画像实践

https://mp.weixin.qq.com/s/jyiDWiK0zczEaZKY5Hy5xg


阅文用户画像

https://mp.weixin.qq.com/s/ddRjNDBVuY03nQSGLncjtg


信息流推荐的用户增长机制

https://mp.weixin.qq.com/s/hjeS_nEsvxu0D_Bj2vJe7w


Attention机制在深度学习推荐算法中的应用

https://mp.weixin.qq.com/s/1LYyiDJBDKVgNjc7a1Qc4A


"全能选手"召回表征算法实践--网易严选

https://mp.weixin.qq.com/s/s4tNPWQrisYIiMuNUzEtNQ


360展示广告智能化演进

https://mp.weixin.qq.com/s/b7aD7yU1Ok8NZOvr3VaC2g


深度学习在商业排序的应用实践-58同城

https://mp.weixin.qq.com/s/2SRGdFZ9RVl4ljBh5MIUqQ


旅行场景下的个性化营销平台揭秘

https://mp.weixin.qq.com/s/RCtjaX3y7xa8co3GwBi2Lg


阿里飞猪个性化推荐:召回篇

https://mp.weixin.qq.com/s/323D5MFivtrmo3ISwQbpYg


因果推断在阿里文娱用户增长中的应用

https://mp.weixin.qq.com/s/oZTU7TAEf-gYzlSXdt0_BA


网易云音乐推荐中的用户行为序列深度建模

https://mp.weixin.qq.com/s/Whf0rmuVapzZAB33TUj1Ig


智能推荐算法在花椒直播中的应用

https://mp.weixin.qq.com/s/ec88cMR4K6pWyHhJs7FEFQ


58同镇下沉市场中的推荐技术实践

https://mp.weixin.qq.com/s/j6FWqkdbOdQk-qAmYNmJqQ


汽车之家推荐系统排序算法迭代之路-视频

https://mp.weixin.qq.com/s/3wAR3evFAeKfsCYJ6WLTHQ


要提升微信看一看推荐混排的长期收益?试试深度强化学习

https://mp.weixin.qq.com/s/zfVrmErz3ZaGz7Ha7qGoIw


信息流推荐在凤凰新闻的业务实践

https://mp.weixin.qq.com/s/aCTP4OCGyWxWGrlCFHSYJQ


阿里文娱算法公开课#01:算法工程师的进阶之路(校招篇)

https://mp.weixin.qq.com/s/Sc-3ktfKrRN9pwIZsibXJw


知识图谱辅助的个性化推荐系统

https://mp.weixin.qq.com/s/VqmxV_JJN61QgESQDPi93Q


广告算法在阿里文娱用户增长中的实践

https://mp.weixin.qq.com/s/NVQPv5ua9kxw1MK8UVQcuQ


向量体系(Embedding)在严选的落地实践

https://mp.weixin.qq.com/s/NJDfrGJgIE2KK_t-yJ-C9Q


NLP


腾讯信息流内容理解技术实践

https://mp.weixin.qq.com/s?__biz=MzU1NTMyOTI4Mw==&mid=2247495622&idx=1&sn=3d229e34dfe061b61bb47b4677def6a0&chksm=fbd75daacca0d4bc83d02b78b7d7c8485521eba07a03553db52ba039f3d948835f3d750a301e&scene=21#wechat_redirect


微信"看一看"内容理解与推荐

https://mp.weixin.qq.com/s/vr9bKEXI5o6L3FYig4HgNA


优酷视频元素内容召回系统:多级多模态引擎探索 | 禅与文科生实用技术

https://mp.weixin.qq.com/s/MTi_fzCA_wUR640CwWeLMg


网易严选nlp-预训练语言模型的应用

https://mp.weixin.qq.com/s/hUbMbmEtLB7L0_H4DGc8Ew


深度学习在网易严选智能客服中的应用

https://mp.weixin.qq.com/s/SPtNy_1_6fiFXKukMmVPlA


严选智能客服业务知识库自动挖掘方案

https://mp.weixin.qq.com/s/AyaDkbKYhdRbc-uvFHNv4w


文本增强技术的研究进展及应用实践

https://mp.weixin.qq.com/s/CHSDi2LpDOLMjWOLXlvSAg


通用的图像-文本语言表征学习:多模态预训练模型 UNITER

https://mp.weixin.qq.com/s/GxQ27vY5naaAXtp_ZTV0ZA


NLP 中的实体关系抽取方法总结

https://mp.weixin.qq.com/s/gbGZDbi7XcExgHcUqiI94w


NLP技术在金融资管领域的落地实践-视频

https://mp.weixin.qq.com/s/tQou1whJrvMY8iGxBB3_TQ


情感分析在阿里小蜜中的应用

https://mp.weixin.qq.com/s/k-gS6k3-hy-ZI_r901IGvg


任务式对话中的自然语言理解

https://mp.weixin.qq.com/s/z06l-s3RUomxlhANz8SfUg


腾讯信息流热点挖掘技术实践

https://mp.weixin.qq.com/s/keSYVCS0k3rvngGvcsJKbA


医疗健康领域的短文本理解-丁香园

https://mp.weixin.qq.com/s/CNBP5xSvr4Y3Xm1-NMS79g


Seq2seq框架下的文本生成-丁香园

https://mp.weixin.qq.com/s/NAPIUtTD7ZEAIEgoJeQM4A


基于BERT的ASR纠错

https://mp.weixin.qq.com/s/JyXN9eukS-5XKvcJORTobg


跨域推荐技术在58部落内容社区的实践

https://mp.weixin.qq.com/s/YylA34cBEshzb9sFY0gklw


NLPCC:预训练在小米的推理优化落地

https://mp.weixin.qq.com/s/itOyETgKBoRHOrIfKuphrw


爱奇艺深度语义表示学习的探索与实践

https://mp.weixin.qq.com/s/f524bPx0pq7qxXGjpa7WCQ


百度语义解析 ( Text-to-SQL ) 技术研究及应用

https://mp.weixin.qq.com/s/2ub1qbLF7cRGE_E0TsSB4g


大规模预训练模型在阿里机器翻译中的应用

https://mp.weixin.qq.com/s/phPU0SDcTQ6l1fnZi2Hy-Q


热点挖掘技术在微信看一看中的应用

https://mp.weixin.qq.com/s/oMNy-g2DxUnsGErefQBkyg


诸葛越:关于算法工程师职业发展的思考

https://mp.weixin.qq.com/s/mV-oXdWRe3Jcs9OJnXbEbw

相关文章
|
18小时前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习在自然语言处理中的应用与挑战
【6月更文挑战第22天】本文旨在探讨深度学习技术在自然语言处理(NLP)领域的应用及其面临的主要挑战。通过分析深度学习模型如循环神经网络(RNN)、长短时记忆网络(LSTM)和Transformer架构,本文揭示了这些模型如何革新了语言理解、机器翻译、情感分析和文本生成等任务。同时,本文也指出了深度学习在处理语言的复杂性、数据偏差、资源需求以及可解释性方面遇到的挑战,并讨论了未来研究的潜在方向。
9 3
|
1天前
|
机器学习/深度学习 自然语言处理 数据处理
深度学习在自然语言处理中的应用与挑战
【6月更文挑战第21天】随着人工智能技术的飞速发展,深度学习已成为自然语言处理(NLP)领域的核心技术之一。本文将探讨深度学习技术如何革新NLP领域,包括语言模型的进步、机器翻译的突破以及情感分析的精细化。同时,我们将指出当前面临的主要挑战,如数据偏差问题、模型解释性不足以及资源消耗问题,并提出可能的解决方向。
|
1天前
|
机器学习/深度学习 人工智能 算法
探索深度学习在图像识别中的应用
【6月更文挑战第21天】本文深入探讨了深度学习技术,特别是卷积神经网络(CNN)在图像识别领域的应用。文章首先介绍了深度学习的基础知识,然后详细解析了卷积神经网络的结构和工作原理,最后通过案例分析展示了深度学习在图像识别中的实际效果和潜力。
|
1天前
|
机器学习/深度学习 算法 数据安全/隐私保护
深度学习在医疗影像分析中的应用与挑战
【6月更文挑战第21天】随着人工智能技术的飞速发展,深度学习已成为推动医学影像分析进步的关键力量。本文将探讨深度学习技术如何革新医疗影像的诊断流程,包括自动化病变检测、图像分割以及疾病预测等方面。同时,我们将讨论实施这些技术时遇到的伦理和法律问题。
|
2天前
|
机器学习/深度学习 算法 自动驾驶
深度学习在图像识别中的应用与挑战
【6月更文挑战第20天】随着人工智能技术的迅速发展,深度学习已成为推动图像识别技术革新的核心力量。本文将深入探讨深度学习在图像识别领域的应用现状、面临的主要挑战以及未来的发展方向。通过分析深度学习模型如卷积神经网络(CNN)的工作原理及其在图像处理中的优势,揭示其在自动驾驶、医疗诊断等领域的应用实例。同时,文章也将指出数据偏差、算法透明度不足等挑战,并讨论如何通过技术创新和合作来解决这些问题,以期为该领域的研究者和实践者提供参考和启示。
10 3
|
2天前
|
机器学习/深度学习 人工智能 计算机视觉
深度学习在图像识别中的应用与挑战
【6月更文挑战第20天】随着人工智能的迅速发展,深度学习已成为图像识别领域的核心技术。本文将探讨深度学习在图像识别中的应用,包括卷积神经网络(CNN)的原理和结构,以及深度学习在图像分类、目标检测和语义分割等方面的应用。同时,我们也将讨论深度学习在图像识别中面临的挑战,如数据不平衡、模型泛化能力和计算资源限制等问题。最后,我们将展望深度学习在图像识别领域的未来发展趋势。
|
2天前
|
机器学习/深度学习 自动驾驶 安全
基于深度学习的图像识别技术在自动驾驶汽车中的应用
【5月更文挑战第52天】 随着人工智能技术的飞速发展,特别是深度学习在图像处理和模式识别领域取得的突破性进展,自动驾驶汽车技术迎来了前所未有的发展机遇。本文旨在探讨基于深度学习的图像识别技术如何赋能自动驾驶系统,提升其在复杂交通环境中的感知能力、决策效率和安全性。通过对当前主流的深度学习模型进行分析,并结合最新的研究成果,文章详细阐述了卷积神经网络(CNN)在车辆检测、行人识别和路标理解等方面的应用实例,同时指出了现有技术的局限性和未来可能的发展趋势。
|
2天前
|
机器学习/深度学习 自然语言处理 自动驾驶
深度学习应用领域有哪些?
深度学习在各种领域中都有广泛的应用,它的强大特性使其能够处理大量复杂的数据并进行高级的模式识别,从而改进了各种任务的性能和效率。
15 3
|
2天前
|
机器学习/深度学习 人工智能 算法
深度学习在医疗影像分析中的创新应用
【6月更文挑战第20天】随着人工智能的迅猛发展,深度学习技术在医疗影像分析领域展现出了前所未有的潜力。本文将深入探讨深度学习如何革新传统的医疗影像处理流程,包括图像分类、检测和分割等任务。我们将介绍一些最新的研究成果,展示深度学习模型如何助力医生进行更快速、更准确的诊断,并讨论这一技术面临的挑战与未来的发展方向。
14 3
|
3天前
|
机器学习/深度学习 算法 PyTorch
深度学习分布式模型
深度学习分布式模型