开源代码上新!6 份最新「Paper + Code」 | PaperDaily #17

简介:


[ 自然语言处理 ]


DuReader: a Chinese Machine Reading Comprehension Dataset from Real-world Applications
@zhangjun 推荐
6

大型中文阅读理解数据集,工作来自百度。

论文链接
https://www.paperweekly.site/papers/1137
代码链接
https://github.com/baidu/DuReader


TransNets - Learning to Transform for Recommendation
@ccclyu 推荐
5

引入了迁移学习的隐含表示层来减少 test dataset 的稀疏性。

论文链接
https://www.paperweekly.site/papers/1181
代码链接
https://github.com/rosecatherinek/TransNets


[ 计算机视觉 ]


Co-attending Free-form Regions and Detections with Multi-modal Multiplicative Feature Embedding for Visual Question Answering
@xiaolu 推荐
4

视觉问答任务(Viual Question Answering)是最近 2-3 年兴起的多模态任务。对于视觉问答任务,算法需要同时理解图片内容和语言信息,然后推理出正确的答案。目前常见的方法有多模态特征融合和以及视觉注意力机制。

已有的注意力机制主要有两类,一类是基于全图区域的注意力机制,一类是基于检测框区域的注意力机制,前者容易关注到物体的一部分,后者会缺少一些检测框。

本文第一次尝试将基于全图区域的与基于检测框区域的注意力机制融合在一个框架下,充分利用全图区域和检测框之间的互补信息;并且提出新的多模态特征融合方法,将问题特征、全图特征、检测框特征进行有效的融合。模型在 VQA 和 COCO-QA 两个主流数据集上实现了目前最好的结果。

论文链接
https://www.paperweekly.site/papers/1175
代码链接
https://github.com/lupantech/dual-mfa-vqa


Image Crowd Counting Using Convolutional Neural Network and Markov Random Field
@cornicione 推荐
3

文章融合了 MRF 和 deep 网络,提出了一种统计静态图片中人数的方法。

论文链接
https://www.paperweekly.site/papers/1195
代码链接
https://github.com/hankong/crowd-counting


[ 机器学习 ]


Social Attention - Modeling Attention in Human Crowds
@zk5580752 推荐
2

本文是一篇基于 Social LSTM 的后续论文,Social LSTM 是李飞飞团队于 2016 年提出的行人路径预测方法。本文则在原文基础上改进了预测方式,不仅仅基于 RNN 模型,还引入了 Attention Model,使得预测更加精准和全面。

论文链接
https://www.paperweekly.site/papers/1115
代码链接
https://github.com/vvanirudh/social-lstm-tf


Breaking the Softmax Bottleneck: A High-Rank RNN Language Model
@paperweekly 推荐
1

本文尝试改进了语言模型在预测 next token 时用 softmax 遇到的计算瓶颈。

论文链接
https://www.paperweekly.site/papers/1112
代码链接
https://github.com/zihangdai/mos

原文发布时间为:2017-11-23
本文来自云栖社区合作伙伴“PaperWeekly”,了解相关信息可以关注“PaperWeekly”微信公众号

相关文章
|
Linux 图形学 Windows
Linux(入门)---001.desktop文件教程
Linux(入门)---001.desktop文件教程
1126 1
|
7月前
|
程序员
程序员自设置的喝水闹钟程序,助力身体健康
长时间对着电脑、忙于工作或带娃,常常忘记喝水?Aipy 提醒喝水小工具,每45分钟弹出可爱提示,持续30秒无法关闭,强制提醒你补水,让喝水变得有趣又有仪式感!
|
6月前
|
编解码 C++ 异构计算
无法启动 DirectX 服务,Access denied 无法加载 DirectX 组件,DirectX 诊断工具无法初始化”(运行 dxdiag 时)
无法启动 DirectX 服务,Access denied 无法加载 DirectX 组件,DirectX 诊断工具无法初始化”(运行 dxdiag 时)
1145 1
|
机器学习/深度学习 人工智能 自然语言处理
VideoGrain:零样本多粒度视频编辑神器,用AI完成换装改场景,精准控制每一帧!
VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架,基于调节时空交叉注意力和自注意力机制,实现类别级、实例级和部件级的精细视频修改,保持时间一致性,显著优于现有方法。
659 0
VideoGrain:零样本多粒度视频编辑神器,用AI完成换装改场景,精准控制每一帧!
|
前端开发 JavaScript Java
Java与JavaScript的区别与联系:有人的地方就有江湖,有浏览器的地方就有JavaScript
Java与JavaScript的区别与联系:有人的地方就有江湖,有浏览器的地方就有JavaScript
1118 0
|
存储 安全 Java
如何确保 JNDI 配置的正确性
JNDI(Java Naming and Directory Interface)配置的正确性对于应用程序的稳定运行至关重要。确保 JNDI 配置正确的方法包括:仔细检查配置文件中的语法和路径,使用测试环境进行验证,以及启用日志记录以捕获潜在错误。
339 6
|
JavaScript Shell Docker
|
弹性计算 负载均衡 Kubernetes
人人租机上云案例
我们是线上租赁,面临高成本高流失等问题,阿里小程序为我们赋能
2036 89
|
数据可视化 Python
Python办公自动化【合并单元格-openpyxl、增加图表-openpyxl、合并工作薄-openpyxl、合并多个文件工作薄-openpyxl】(三)-全面详解(学习总结---从入门到深化)
Python办公自动化【合并单元格-openpyxl、增加图表-openpyxl、合并工作薄-openpyxl、合并多个文件工作薄-openpyxl】(三)-全面详解(学习总结---从入门到深化)
529 0
|
消息中间件 缓存
RabbitMQ如何设置消息过期 ?
在 RabbitMQ 中,可以通过设置消息的 TTL(Time-To-Live,存活时间)来实现消息的过期控制。
1099 0