备案控制台

开发者社区大数据与机器学习文章正文

2024年1月论文推荐

2024-01-21 94

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

检索分析服务 Elasticsearch 版，2核4GB开发者规格 1个月

实时数仓Hologres，5000CU*H 100GB 3个月

实时计算 Flink 版，5000CU*H 3个月

简介： 2024年1月论文推荐

Mixtral of Experts

https://arxiv.org/abs/2401.04088

Mistral开发的Mixtral 8x7B模型集成了一个Sparse mix -of- experts (SMoE)架构，在每层中有8个专门的块，通过路由为每个标记令牌选择两个专家来进行专门处理。但它总共访问470亿个参数，但是令牌在每个时间步只与两个专家交互，所以在推理期间主动使用参数为130亿个。

MoE-Mamba

https://arxiv.org/abs/2401.04081

混合专家的Mamba。MoE- mamba是一种选择性状态空间模型，它结合了混合专家(MoE)来提高效率。它以2.2倍的计算步骤实现了与Mamba模型相同的性能，同时保持了快速的推理。并且MoE-Mamba的性能优于原始Mamba和MoE的Transformer模型。

How to guess a gradient

https://arxiv.org/abs/2312.04709.
神经网络梯度显示基于网络结构和特征的可预测模式。这些模式可以通过架构约束的梯度子空间来估计，潜在地提高了复杂网络中无梯度优化的效率。这是一篇很有意思的论文

MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation

https://magicvideov2.github.io/

字节的MagicVideo-V2它利用文本到图像模型、运动生成、参考图像合成和帧插值来创建高分辨率、视觉上吸引人的流畅视频内容。

Learning to Prompt with Text Only Supervision for Vision-Language Models

https://muzairkhattak.github.io/ProText/

这个项目提出了一种技术来保持类似clip的视觉语言模型的泛化能力，同时使它们适应不同的任务。提示是从LLM数据中学习的，因此不需要标记图像。

A Minimaximalist Approach to Reinforcement Learning from Human Feedback

https://arxiv.org/abs/2401.04056)

Self-Play Preference Optimization(SPO)是一种比传统RLHF更简单的对齐方法。利用博弈论，研究人员能够开发出模型自己进行训练的方式，并且提供良好的性能。

Towards the Law of Capacity Gap in Distilling Language Models

https://github.com/genezc/minima

语言模型(LM)蒸馏是一个趋势领域，蒸馏的目标将大型教师模型中的知识提炼到小型学生模型中。论文将从7B教师LM(改编为LLaMA2-7B)中提炼出3B学生LM(称为MiniMA)，的流程做了详细的描述。

https://avoid.overfit.cn/post/3ca961fd21494298aac3aa6df2c3d18a

文章标签：

机器学习/深度学习

决策智能

Deephub

目录

相关文章

Deephub

|

7月前

|

机器学习/深度学习人工智能计算机视觉

2023年12月论文推荐

12月已经过了一半了，还有2周就是2024年了，我们来推荐下这两周我发现的一些好的论文，另外再推荐2篇很好的英文文章。

Deephub

175 1 1

Deephub

|

7月前

|

机器学习/深度学习传感器自动驾驶

2024年1月的论文推荐

又到月底了，在月初推荐论文的基础上又整理了10篇推荐阅读的论文

Deephub

98 2 2

Trouble..

|

算法搜索推荐数据挖掘

CollabRank论文解读

以前的方法通常对单个文档单独执行关键字短语提取任务，而不对每个文档进行交互，假设文档被视为彼此独立。

Trouble..

89 0 0

Trouble..

|

机器学习/深度学习自然语言处理算法

WikiRank论文解读

WikiRank是2018年提出来的，作者认为背景知识可以提供文档的有价值信息，但是它们很少呗应用到关键词抽取任务中来。

Trouble..

98 0 0

是Yu欸

|

机器学习/深度学习自然语言处理算法

2023无监督摘要顶会论文合集

2023无监督摘要顶会论文合集

是Yu欸

207 0 0

Trouble..

|

机器学习/深度学习编解码自然语言处理

Segmenter论文解读

图像分割通常在单个图像patch的级别上是模糊的，并且需要上下文信息来达成标签共识。本文介绍了一种用于语义分割的transformer模型——segmenter。

Trouble..

332 0 0

Trouble..

|

自然语言处理算法

EmbedRank论文解读

EmbedRank筛选关键词是通过关键词句子的嵌入和完整文档的嵌入之间的距离获得的信息量

Trouble..

140 0 0

Trouble..

|

算法数据挖掘

TopicRank论文解读

TopicRank是2013年的一种无监督关键词抽取算法，其还是一种基于图的关键词抽取算法，主要创新点在于会依赖文档的主题进行辅助辅助排序。候选关键词将以主题进行划分，被用作完整的词图节点。

Trouble..

174 0 0

Trouble..

|

自然语言处理并行计算算法

PositionRank论文解读

PositionRank是2017年提出的论文，是一种用于从学术文档中提取关键短语的无监督模型，它将单词出现的所有位置的信息合并到有偏置的PageRank中。

Trouble..

131 0 0

Trouble..

|

算法搜索推荐 Windows

ExpandRank论文解读

ExpandRank是出自北京大学2008年的老论文，其实现思想为：现有的单文档关键字短语提取方法通常只使用指定文档中包含的信息。

Trouble..

78 0 0

大数据与机器学习

热门文章

最新文章

阿里云开源离线同步工具DataX3.0介绍

数据库开放权限太危险，又不想写API。DataV给你另外一个选择。

每个人都应该知道的25个大数据术语

大数据环境下该如何优雅地设计数据分层

拍立淘-以图搜图中的图像搜索算法

ajax请求总是不成功？浏览器的同源策略和跨域问题详解

【玩转数据系列二】机器学习应用没那么难，这次教你玩心脏病预测

【技术实验】mysql准实时同步数据到Elasticsearch

数据仓库介绍与实时数仓案例

CDP与Selenium相结合——玩转网页端自动化数据采集/爬取程序

Flink 2.0 存算分离状态存储 — ForSt DB

免费HTTP代理IP对业务稳定性的影响关键因素分析

利用Java获取京东SKU接口指南

从AI换脸到篡改图像，合合信息如何提升视觉内容安全？

陪玩系统架构设计陪玩系统前后端开发，陪玩前端设计是如何让人眼前一亮的?

主动式智能导购AI助手构建方案评测

校园社交圈子系统网站校园社交圈子系统用户注册与登录校园社交圈子系统信息发布与审核校园社交圈子系统搜索功能优化校园社交圈子系统数据存储与处理

时间序列分析中的互相关与相干性分析：前导-滞后关系的理论基础与实际应用

AI在自然语言处理中的突破：从理论到应用

相关课程

更多

阿里巴巴学术会议论文解读@ECCV2020

阿里巴巴学术会议论文解读@NeurIPS2020

阿里巴巴学术会议论文解读@AAAI2021

【深度有趣】上海交大博士带你玩转GAN生成对抗网络

计算机视觉类比赛汇总

阿里巴巴学术会议论文解读@EMNLP2020

相关电子书

更多

中国地质大学博士学位论文

《SIGIR 顶会论文解读》

KDD精华论文解读

下一篇

阿里云oss存储简介和如何使用