9月人工智能论文和项目推荐

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
大数据开发治理平台 DataWorks,不限时长
简介: 因为LLM的火爆,所以最近的论文都是和LLM相关的

论文

1、LongLoRA

https://arxiv.org/abs/2309.12307

LoRA是人工智能中有效扩展预训练语言模型(llm)上下文大小的一种方法。LongLoRA通过在训练期间利用稀疏的局部注意力和在推理期间利用密集的全局注意力,允许进行经济有效的微调并保持性能。LongLoRA在各种任务上展示了令人印象深刻的结果,并在llm中支持多达10万个令牌的上下文扩展。

2、Chain-of-Verification

https://arxiv.org/abs/2309.11495

Chain-of-Verification减少了大型语言模型中的幻觉。CoVe可以有效地减少基于语言模型的系统中的幻觉。通过生成、验证和传递响应的系统过程,CoVe已经证明了它在各种任务(包括问答和文本生成)中减少幻觉。

3、Fast Feedforward Networks

https://arxiv.org/abs/2308.14711

快速前馈网络(FFF)是一种以较小的神经网络作为叶子的二叉树结构,与mix -of- experts网络相比,它的性能要快得多。尽管还有一些问题,比如树过深而导致的碎片化,但是FFF网络在需要快速推理和小细节编码的场景中具有很大的前景。

4、Contrastive Decoding

https://arxiv.org/abs/2309.09117

对比解码提高了大型语言模型的推理能力。LLM中的对比解码是一种强大的推理方法。它超越了贪婪解码和核采样,在HellaSwag和GSM8K等基准测试中表现出色。

5、PDFTriage

https://arxiv.org/abs/2309.08872

研究人员开发了PDFTriage,这是一种提高基于语言模型的结构化文档(如pdf)问答系统性能的解决方案。通过合并文档结构和内容,PDFTriage在回答各种类别的复杂问题方面优于现有模型。

6、CulturaX

https://arxiv.org/abs/2309.09400

CulturaX是一个精心策划的用于167种语言的大型语言模型的多语言数据集,包含6T标记,专为167种语言的语言模型而设计。数据集经过彻底的清理阶段,以确保人工智能语言模型的高质量训练数据。

7、An Empirical Study of Scaling Instruct-Tuned Large Multimodal Models

https://arxiv.org/abs/2309.09958

研究人员发现,在训练过程中提高图像分辨率和混合多模态语言数据可以提高LLaVA和MiniGPT-4等多模态模型的性能。此外调整视觉指令可以进一步提高这些模型的语言能力。

8、EvoPrompt

https://arxiv.org/abs/2309.08532

EvoPrompt是一个使用进化算法的新框架,它优化了GPT-3.5和Alpaca等语言模型的提示生成。它超越了人类设计的提示和当前的方法,证明了它在语言任务中的有效性。

9、Scaling Laws for Sparsely-Connected Foundation Models.

https://arxiv.org/abs/2309.08520

研究人员发现了一个独特的标度定律,它显示了基础模型中权重稀疏度、非零参数和训练数据量之间的关系。性能的最佳稀疏级别随着数据的增加而增加。

值得关注的项目

1、vllm

https://github.com/vllm-project/vllm

vLLM是一个为llm提供了卓越的速度和改进效率的开源引擎,它与hug Face无缝集成,支持高吞吐量服务与先进的算法。vLLM在吞吐量方面优于hug Face transformer和Text Generation Inference。

2、目标检测排行榜

https://huggingface.co/blog/object-detection-leaderboard

huggingface又发布了目标检测排行榜,目前以基于DETA和DETR架构的模型得分最高

3、DALL·e3

https://openai.com/dall-e-3

OpenAI正在推出DALL·E 3

4、adobe的Firefly要收费了

https://techcrunch.com/2023/09/13/adobes-firefly-generative-ai-models-are-now-generally-available-get-pricing-plans/

Adobe今天宣布,测试版发布的176天后,Firefly现在可以在其Creative Cloud, Adobe Express和Adobe Experience Cloud中使用。

还会将Firefly作为一款独立的web应用程序推出,然后就是收费:

每次点击“生成”来创建一个图像,你就会消耗一个积分,付费Adobe计划的人都将获得相当多生成积分,有人做了对比,大概是一张图片5美分,Dalle便宜大概是13美分。

https://avoid.overfit.cn/post/10758ea42b314d6991b2dd1691cdb7a6

目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选
阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。
|
2月前
|
机器学习/深度学习 人工智能 开发工具
人工智能项目的python版本管理工具DVC
dvc即data version control, 是一种针对人工智能项目(机器学习或者深度学习)的数据版本管理工具。DVC的操作和GIT类似,可以认为为GIT的二次开发封装。结合GIT,DVC可以有效的管理人工智能项目的整个流程,包括代码,数据,训练配置,模型【2月更文挑战第12天】
97 1
|
3月前
|
机器学习/深度学习 人工智能 算法
基于机器视觉的害虫种类及计数检测研究-人工智能项目-附代码
基于机器视觉的害虫种类及计数检测研究-人工智能项目-附代码
43 0
|
4月前
|
机器学习/深度学习 人工智能 边缘计算
【论文速递】9位院士Science88页长文:人工智能的进展、挑战与未来
【论文速递】9位院士Science88页长文:人工智能的进展、挑战与未来
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里云人工智能平台PAI多篇论文入选EMNLP 2023
近期,阿里云人工智能平台PAI主导的多篇论文在EMNLP2023上入选。EMNLP是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选意味着阿里云人工智能平台PAI自研的自然语言处理算法达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
|
6月前
|
人工智能 测试技术
软件测试/人工智能|利用ChatGPT进行项目需求分析
软件测试/人工智能|利用ChatGPT进行项目需求分析
62 0
|
6月前
|
人工智能 编解码 测试技术
10月发布的5篇人工智能论文推荐
10月发布的5篇人工智能论文推荐
68 1
|
7月前
|
人工智能 算法
阿里云人工智能平台 PAI 扩散模型加速采样算法论文入选 CIKM 2023
近日CIKM 2023上,阿里云人工智能平台PAI和华东师范大学陈岑副教授团队主导的扩散模型加速采样算法论文《Optimal Linear Subspace Search: Learning to Construct Fast and High-Quality Schedulers for Diffusion Models》入选。此次入选意味着阿里云人工智能平台 PAI自研的扩散模型算法和框架达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
|
9月前
|
机器学习/深度学习 人工智能 算法
人工智能论文
目前,由于人工智能技术尚处于发展阶段,且以机器学习、深度学习为代表的新一代人工智能技术主要体现在算法层面,而成熟的实体终端产品并不多。下面主要对发展较为成熟,且已初具市场规模的三款终端产品予以介绍,分别是智能音箱、智能机器人和无人机。
116 1
|
10月前
|
机器学习/深度学习 人工智能 算法
《人工智能导论》期末项目
《人工智能导论》期末项目
134 3