|
7月前
|
安全 测试技术 Swift
|

Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

12218 2
|
7月前
|
SQL 存储 开发工具
|

vanna+qwen实现私有模型的SQL转换

本文档介绍了如何在本地部署Vanna服务以使用Qwen模型进行text2sql转换。首先,通过`snapshot_download`下载Qwen-7B-Chat模型,并安装相关依赖。接着,修改`openai_api.py`设置本地LLM服务接口。然后,安装并配置Vanna Flask服务,包括自定义LLM服务、连接数据库以及修改端口。为了解决内网访问问题,使用ngrok或natapp进行内网穿透,提供公网访问。最后,处理了chromadb包中自动下载资源的问题,以防网络不佳导致的失败。通过这些步骤,实现了使用本地Qwen模型的Vanna服务。

5328 1
|
5月前
|
人工智能 API 决策智能
|

智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐

【7月更文挑战第8天】智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐

2291 9
来自: 自然语言处理  版块
|
3天前
|
机器学习/深度学习 人工智能 文字识别
|

POINTS 1.5:腾讯微信开源的多模态大模型,超越了业界其他的开源视觉语言模型,具备强大的视觉和语言处理能力

POINTS 1.5是腾讯微信推出的多模态大模型,基于LLaVA架构,具备强大的视觉和语言处理能力。它在复杂场景的OCR、推理能力、关键信息提取等方面表现出色,是全球10B以下开源模型中的佼佼者。

109 58
来自: 多模态  版块
|
1天前
|
机器学习/深度学习 人工智能 文字识别
|

Kimi 上线视觉思考模型,K1 系列强化学习模型正式开放,无需借助外部 OCR 处理图像与文本进行思考并回答

k1视觉思考模型是kimi推出的k1系列强化学习AI模型,具备端到端图像理解和思维链技术,能够在数学、物理、化学等领域表现优异。本文详细介绍了k1视觉思考模型的功能、技术原理、使用方法及其在多个应用场景中的表现。

101 68
来自: 自然语言处理  版块
|
7月前
|
人工智能 测试技术 API
|

Phi-3:小模型,大未来!(附魔搭社区推理、微调实战教程)

近期, Microsoft 推出 Phi-3,这是 Microsoft 开发的一系列开放式 AI 模型。Phi-3 模型是一个功能强大、成本效益高的小语言模型 (SLM),在各种语言、推理、编码和数学基准测试中,在同级别参数模型中性能表现优秀。为开发者构建生成式人工智能应用程序时提供了更多实用的选择。

4226 1
|
7月前
|
并行计算 PyTorch 算法框架/工具
|

社区供稿 | 本地部署通义千问大模型做RAG验证

这篇文章中,我们通过将模搭社区开源的大模型部署到本地,并实现简单的对话和RAG。

2291 1
|
7月前
|
机器学习/深度学习 自然语言处理 机器人
|

【RAG实践】Rerank,让RAG更近一步

本文主要关注在Rerank,本文中,Rerank可以在不牺牲准确性的情况下加速LLM的查询(实际上可能提高准确率),Rerank通过从上下文中删除不相关的节点,重新排序相关节点来实现这一点。

2955 0
|
7月前
|
开发框架 数据可视化 Windows
|

如何提升大模型Agent的能力 ——LLM Agent框架 Modelscope-Agent 实战

本文介绍Agent到底是什么 ,如何进行优化,以及如何使用Agen框架。

2756 0
|
7月前
|
编解码 自然语言处理 算法
|

开源版图生视频I2VGen-XL:单张图片生成高质量视频

VGen是由阿里巴巴通义实验室开发的开源视频生成模型和代码系列,具备非常先进和完善的视频生成系列能力

4142 3
|
7月前
|
自然语言处理 算法 前端开发
|

Multi-Agent实践第5期:RAG智能体的应用:让AgentScope介绍一下自己吧

本期文章,我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体,创造AgentScope助手群,为大家解答和AgentScope相关的问题。

1684 2
|
4月前
|
缓存 自然语言处理 算法
|

ICWS 2024 | 基于生成长度预测的大语言模型推理请求调度

大量实验证明,Magnus 可以有效降低请求响应时间并提高LLM批处理的吞吐量

290 0
|
7月前
|
缓存 自然语言处理 物联网
|

LLama Factory+ModelScope实战——使用 Web UI 进行监督微调

LLaMA Factory 是一个高效的大语言模型训练和推理框架,它通过提供一站式的 Web UI 界面和集成多种训练方法,简化了大模型的微调过程,并能够适配多种开源模型。

3093 2
|
7月前
|
机器学习/深度学习 算法 自动驾驶
|

深度强化学习在大模型中的应用:现状、问题和发展

强化学习在大模型中的应用具有广泛的潜力和机会。通过使用强化学习算法,如DQN、PPO和TRPO,可以训练具有复杂决策能力的智能体,在自动驾驶、机器人控制和游戏玩家等领域取得显著成果。然而,仍然存在一些挑战,如样本效率、探索与利用平衡以及可解释性问题。未来的研究方向包括提高样本效率、改进探索策略和探索可解释的强化学习算法,以进一步推动强化学习在大模型中的应用。

1867 3
|
7月前
|
数据可视化 物联网 测试技术
|

零一万物Yi-1.5系列模型发布并开源!34B/9B/6B 多尺寸魔搭社区推理微调最佳实践教程来啦!

Yi-1.5是Yi的升级版本。 它使用 500B tokens的高质量语料库在 Yi 上持续进行预训练,并在 3M 个多样化的微调样本上进行微调。

1718 0
|
18天前
|
人工智能 自然语言处理 并行计算
|

EchoMimicV2:阿里推出的开源数字人项目,能生成完整数字人半身动画

EchoMimicV2是阿里蚂蚁集团推出的开源数字人项目,能够生成完整的数字人半身动画。该项目基于参考图片、音频剪辑和手部姿势序列,通过音频-姿势动态协调策略生成高质量动画视频,确保音频内容与半身动作的一致性。EchoMimicV2不仅支持中文和英文驱动,还简化了动画生成过程中的复杂条件,适用于虚拟主播、在线教育、娱乐和游戏等多个应用场景。

135 5
来自: 计算机视觉  版块
|
7月前
|
数据采集 存储 人工智能
|

TripoSR开源!从单个图像快速生成 3D 对象!(附魔搭社区推理实战教程)

近期,VAST团队和Stability AI团队合作发布了TripoSR,可在一秒内从单个图像生成高质量3D对象。

1798 0
|
2月前
|
SQL 存储 缓存
|

SQL数据库查询详解

数据库是现代信息社会的基石,它们存储和管理着大量的数据。而SQL(StructuredQueryLanguage)作为一种强大的数据库查询语言,广泛应用于各种数据库系统中。本文将详细介绍SQL数据库查询的基本概念、语法、常用操作以及优化策略。一、SQL数据库查询概述SQL是一种用于管理关系数据库的标

355 3
|
29天前
|
存储 安全 虚拟化
|

虚拟化技术:实现资源高效利用和灵活管理的利器

虚拟化技术作为实现资源高效利用和灵活管理的重要手段,在数字化时代背景下,正逐步改变传统IT架构模式。本文概述了虚拟化技术的概念、原理及其在数据中心管理、云计算平台、企业信息化建设、科研教育及医疗行业的应用,并探讨了其面临的挑战与未来发展趋势。

107 3
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

LLM 大模型学习必知必会系列(一):大模型基础知识篇

LLM 大模型学习必知必会系列(一):大模型基础知识篇

1493 2
来自: 自然语言处理  版块
|
7月前
|
物联网 Shell Swift
|

NPU推理&微调大模型实战

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

2003 5
|
2月前
|
监控 JavaScript 开发者
|

在 Vue 中,子组件为何不可以修改父组件传递的 Prop,如果修改了,Vue 是如何监控到属性的修改并给出警告的

在 Vue 中,子组件不能直接修改父组件传递的 Prop,以确保数据流的单向性和可预测性。如果子组件尝试修改 Prop,Vue 会通过响应式系统检测到这一变化,并在控制台发出警告,提示开发者避免这种操作。

138 3
|
2月前
|
人工智能 JSON 数据可视化
|

OpenAI调用接口多轮对话Multi Turn Multi Agent 多轮多角色对话调试和可视化工具Dialogue Visualization

伴随着生成式人工智能技术发展,进2年涌现出大语言模型LLM/Agent系统/AI推理等众多方向的技术项目和论文。其中对话系统,智能体交互是用户通过UX界面和AI系统进行交互,这种交互有时候也是多模态(用户输入文字/语音/图像)等等。在调用OpenAI 的对话接口时候,有时候需要把对话结果打印出来检查是否有bug,JSON数据格式就比较难看出来了,尤其是有多角色的多轮对话。这个时候可以借助一些在线的"对话"可视化的工具 (Online Dialogue Visualization Tool) DeepNLP Dialogue Visualization Tool,方便产品经理,算法研发,学术研究

361 1
|
10月前
|
Windows
|

关于 Windows平台上 ttsfrd 库的问题。

1766 2
来自:语音 版块
|
3月前
|
存储 Shell 开发工具
|

查看git 的远程地址

在Git中,你可以通过几种不同的命令来查看远程仓库的地址。以下是一些常用的方法: ### 1. 使用`git remote -v`命令 这是查看远程仓库地址最常用的命令。它会列出所有远程仓库的名称(如`origin`)以及对应的URL(包括fetch和push的URL,如果它们不同的话)。 ```bash git remote -v ``` 输出示例: ``` origin https://github.com/username/repo.git (fetch) origin https://github.com/username/repo.git (push) ``` ###

458 12
|
29天前
|
缓存 负载均衡 Java
|

Java“TimeoutException”解决

Java中的“TimeoutException”通常在操作超时未完成时抛出。解决方法包括:增加超时时间、优化代码逻辑减少执行时间、使用异步处理或线程池提高效率。

193 11
|
7月前
|
自然语言处理 物联网 Swift
|

零一万物开源Yi-VL多模态大模型,魔搭社区推理&微调最佳实践来啦!

近期,零一万物Yi系列模型家族发布了其多模态大模型系列,Yi Vision Language(Yi-VL)多模态语言大模型正式面向全球开源。

2053 2
|
7月前
|
机器学习/深度学习 编解码 Shell
|

Open-Sora,高效复现类Sora视频生成方案开源!魔搭社区最佳实践教程来啦!

近期,HPC-AI Tech团队在GitHub上正式公开了Open-Sora项目

1037 2
|
14天前
|
人工智能
|

AnchorCrafter:中科院联合腾讯推出的AI虚拟主播带货视频制作技术

AnchorCrafter是由中科院和腾讯联合推出的一项AI虚拟主播带货视频制作技术。该技术基于扩散模型,能够自动生成高保真度的主播风格产品推广视频,通过整合人-物交互(HOI)技术,实现对物体外观和运动控制的高度还原。AnchorCrafter在物体外观保持、交互感知以及视频质量方面优于现有方法,为在线广告和消费者参与提供了新的可能性。

123 30
来自: 计算机视觉  版块
|
17天前
|
机器学习/深度学习 人工智能
|

Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式

Qwen2VL-Flux 是一个开源的多模态图像生成模型,结合了 Qwen2VL 的视觉语言理解和 FLUX 框架,能够基于文本提示和图像参考生成高质量的图像。该模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及 ControlNet 引导生成,具备深度估计和线条检测功能,提供灵活的注意力机制和高分辨率输出,是一站式的图像生成解决方案。

106 4
来自: 多模态  版块
|
3月前
|
存储 安全 Linux
|

s3fs挂载S3对象桶

s3fs(Simple Storage Service File System)是一个基于FUSE(Filesystem in Userspace)的文件系统,它允许将S3(Simple Storage Service)或其他兼容S3 API的对象存储服务挂载到本地文件系统中,从而能够像访问本地磁盘一样访问远程对象存储。以下是通过s3fs挂载OBS(Object Storage Service,对象存储服务,这里以华为云OBS为例)对象桶的基本步骤: ### 一、环境准备 1. **安装s3fs**: - 对于CentOS系统,可以使用yum安装s3fs-fuse: ```

401 7
|
7月前
|
机器学习/深度学习 人工智能 JSON
|

LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关

LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关

1034 0
来自: 自然语言处理  版块
|
7月前
|
编解码 JSON 数据可视化
|

DeepSeek VL系列开源,魔搭社区模型微调最佳实践教程来啦!

3月11日,DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列,包含1.3b、7b两种不同规模的4个版本的模型。

1275 3
|
6月前
|
自然语言处理 Java 测试技术
|

使用PostMan请求阿里云通义千问大模型

本文介绍如果通过postman调用阿里云通义千问API,然后介绍如果使用多语言集成,最后介绍了快速使用postman压测创建的API请求。

1215 2
|
7月前
|
存储 前端开发 物联网
|

在魔搭使用ComfyUI,玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

1922 6
|
7月前
|
人工智能 数据可视化 物联网
|

10分钟微调专属于自己的大模型

本文主要介绍使用魔搭社区轻量级训练推理工具SWIFT,进行大模型自我认知微调,帮助初阶炼丹师快速微调出专属于自己的大模型。

1802 2
|
1月前
|
Java 开发者
|

Java“NoSuchElementException”问题解决

“NoSuchElementException”是Java编程中常见的异常之一,通常发生在尝试从集合或迭代器中获取不存在的元素时。本文将介绍该异常的原因、常见场景及解决方法,帮助开发者有效应对这一问题。

130 5
|
2月前
|
人工智能 自然语言处理 语音技术
|

《ModelScope:模型即服务的创新与未来》

【10月更文挑战第2天】** 本文深入探讨了 ModelScope 所代表的模型即服务(MaaS)模式的发展背景、核心特点、技术优势、应用场景以及对各个领域带来的深远影响。通过对其架构、功能和实际案例的分析,展现了 ModelScope 在推动人工智能发展、促进产业升级和创新方面的巨大潜力,同时也对其未来发展趋势进行了展望。

302 1

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
13195
内容
6
活动
2781
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互