|
28天前
|
人工智能 开发者
|

FacePoke:AI时代的面部表情编辑新体验

**FacePoke** 是一款引人注目的开源工具,利用先进的人工智能技术,让用户通过简单的拖拽界面实时编辑面部表情。它支持实时编辑与动画,提供直观的操作体验,适用于艺术项目、视频制作和社交内容等多种场景。FacePoke 的开源特性还允许开发者自由修改和扩展功能。无论是艺术家还是内容创作者,都能轻松提升数字内容的情感表达。

255 0
|
4月前
|
人工智能 前端开发 API
|

RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

【7月更文挑战第9天】RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

606 0
来自: 自然语言处理  版块
|
6月前
|
自然语言处理 物联网 Swift
|

零一万物开源Yi-VL多模态大模型,魔搭社区推理&微调最佳实践来啦!

近期,零一万物Yi系列模型家族发布了其多模态大模型系列,Yi Vision Language(Yi-VL)多模态语言大模型正式面向全球开源。

1860 2
|
6月前
|
前端开发 算法 API
|

Multi-Agent实践第4期:智能体的“想”与“做”-ReAct Agent

本期文章,我们将向大家展示如何使用AgentScope内置的ReAct智能体解决更为复杂的问题。

1361 3
|
12月前
|
物联网 并行计算 异构计算
|

ModelScope中,大佬们4卡跑lora时,遇到这样的错,怎么解决?

1885 4
来自:计算机视觉 版块
|
27天前
|
SQL 人工智能 自然语言处理
|

【AI 技术分享】大模型与数据检索的探索实践

本文基于2024年9月27日与阿里云合办的线下沙龙分享整理而成,探讨如何通过大语言模型(LLM)让数据访问更简单。随着企业数据量增长,传统数据访问方式已难以满足需求。LLM结合自然语言检索,使非技术用户能直接用自然语言与数据交互,降低数据访问门槛。文章介绍了NL2SQL技术,通过LLM理解自然语言问题并生成SQL查询,实现高效数据获取。同时,探讨了AskTable架构及其在实际应用中的挑战与解决方案。

162 5
来自: 自然语言处理  版块
|
6月前
|
存储 人工智能 达摩院
|

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性,能带来更优异的能效比。相比于传统的 x86 架构服务器,Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要,因为大模型通常需要大量的计算资源,而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

109117 93
|
6月前
|
人工智能 物联网 测试技术
|

以小博大,微软开源27亿参数模型Phi-2,魔搭最佳实践来啦!

近日,微软公布了在 Microsoft Ignite 2023大会上宣布开源的 Phi-2 模型的更多细节,“打破传统语言模型缩放定律,可PK比自己大25倍的模型”、“以小博大”等评价,让Phi-2一时间在开源社区中引发关注。

2094 1
|
5月前
|
数据库 UED 开发者
|

try-catch的作用及使用场景

`try-catch`是错误处理的关键结构,用于执行可能出错的代码并捕获异常,防止程序崩溃。它用于异常处理、资源管理、错误恢复、日志记录和控制业务逻辑。例如,在数据库操作、文件操作、网络请求及用户输入处理中常见其身影,确保程序稳定性和用户体验。

304 0
|
6月前
|
人工智能 自然语言处理 机器人
|

B端Agent的机会,不在于“助手”,而在基于垂直领域的任务式Agent微调

该文讨论了AI助手在企业服务中的应用,指出通用的“助手”Agent(如Coze、钉钉)在B端业务场景中表现一般,因为它们依赖用户正确指导且易发散。相比之下,任务式Agent(如TFlow)针对特定行业和场景进行微调,能更好地理解和执行复杂任务,具有更高准确性和稳定性,适合企业业务流程。TFlow的优势包括场景微调、优化流程处理,开发和使用成本较低,能直接解决实际业务问题。作者认为,B端Agent的机会在于为企业降低成本或增加效益,而任务式Agent通过微调形成的适配性成为其核心竞争力。

221 0
|
6月前
|
机器学习/深度学习 自然语言处理 机器人
|

【RAG实践】基于LlamaIndex和Qwen1.5搭建基于本地知识库的问答机器人

LLM会产生误导性的 “幻觉”,依赖的信息可能过时,处理特定知识时效率不高,缺乏专业领域的深度洞察,同时在推理能力上也有所欠缺。

2625 2
|
6月前
|
存储 机器学习/深度学习 物联网
|

社区供稿 | 2张卡训练70B的大模型(上) - 百亿大模型部署系列

百亿大模型部署

908 0
|
4月前
|
机器学习/深度学习 计算机视觉
|

YOLOv10实战:SPPF原创自研 | SPPF_attention,重新设计加入注意力机制 | NEU-DET为案列进行展开

【7月更文挑战第1天】 优点:为了利用不同的池化核尺寸提取特征的方式可以获得更多的特征信息,提高网络的识别精度; 如何优化:在此基础上加入注意力机制,能够在不同尺度上更好的、更多的获取特征信息,从而获取全局视角信息并减轻不同尺度大小所带来的影响; SPPF_attention,重新设计加入注意力机制 ,在NEU-DEU任务中mAP50从0.683提升至0.703;

580 3
来自: 计算机视觉  版块
|
6月前
|
存储 机器学习/深度学习 人工智能
|

RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术

RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术

618 8
来自: 自然语言处理  版块
|
6月前
|
编解码 自然语言处理 开发者
|

复刻Sora有多难?一张图带你读懂Sora的技术路径

OpenAI发布了视频生成模型Sora,最大的Sora模型能够生成一分钟的高保真视频。同时OpenAI称,可扩展的视频生成模型,是构建物理世界通用模拟器的一条可能的路径。

1570 4
|
1月前
|
存储 关系型数据库 分布式数据库
|

GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践

本文介绍了一种结合知识图谱与大型语言模型(LLM)的GraphRAG系统,利用PolarDB、通义千问及LangChain实现。知识图谱通过结构化信息、语义理解和推理等功能,增强了信息检索与自然语言处理效果。PolarDB具备图引擎与向量检索能力,适配知识图谱存储与查询。通义千问处理自然语言,LangChain则整合模型与应用。实战步骤包括环境准备、数据库配置与数据导入,并通过实例展示了图谱与向量联合检索的优越性,提升了问答系统的准确性和实用性。

177 0
|
6月前
|
机器学习/深度学习 物联网 开发者
|

秒级生图,SDXL-turbo、LCM-SDXL魔搭社区最佳实践

最近一个月,快速生图成为文生图领域的热点,其中比较典型的两种方式的代表模型分别为SDXL-turbo 和 LCM-SDXL。

933 3
|
3月前
|
人工智能 物联网
|

关于flux.1 loras的8个问题

Flux LoRA是一系列用于微调FLUX.1 AI模型的低阶适应模型,专为生成多样风格图像设计,如现实主义、动漫或艺术风格。LoRA通过调整模型权重实现特定美学或主题输出,无需大量再训练。Flux LoRA能创作从真实场景到幻想风光的各种图像,具体取决于选用的LoRA及输入提示。模型许可各不相同,使用前需确认授权范围。用户可通过ComfyUI等界面轻松集成LoRA模型。流行模型包括Flux Realism LoRA、Anime LoRA等。亦可利用自定义数据集训练个人化的LoRA。FLUX Lora提供在线免费试用。

323 2
来自: 计算机视觉  版块
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

LLM 大模型学习必知必会系列(一):大模型基础知识篇

LLM 大模型学习必知必会系列(一):大模型基础知识篇

1304 2
来自: 自然语言处理  版块
|
6月前
|
Java 开发工具
|

阿里云灵积平台Java SDK调用教程

开通阿里云灵积服务并创建API-KEY,添加Java依赖`dashscope-sdk-java`版本2.11.0。示例代码展示如何使用SDK进行多模态对话,调用`MultiModalConversation`进行交互,并打印结果。测试结果显示输出对一张图片的描述。参考链接提供通义千问VL快速入门指南。

1199 0
|
6月前
|
自然语言处理 PyTorch 算法框架/工具
|

modelscope问题之安装失败如何解决

本合集将提供ModelScope安装步骤、配置要求和环境准备,以便用户顺利启动ModelScope进行模型开发和测试。

528 1
|
6月前
|
搜索推荐 算法 安全
|

AIGC对未来高校教学的影响

【1月更文挑战第14天】AIGC对未来高校教学的影响

197 3
|
6月前
|
文字识别 算法 数据库
|

开源OCR模型DIY票证信息抽取

票证检测矫正模型在实际生活中有着广泛的需求,例如信息抽取、图像质量判断、证件扫描、票据审计等领等场景,可以大幅提高工作效率和准确性。

632 0
|
9月前
|
算法框架/工具 TensorFlow
|

ERROR: Failed building wheel for PyMCubes 怎么解决

416 2
|
6月前
|
数据可视化 物联网 关系型数据库
|

幻方开源第二代MoE模型 DeepSeek-V2,魔搭社区推理、微调最佳实践教程

5月6日,幻方继1月份推出首个国产MoE模型,历时4个月,带来第二代MoE模型DeepSeek-V2,并开源了技术报告和模型权重,魔搭社区可下载体验。

761 9
|
6月前
|
自然语言处理 API Swift
|

Qwen1.5开源!魔搭最佳实践来啦!

近几个月来,通义千问团队一直在努力探索如何构建一个“好”的模型,同时优化开发者体验。就在刚刚,中国新年前夕,通义千问团队分享了Qwen开源系列的下一个版本,Qwen1.5。

3577 3
|
6月前
|
测试技术 AI芯片
|

ModelScope X 昇腾910快速上手

一个简单的基于国产昇腾硬件的ModelScope适配攻略

524 0
来自: 自然语言处理  版块

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
13020
内容
6
活动
2628
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互