|
人工智能
|

HunyuanVideo:腾讯推出的开源视频生成模型,参数高达130亿

腾讯推出的开源视频生成模型HunyuanVideo,拥有130亿参数,是目前参数量最大的开源视频模型之一。该模型具备物理模拟、高文本语义还原度、动作一致性和电影级画质等特性,能生成带有背景音乐的视频,推动了视频生成技术的发展和应用。

623 16
来自: 计算机视觉  版块
|
人工智能 自然语言处理 前端开发
|

Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动

Lobe Vidol是一款开源的AI数字人交互平台,允许用户创建和互动自己的虚拟偶像。该平台提供流畅的对话体验、丰富的动作姿势库、优雅的用户界面设计以及多种技术支持,如文本到语音和语音到文本技术。Lobe Vidol适用于娱乐互动、在线教育、客户服务、品牌营销和社交媒体等多个应用场景。

769 7
来自: 多模态  版块
|
机器学习/深度学习 存储 人工智能
|

EfficientTAM:Meta AI推出的视频对象分割和跟踪模型

EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,旨在解决SAM 2模型在移动设备上部署时的高计算复杂度问题。该模型采用非层次化Vision Transformer(ViT)作为图像编码器,并引入高效记忆模块,以降低计算复杂度,同时保持高质量的分割结果。EfficientTAM在多个视频分割基准测试中表现出与SAM 2相当的性能,具有更快的处理速度和更少的参数,特别适用于移动设备上的视频对象分割应用。

388 9
来自: 计算机视觉  版块
|
SQL 存储 人工智能
|

Vanna:开源 AI 检索生成框架,自动生成精确的 SQL 查询

Vanna 是一个开源的 Python RAG(Retrieval-Augmented Generation)框架,能够基于大型语言模型(LLMs)为数据库生成精确的 SQL 查询。Vanna 支持多种 LLMs、向量数据库和 SQL 数据库,提供高准确性查询,同时确保数据库内容安全私密,不外泄。

1717 7
来自: 自然语言处理  版块
|
人工智能 vr&ar
|

GeneMAN:上海AI Lab联合北大等高校推出的3D人体模型创建框架

GeneMAN是由上海AI实验室、北京大学、南洋理工大学和上海交通大学联合推出的3D人体模型创建框架。该框架能够从单张图片中生成高保真度的3D人体模型,适用于多种应用场景,如虚拟试衣、游戏和娱乐、增强现实和虚拟现实等。

571 7
来自: 计算机视觉  版块
|
人工智能 PyTorch 算法框架/工具
|

StableAnimator:复旦联合微软等机构推出的端到端身份一致性视频扩散框架

StableAnimator是由复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学联合推出的端到端身份一致性视频扩散框架。该框架能够根据一张参考图像和一系列姿态,直接合成高保真度且保持人物身份一致性的视频,无需任何后处理工具。本文详细介绍了StableAnimator的主要功能、技术原理以及如何运行该框架。

502 7
来自: 计算机视觉  版块
|
存储 编解码 Dart
|

腾讯开源混元视频生成模型,这效果!太稳了吧!

腾讯开源了HunyuanVideo,这是一个超过130亿参数的视频生成模型,具备高性能的图像-视频联合生成能力。通过创新的模型架构和高效的训练基础设施,HunyuanVideo在视觉质量、运动多样性和文本-视频对齐等方面表现出色,超越了多个现有模型。该项目旨在推动视频生成技术的发展,促进社区交流与创新。

1021 11
|
数据采集 自然语言处理 数据处理
|

智源研究院发布中文高质量数据集CCI3.0-HQ技术报告

智源研究院发布了CCI3.0-HQ中文预训练数据集,采用先进的混合质量过滤方法,显著提升数据完整性和性能。该数据集在多项实验中表现优异,超越了其他主流中文语料库。同时,智源还推出了CCI3-HQ分类器,大幅改进了大语言模型训练中的数据选择流程。

474 12
|
人工智能 API 开发者
|

用 OpenVINO™ 部署 GLM-Edge 全家桶

11月29日,智谱发布了GLM-Edge系列模型,包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B、GLM-Edge-V-5B,适用于手机、车机及PC平台。文章介绍了如何使用OpenVINO™工具套件在本地部署这些模型,实现高效的AI任务处理,如聊天与图像理解。提供了详细的环境配置、模型转换与量化、以及具体的应用示例。

401 16
|
SQL API
|

金融行业 · 大模型挑战赛 |用大模型理解金融市场

2024金融行业大模型挑战赛即将开启,旨在推动大型语言模型在金融领域的应用。比赛提供金融多轮问答数据集,参赛者需使用GLM-4模型API,通过SQL、API等技术解决金融问题,涵盖数据查询、统计分析及复杂问题处理。赛事分初赛、复赛和决赛,总奖金20万元。报名时间为2024年12月2日至2025年2月6日。

1015 16
|
SQL 自然语言处理 IDE
|

LLM的IDE使用一段时间后的体会

使用Windsurf开发Web应用,全程无需手写代码,仅通过自然语言交流指导大模型完成任务。初期体验流畅高效,尤其适合快速实现小规模项目。然而,面对需求变更时,代码设计易受影响,需细致指导大模型以保持良好设计。整体而言,LLM辅助编程如同结对编程中的导航员角色,用户需提升自身指导能力以发挥其最大效能。

397 0
|
人工智能
|

AnchorCrafter:中科院联合腾讯推出的AI虚拟主播带货视频制作技术

AnchorCrafter是由中科院和腾讯联合推出的一项AI虚拟主播带货视频制作技术。该技术基于扩散模型,能够自动生成高保真度的主播风格产品推广视频,通过整合人-物交互(HOI)技术,实现对物体外观和运动控制的高度还原。AnchorCrafter在物体外观保持、交互感知以及视频质量方面优于现有方法,为在线广告和消费者参与提供了新的可能性。

1632 31
来自: 计算机视觉  版块
|
机器学习/深度学习 人工智能 达摩院
|

MVGenMaster:复旦联合阿里等实验室推出的多视图扩散模型

MVGenMaster是由复旦大学、阿里巴巴达摩院和湖潘实验室联合推出的多视图扩散模型,专注于新视角合成(NVS)任务。该模型通过整合3D先验信息,显著提升了NVS的泛化和3D一致性,并能从单一图像生成多达100个新视图。此外,研究团队还推出了包含160万场景的大型多视图图像数据集MvD-1M,以支持模型的训练和优化。

302 27
来自: 计算机视觉  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

360Zhinao2-7B:360推出自研360智脑大模型的升级版

360Zhinao2-7B是360自研的AI大模型360智脑7B参数升级版,涵盖基础模型及多种上下文长度的聊天模型。该模型在语言理解与生成、聊天能力、数学逻辑推理等方面表现出色,支持多语言和多上下文长度,适用于多种商业应用场景。

498 23
来自: 自然语言处理  版块
|
人工智能 自然语言处理 开发者
|

Co-op Translator:微软推出面向开发者的开源多语言翻译工具

微软推出的开源多语言翻译工具Co-op Translator,基于Azure AI服务,能够自动化处理项目文档和图像中的文本翻译,简化技术文档的本地化流程,促进全球开发者协作。

383 25
来自: 自然语言处理  版块
|
人工智能 自然语言处理 JavaScript
|

Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统

Agent-E 是一个基于 AutoGen 代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。它能够执行多种复杂任务,如填写表单、搜索和排序电商产品、定位网页内容等,从而提高在线效率,减少重复劳动。本文将详细介绍 Agent-E 的功能、技术原理以及如何运行该系统。

988 5
来自: 多模态  版块
|
存储 人工智能 自然语言处理
|

Delta-CoMe:清华联合OpenBMB等高校开源的新型增量压缩算法

Delta-CoMe是由清华大学NLP实验室联合OpenBMB开源社区、北京大学和上海财经大学提出的新型增量压缩算法。该算法通过结合低秩分解和低比特量化技术,显著减少了大型语言模型的存储和内存需求,同时保持了模型性能几乎无损。Delta-CoMe特别适用于处理数学、代码和多模态等复杂任务,并在推理速度上有所提升。

345 6
来自: 科学计算  版块
|
Web App开发 机器学习/深度学习 人工智能
|

Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图

Magic Copy 是一款开源的 AI 抠图工具,支持 Chrome 浏览器扩展。它基于 Meta 的 Segment Anything Model 技术,能够自动识别图像中的前景对象并提取出来,简化用户从图片中提取特定元素的过程,提高工作效率。

668 7
来自: 计算机视觉  版块
|
人工智能 测试技术 API
|

FlagEvalMM:智源开源的多模态模型评测框架

FlagEvalMM 是由北京智源人工智能研究院开源的多模态模型评测框架,旨在全面评估处理文本、图像、视频等多种模态的模型。该框架支持多种任务和指标,采用评测与模型推理解耦的设计,提升评测效率,便于快速适配新任务和模型。

606 11
来自: 多模态  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

GLM-Edge:智谱开源的端侧大语言和多模态系列模型

GLM-Edge是智谱开源的一系列端侧部署优化的大语言对话模型和多模态理解模型,旨在实现模型性能、实机推理效果和落地便利性之间的最佳平衡。该系列模型支持在手机、车机和PC等端侧设备上高效运行,适用于智能助手、聊天机器人、图像标注等多种应用场景。

492 7
来自: 多模态  版块
|
机器学习/深度学习 人工智能 数据格式
|

Make-It-Animatable:中科大联合腾讯推出的自动生成即时动画准备资产

Make-It-Animatable是由中国科学技术大学和腾讯联合推出的数据驱动框架,能够在不到一秒内将任何3D人形模型转换为可用于动画的状态。该框架支持多种3D数据格式,并采用从粗到细的表示策略和结构感知建模,显著提升了动画准备的质量和速度。

225 7
来自: 计算机视觉  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务

Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。

1070 10
来自: 语音  版块
|
传感器 人工智能 数据可视化
|

iDP3:斯坦福大学联合多所高校推出的改进型3D视觉运动策略

iDP3是由斯坦福大学联合多所高校推出的改进型3D视觉运动策略,旨在提升人形机器人在多样化环境中的自主操作能力。该策略基于自我中心的3D视觉表征,无需精确相机校准和点云分割,显著提高了机器人在未见过的环境中的实用性和灵活性。

224 11
来自: 计算机视觉  版块
|
机器学习/深度学习 人工智能 编解码
|

OminiControl:AI图像生成框架,实现图像主题控制和空间精确控制

OminiControl 是一个高度通用且参数高效的 AI 图像生成框架,专为扩散变换器模型设计,能够实现图像主题控制和空间精确控制。该框架通过引入极少量的额外参数(0.1%),支持主题驱动控制和空间对齐控制,适用于多种图像生成任务。

334 10
来自: 计算机视觉  版块
|
人工智能 人机交互
|

Proactive Agent:清华联合面壁智能开源的新一代主动Agent交互范式

Proactive Agent是由清华大学联合面壁智能等团队推出的新一代主动Agent交互范式。它具备主动性,能够预测用户需求并在没有直接指令的情况下采取行动。本文详细介绍了Proactive Agent的主要功能、技术原理以及如何运行和评估其性能。

644 9
来自: 自然语言处理  版块
|
人工智能 自然语言处理 算法
|

魔搭社区每周速递(11.24-11.30)

魔搭ModelScope本期社区进展:1361个模型,29个数据集,44个创新应用,5 篇内容

272 1
|
人工智能
|

Fancy123:华中科技和华南理工推出的3D网格生成技术

Fancy123是由华中科技大学和华南理工大学联合推出的3D网格生成技术,能够从单张图片生成高质量的3D网格。该技术通过即插即用的变形技术,解决了多视图图像的局部不一致性,提高了网格对输入图像的保真度,并确保了高清晰度。Fancy123在定性和定量实验中表现出色,能够无缝集成到现有的单图像到3D的方法中。

172 5
来自: 计算机视觉  版块
|
机器学习/深度学习 人工智能 Linux
|

SAM 2.1:Meta 开源的图像和视频分割,支持实时视频处理

SAM 2.1是由Meta(Facebook的母公司)推出的先进视觉分割模型,专为图像和视频处理设计。该模型基于Transformer架构和流式记忆设计,实现了实时视频处理,并引入了数据增强技术,提升了对视觉相似物体和小物体的识别能力。SAM 2.1的主要功能包括图像和视频分割、实时视频处理、用户交互式分割、多对象跟踪以及改进的遮挡处理能力。

972 6
来自: 计算机视觉  版块
|
存储 人工智能 缓存
|

Mooncake:月之暗面Kimi联合清华等机构推出的大模型推理架构

Mooncake是由月之暗面Kimi联合清华大学等机构共同开源的大模型推理架构。该架构以KVCache为中心,通过分布式设计和资源优化,显著提升了大模型推理的吞吐量和效率,同时降低了算力开销。Mooncake在长上下文场景中表现出色,支持多种应用场景,如自然语言处理、内容推荐系统和搜索引擎等。

1316 6
来自: 自然语言处理  版块
|
机器学习/深度学习 人工智能 自然语言处理
|

Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画

Sketch2Lineart是一款基于人工智能的绘画工具,能够自动将手绘草图转换成清晰的线条画。该工具支持多种功能,如草图转线稿、自动描述生成、细节调整和风格定制等,适用于艺术创作、产品设计、教育培训等多个领域。

1172 60
来自: 计算机视觉  版块
|
人工智能 自然语言处理
|

Promptriever:信息检索模型,支持自然语言提示响应用户搜索需求

Promptriever 是一种新型信息检索模型,由约翰斯·霍普金斯大学和 Samaya AI 联合推出。该模型能够接受自然语言提示,并以直观的方式响应用户的搜索需求。通过在 MS MARCO 数据集上的训练,Promptriever 在标准检索任务上表现出色,能够更有效地遵循详细指令,提高查询的鲁棒性和检索性能。

271 6
来自: 自然语言处理  版块
|
人工智能 自然语言处理 算法
|

Devika AI:开源的 AI 软件开发工具,理解和执行复杂的人类指令

Devika AI 是一款开源的 AI 软件开发工具,能够理解和执行复杂的人类指令。它通过分解任务、信息搜集和代码生成,帮助开发者提高效率,减少人工干预。本文将详细介绍 Devika AI 的功能、技术原理以及如何运行和配置该工具。

550 9
来自: 自然语言处理  版块
|
人工智能 机器人 vr&ar
|

Find3D:加州理工学院推出的3D部件分割模型

Find3D是由加州理工学院推出的3D部件分割模型,能够根据任意文本查询分割任意对象的任何部分。该模型利用强大的数据引擎自动从互联网上的3D资产生成训练数据,并通过对比训练方法训练出一个可扩展的3D模型。Find3D在多个数据集上表现出色,显著提升了平均交并比(mIoU),并能处理来自iPhone照片和AI生成图像的野外3D构建。

246 5
来自: 计算机视觉  版块
|
机器学习/深度学习 人工智能
|

Qwen2VL-Flux:开源的多模态图像生成模型,支持多种生成模式

Qwen2VL-Flux 是一个开源的多模态图像生成模型,结合了 Qwen2VL 的视觉语言理解和 FLUX 框架,能够基于文本提示和图像参考生成高质量的图像。该模型支持多种生成模式,包括变体生成、图像到图像转换、智能修复及 ControlNet 引导生成,具备深度估计和线条检测功能,提供灵活的注意力机制和高分辨率输出,是一站式的图像生成解决方案。

1299 4
来自: 多模态  版块
|
人工智能 JSON 数据管理
|

ShowUI:新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型

ShowUI是由新加坡国立大学Show Lab和微软联合推出的视觉-语言-行动模型,旨在提升图形用户界面(GUI)助手的效率。该模型通过UI引导的视觉令牌选择和交错视觉-语言-行动流,有效减少计算成本并提高训练效率。ShowUI在小规模高质量数据集上表现出色,展现出在GUI自动化领域的潜力。

376 4
来自: 多模态  版块
|
数据采集 文字识别 测试技术
|

智谱开源端侧大语言和多模态模型GLM-Edge系列!

GLM-Edge系列模型是由智谱开源,专为端侧应用设计的大语言对话模型和多模态理解模型,包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B四种尺寸。这些模型针对手机、车机及PC等不同平台进行了优化,通过量化的技术手段,实现了高效运行。例如,在高通骁龙8 Elite平台上,1.5B对话模型和2B多模态模型能够达到每秒60 tokens以上的解码速度,而通过应用投机采样技术,这一数字可提升至100 tokens以上。

880 0
|
人工智能 机器人 API
|

12.4在北京,AI产品榜·年度大会 暨 中国 AI 年度产品颁奖仪式

自2022年11月30日ChatGPT发布以来,AI应用逐渐务实,探索真实落地场景。AI搜索、视频生成、手机AI化等成为重要方向。2024年12月4日在北京举办的AI产品榜年度大会将深入讨论这些话题,并揭晓2024中国AI年度产品。大会邀请了多位行业专家参与圆桌论坛,共同探讨AI技术的未来发展与应用。

201 0
|
机器学习/深度学习 人工智能 安全
|

千问团队开源会思考的QwQ模型,这模型成精了!

QwQ是由Qwen团队开发的大型语言模型,专注于增强AI的推理能力。此预览版本在数学和编程领域表现出色,但在其他领域仍有提升空间。模型具备深度自省和自我质疑的能力,通过逐步推理和假设检验,能够在复杂问题上取得突破性进展。QwQ不仅支持本地推理和Ollama直接运行,还提供了详细的微调指南,助力开发者根据特定需求定制模型。尽管QwQ在推理过程中存在语言切换和安全性等方面的局限性,Qwen团队仍致力于不断优化,推动模型向更高层次的智能迈进。[了解更多](https://modelscope.cn/studios/Qwen/QwQ-32B-preview)

3748 0
|
机器学习/深度学习 人工智能 算法
|

Optima:清华联合北邮推出优化通信效率和任务有效性的训练框架

Optima是由清华大学和北京邮电大学联合推出的一个优化通信效率和任务有效性的训练框架。该框架通过迭代生成、排名、选择和训练范式,显著提高了基于大型语言模型(LLM)的多智能体系统(MAS)的通信效率和任务效果。Optima不仅减少了令牌使用,还为改进推理时间扩展法则提供了新的可能性。

296 6
来自: 自然语言处理  版块
|
人工智能 测试技术 Apache
|

SmolVLM:Hugging Face推出的轻量级视觉语言模型

SmolVLM是Hugging Face推出的轻量级视觉语言模型,专为设备端推理设计。以20亿参数量,实现了高效内存占用和快速处理速度。SmolVLM提供了三个版本以满足不同需求,并完全开源,所有模型检查点、VLM数据集、训练配方和工具均在Apache 2.0许可证下发布。

1020 7
来自: 多模态  版块
|
人工智能 自然语言处理 并行计算
|

EchoMimicV2:阿里推出的开源数字人项目,能生成完整数字人半身动画

EchoMimicV2是阿里蚂蚁集团推出的开源数字人项目,能够生成完整的数字人半身动画。该项目基于参考图片、音频剪辑和手部姿势序列,通过音频-姿势动态协调策略生成高质量动画视频,确保音频内容与半身动作的一致性。EchoMimicV2不仅支持中文和英文驱动,还简化了动画生成过程中的复杂条件,适用于虚拟主播、在线教育、娱乐和游戏等多个应用场景。

3711 5
来自: 计算机视觉  版块
|
人工智能 移动开发 前端开发
|

Markdown-to-Image:开源的在线 Markdown 转海报编辑器

Markdown-to-Image 是一款开源的在线 Markdown 转海报编辑器,能够将 Markdown 文本内容转换为图像,适用于创建社交媒体帖子、海报和其他视觉内容。该工具支持多种输出格式,并允许用户自定义样式,适用于多种应用场景。

991 4
来自: 自然语言处理  版块
|
人工智能 编解码 BI
|

LEOPARD:腾讯AI Lab西雅图实验室推出的视觉语言模型

LEOPARD是由腾讯AI Lab西雅图实验室推出的视觉语言模型,专为处理含有大量文本的多图像任务设计。该模型通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集,在多个基准测试中表现卓越,适用于自动化文档理解、教育和学术研究、商业智能和数据分析等多个应用场景。

360 2
来自: 计算机视觉  版块
|
机器学习/深度学习 人工智能 算法
|

BALROG:基准测试工具,用于评估 LLMs 和 VLMs 在复杂动态环境中的推理能力

BALROG 是一款用于评估大型语言模型(LLMs)和视觉语言模型(VLMs)在复杂动态环境中推理能力的基准测试工具。它通过一系列挑战性的游戏环境,如 NetHack,测试模型的规划、空间推理和探索能力。BALROG 提供了一个开放且细粒度的评估框架,推动了自主代理研究的进展。

379 3
来自: 自然语言处理  版块
|
机器学习/深度学习 人工智能 语音技术
|

Fugatto:英伟达推出的多功能AI音频生成模型

Fugatto是由英伟达推出的多功能AI音频生成模型,能够根据文本提示生成音频或视频,并修改现有音频文件。该模型基于增强型的Transformer模型,支持复杂的组合指令,具有强大的音频生成与转换能力,广泛应用于音乐创作、声音设计、语音合成等领域。

388 1
来自: 多模态  版块
|
人工智能 测试技术 计算机视觉
|

LongLLaVA:香港中文大学推出的多模态上下文混合架构大语言模型

LongLLaVA是由香港中文大学推出的多模态大型语言模型,采用混合架构,结合Mamba和Transformer模块,旨在高效处理大量图像数据。该模型能够在单个A100 80GB GPU上处理多达1000张图像,通过2D池化技术压缩图像token,显著降低计算成本,同时保留关键的空间关系信息。LongLLaVA在视频理解、高分辨率图像分析和多模态代理等应用场景中展现出卓越的性能。

256 5
来自: 多模态  版块
|
机器学习/深度学习 人工智能 算法
|

从 OpenAI-o1 看大模型的复杂推理能力

深入解析OpenAI o1模型的复杂推理技术与发展历程

574 1
|
机器学习/深度学习 人工智能 监控
|

AutoTrain:Hugging Face 开源的无代码模型训练平台

AutoTrain 是 Hugging Face 推出的开源无代码模型训练平台,旨在简化最先进模型的训练过程。用户无需编写代码,只需上传数据即可创建、微调和部署自己的 AI 模型。AutoTrain 支持多种机器学习任务,并提供自动化最佳实践,包括超参数调整、模型验证和分布式训练。

1229 4
|
人工智能 自然语言处理 数据处理
|

LazyGraphRAG:微软推出的图形增强生成增强检索框架

LazyGraphRAG是微软研究院推出的图形增强生成增强检索框架,旨在大幅降低数据索引成本并提高查询效率。该框架结合了最佳优先搜索和广度优先搜索,支持本地和全局查询,适用于一次性查询、探索性分析和流数据处理。LazyGraphRAG将加入开源的GraphRAG库,为开发者和企业提供更高效的技术支持。

626 0
来自: 多模态  版块
|
人工智能 数据处理 异构计算
|

LongRAG:智谱联合清华和中科院推出的双视角鲁棒检索框架

LongRAG是由智谱、清华大学和中国科学院联合推出的双视角鲁棒检索增强生成框架,专为长文本问答设计。该框架通过混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器等组件,有效解决了长文本问答中的全局上下文理解和事实细节识别难题。LongRAG在多个数据集上表现优异,提供了自动化微调数据构建管道,增强了系统的“指令跟随”能力和领域适应性。

378 1
来自: 自然语言处理  版块

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
14531
内容
6
活动
3803
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互