72B、1.8B、Audio模型

简介: 72B和1.8B是两个不同的模型,具体区别如下:- 72B是一个相对较大的模型,拥有72个亿个参数,而1.8B只有180亿个参数。

72B和1.8B是两个不同的模型,具体区别如下:

  • 72B是一个相对较大的模型,拥有72个亿个参数,而1.8B只有180亿个参数。
  • 72B是一个多模态模型,可以处理文本、图像、语音等多种模态的数据,而1.8B是一个纯文本模型,只能处理文本数据。
  • 72B和1.8B使用的预训练目标也不同,72B使用的是CLUE(Contrastive Learning of Unsupervised Embeddings)预训练目标,而1.8B使用的是BERT(Bidirectional Encoder Representations from Transformers)预训练目标。

Audio模型是一种专门用于处理音频数据的模型,与72B和1.8B不同,它不是一个多模态模型,也不是一个纯文本模型。Audio模型使用的预训练目标通常是Mel谱的线性预测或者MSE(Mean Squared Error)损失函数。
下面是几个demo的对比:

  1. 72B模型:https: //hfl.github.io/demo/72B/
  • 示例:输入“一只猫”,输出猫的图片、文本和音频的相关信息。
  • 特点:处理多种模态的数据,生成的结果比较丰富。
  1. 1.8B模型:https://hfl.github.io/demo/1.8B/
  • 示例:输入“猫”,输出与“猫”相关的文章、图片和音频。
  • 特点:纯文本模型,生成的结果比较简洁。
  1. Audio模型:https: //hfl.github.io/demo/Audio/
  • 示例:输入音频文件,输出音频文件的Mel谱和线性预测结果。
  • 特点:专门用于处理音频数据,生成的结果比较专业。

总的来说,72B和1.8B模型更适合于处理多模态数据,而生成的结果比较丰富;Audio模型更适合于处理音频数据,而生成的结果比较专业。

目录
相关文章
|
编解码 自然语言处理
重磅!阿里巴巴开源最大参数规模大模型——高达720亿参数规模的Qwen-72B发布!还有一个的18亿参数的Qwen-1.8B
阿里巴巴开源了720亿参数规模的Qwen-72B大语言模型,是目前国内最大参数规模的开源模型。该模型在3万亿tokens数据上训练,支持多种语言和代码、数学等数据。Qwen-72B模型具有出色的评估效果,在数学逻辑和意图理解等方面超过了其他开源模型,并且支持多语言扩展。此外,阿里巴巴还开源了18亿参数规模的Qwen-1.8B模型,虽然规模较小但效果不错。Qwen-72B模型已对学术和个人完全开放,商用情况下月活低于100万可直接商用。有兴趣的用户可以通过相关链接获取模型地址和资源信息。
CocosCreator 面试题(十六)Cocos Creator 节点池的基本原理是什么?如何使用?
CocosCreator 面试题(十六)Cocos Creator 节点池的基本原理是什么?如何使用?
942 0
|
4月前
|
人工智能 运维 监控
基于MCP的一体化AI管线:从模型训练到部署监控的全链路解析
本文介绍基于MCP(模型控制流水线)的一体化AI部署架构,涵盖从模型训练、自动部署、实时推理到性能监控的完整闭环系统设计,并结合工业制造、能源、IoT等场景,提供代码实现与落地案例,助力企业实现AI自动化运维与智能化升级。
基于MCP的一体化AI管线:从模型训练到部署监控的全链路解析
|
7月前
|
存储 人工智能 项目管理
2025年GitHub平台上的十大开源MCP服务器汇总分析
本文深入解析了GitHub上十个代表性MCP(Model Context Protocol)服务器项目,探讨其在连接AI与现实世界中的关键作用。这些服务器实现了AI模型与应用程序、数据库、云存储、项目管理等工具的无缝交互,扩展了AI的应用边界。文中涵盖Airbnb、Supabase、AWS-S3、Kubernetes等领域的MCP实现方案,展示了AI在旅行规划、数据处理、云存储、容器编排等场景中的深度应用。未来,MCP技术将向标准化、安全性及行业定制化方向发展,为AI系统集成提供更强大的支持。
1680 2
2025年GitHub平台上的十大开源MCP服务器汇总分析
|
7月前
|
人工智能 算法 程序员
揭秘 AI 编程工具的费用真相:2025 年开发者视角-优雅草卓伊凡
揭秘 AI 编程工具的费用真相:2025 年开发者视角-优雅草卓伊凡
382 1
揭秘 AI 编程工具的费用真相:2025 年开发者视角-优雅草卓伊凡
|
8月前
|
数据采集 监控 大数据
数据治理之道:用代码撑起数据质量的保护伞
数据治理之道:用代码撑起数据质量的保护伞
228 26
|
9月前
|
内存技术
关于 Qwen-Omni 模型的音频输出格式转换
Qwen-Omni 官方文档声称音频输出为 WAV 格式,但实际上为 PCM 格式。通过将每个 chunk 的 base64 编码音频数据解码并拼接,可生成 24kHz、16位、单声道的 PCM 文件。使用 FFMPEG 可将其转换为其他格式,如 MP3。示例代码展示了如何解码并转换音频文件。
|
11月前
|
存储 虚拟化 iOS开发
VMware ESXi 7.0 U3r 发布 - 领先的裸机 Hypervisor
VMware ESXi 7.0 U3r 发布 - 领先的裸机 Hypervisor
399 5
VMware ESXi 7.0 U3r 发布 - 领先的裸机 Hypervisor
|
11月前
|
分布式计算 DataWorks 搜索推荐
DataWorks产品评测:大数据开发治理平台的最佳实践与体验
DataWorks是阿里云推出的一款大数据开发治理平台,集成了多种大数据引擎,支持数据集成、开发、分析和任务调度。本文通过用户画像分析的最佳实践,评测了DataWorks的功能和使用体验,并提出了优化建议。通过实践,DataWorks在数据整合、清洗及可视化方面表现出色,适合企业高效管理和分析数据。
444 0
|
存储 运维 定位技术
恢复点目标(Recovery Point Objective,简称RPO)
恢复点目标(Recovery Point Objective,简称RPO)
1855 3