震惊AI界!DeepSeek挑战GPT-4o霸主地位,发布超低价开源大模型

简介: 震惊AI界!DeepSeek挑战GPT-4o霸主地位,发布超低价开源大模型

震惊AI界!DeepSeek挑战GPT-4o霸主地位,发布超低价开源大模型

DeepSeek-V2 的综合能力

中文综合能力(AlignBench):开源模型中最强,与 GPT-4-Turbo、文心 4.0 等闭源模型在评测中处于同一梯队

英文综合能力(MT-Bench) :处于第一梯队 英文综合能力(MT-Bench)与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B

知识:知识、数学、推理、编程等榜单结果位居前列

上下文:开源模型和 API 支持 128K 上下文

性能

一些分析报告指出,DeepSeek V2 模型在训练时使用了高达8.1万亿个token,并且展示了令人难以置信的高效训练能力,其计算需求仅为Meta Llama 3 70B模型的五分之一。

换一种说法,DeepSeek-V2 在训练时所需的计算资源仅为 GPT-4 的二十分之一,但性能上却相差无几。

有外国网友对此给予了极高的评价,认为 DeepSeek V2 在仅有210亿个活跃参数的情况下,能够展现出如此强大的推理能力,实在令人震惊。

DeepSeek API 定价(价格屠夫)

作为AI技术的前沿领域,大模型更新换代之快有目共睹,再强的性能也可能在发布的下一秒就被友商反超。

因此,DeepSeek 选择“卷”价格。

目前DeepSeek-V2 API的定价为:每百万token输入1元、输出2元(32K上下文)

和友商相比,仅为 GPT-4-Turbo 的近百分之一

最后

DeepSeek 宣称,其使用8个H800 GPU的单台服务器在最佳状态下每秒能够处理超过50000个解码token。

如果只考虑按照输出 tokenAPI 计费,那么每个服务器每小时可以赚取超过50美元。

假设服务器的使用率是100%,并且每个8个 H800 GPU 的服务器每小时的成本是15美元,那么 DeepSeek 的每台服务器每小时的净收益高达35美元以上,毛利率甚至超过70%。

有专家分析认为,即便服务器的使用率没有达到最大,或者批处理速度没有达到最高性能,DeepSeek 依然拥有可观的利润空间。

总结就是,主打一个“经济实惠”,简直就是AI版“拼多多”。



相关文章
|
6月前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
6月前
|
人工智能 测试技术 API
构建AI智能体:二、DeepSeek的Ollama部署FastAPI封装调用
本文介绍如何通过Ollama本地部署DeepSeek大模型,结合FastAPI实现API接口调用。涵盖Ollama安装、路径迁移、模型下载运行及REST API封装全过程,助力快速构建可扩展的AI应用服务。
2078 7
|
6月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
7221 94
|
7月前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
663 2
|
6月前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
646 5
我们开源了一款 AI 驱动的用户社区
|
6月前
|
人工智能 搜索推荐 UED
一个牛逼的国产AI自动化工具,开源了 !
AiPy是国产开源AI工具,结合大语言模型与Python,支持本地部署。用户只需用自然语言描述需求,即可自动生成并执行代码,轻松实现数据分析、清洗、可视化等任务,零基础也能玩转编程,被誉为程序员的智能助手。
|
7月前
|
人工智能 安全 架构师
开放、协同,2025 云栖大会“操作系统开源与 AI 进化分论坛”精彩回顾
唯有通过生态开放与技术共享,才能加速 AI 技术的普惠与产业化落地。
|
存储 SQL 数据库
Python 金融编程第二版(GPT 重译)(四)(4)
Python 金融编程第二版(GPT 重译)(四)
354 3

热门文章

最新文章