大模型服务平台百炼的搜索结果_热门_第7页-阿里云开发者社区

AI未闻花名

|

3天前

|

博文

|

摘要：信息论是人工智能尤其是大语言模型的核心数学工具。本文系统介绍了八大核心概念：信息量：衡量事件意外程度，公式为I(x)=-log₂P(x) 信息熵：评估系统不确定性，H(X)=-ΣP(x)log₂P(x) 联合熵/条件熵：分析多变量关系及条件不确定性互信息：量化变量间共享信息量 KL散度：衡量概率分布差异交叉熵：模型训练的核心损失函数在大语言模型中，这些概念被广泛应用于：训练阶段：交叉熵优化预测，KL散度防止过拟合推理阶段：温度参数调节生成文本的创造性（高熵增加多样性）

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法 # Python

bailiantest1

|

博文

|

来自：阿里云百炼

全新开源通义千问Qwen3上架阿里云百炼

Qwen3是Qwen系列大型语言模型的最新成员，作为混合推理模型，其旗舰版本Qwen3-235B-A22B在代码、数学和通用能力测试中表现出色，与顶级模型DeepSeek-R1、o1、o3-mini等相比具有竞争力。小型MoE模型Qwen3-30B-A3B激活参数仅为QwQ-32B的10%，性能更优，甚至小规模模型Qwen3-4B也能匹敌Qwen2.5-72B-Instruct。Qwen3支持思考与非思考两种模式，可根据任务需求灵活调整推理深度，并支持119种语言，Qwen3在推理、工具调用及多语言处理等方面显著提升，目前已开源并在阿里云百炼平台上线，提供便捷体验。

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 测试技术 # API

bailiantest1

|

7天前

|

博文

|

来自：阿里云百炼

阿里云析言XiYan-SQL智能体，登顶BIRD-CRITIC全球榜单！

阿里云飞天实验室自研数据分析智能体“析言 XiYan-SQL”在全球权威SQL诊断基准BIRD-CRITIC（SWE-SQL）多项榜单中排名第一，超越国内外顶尖团队。该模型在真实数据库问题诊断、跨方言鲁棒性、复杂SQL处理及分布外泛化等方面表现卓越，支持MySQL、PostgreSQL等主流数据库。技术上创新采用模式筛选、多生成器集成与候选重组策略，提升SQL生成质量与系统适应性。核心模型已开源至GitHub、ModelScope和Hugging Face，欢迎开发者体验贡献。

# 大模型服务平台百炼 # SQL # 关系型数据库 # 数据挖掘 # MySQL # 数据库

游客3wlkklvxbishq

|

5天前

|

博文

|

来自：阿里云百炼

SpringAI+DeepSeek大模型应用开发

SpringAI整合主流大模型，支持对话、函数调用与RAG，提供统一API，简化开发。涵盖多模态、流式传输、会话记忆等功能，助力快速构建AI应用。

# 大模型服务平台百炼 # 人工智能 # 自然语言处理 # 前端开发 # Java # 数据库

HELLO程序员

|

4天前

|

博文

|

来自：阿里云百炼

技术赋能医药全链路：AI 大模型应用在药企的落地痛点与破局之道

本文阐述AI技术在制药行业的深度变革，涵盖企业微信私有化部署、CRM系统智能升级、Data-Agent演进等全链路转型实践，结合RAG优化与幻觉控制方案，推动业务提效与合规双提升，展现AI赋能下行业模式的重塑路径。

# 大模型服务平台百炼 # 数据采集 # 人工智能 # 自然语言处理 # 文字识别 # 安全

不知何名的mxsz-17011

|

博文

|

来自：通义大模型

Qwen模型角色扮演最佳实践

角色扮演大模型通过模拟特定角色的行为、语言风格和情感表达，实现高度拟人化和定制化的互动体验。与传统通用模型相比，角色扮演模型在语言风格、性格特征和情绪反应上更加细腻，提供更真实的交互体验。本文介绍了如何通过system prompt、few-shot学习和微调等技术实现大模型的拟人化，包括使用阿里云百炼平台进行角色扮演测试，以及如何通过合成数据和Lora微调提高模型的表演效果。最终，展示了如何通过优化数据质量和训练策略，显著提升角色扮演模型的表现。

# 大模型服务平台百炼 # 数据采集 # 人工智能 # 自然语言处理 # 物联网 # Swift

阿里云智能-系统运维管理团队

|

8月前

|

博文

|

来自：弹性计算

阿里云 MCP Server 开箱即用！

本文介绍了如何通过alibaba-cloud-ops-mcp-server和MCP（Model Context Protocol）实现AI助手对阿里云资源的复杂任务操作。内容涵盖背景、准备步骤（如使用VS Code与Cline配置MCP Server）、示例场景（包括创建实例、监控实例、运行命令、启停实例等），以及支持的工具列表和参考文档。借助这些工具，用户可通过自然语言与AI助手交互，完成ECS实例管理、VPC查询、云监控数据获取等运维任务，实现高效“掌上运维”。

# 大模型服务平台百炼 # 人工智能 # 弹性计算 # 运维 # API # 关系型数据库

喜欢猪猪

|

5月前

|

博文

|

来自：通义大模型

# Qwen3-8B 的 TTFT 性能分析：16K 与 32K 输入 Prompt 的推算公式与底层原理详解

Qwen3-8B 是通义实验室推出的 80 亿参数大模型，支持最长 32,768 token 上下文，适用于长文本处理场景。通过 FP8 量化、CUDA Kernel 优化及 RoPE 位置编码技术，提升推理效率与稳定性。模型在 16K 输入下 TTFT 约 150-200ms，32K 输入下约 250-300ms，适用于文档摘要与长对话交互。

# 大模型服务平台百炼 # 存储 # 缓存 # 资源调度 # 并行计算 # 异构计算

游客7ntycxfoyzgpi

|

5天前

|

博文

|

来自：通义大模型

大模型如何重塑语音交互？AI外呼五大技术变革正在发生

语音交互的未来是“智能体”

# 大模型服务平台百炼 # 人工智能 # 自然语言处理 # 安全 # 语音技术 # 开发者

-开发达人-

|

博文

|

来自：通义大模型

免费、可商用，阿里云开源70亿参数通义千问大模型

# 大模型服务平台百炼 # 人工智能

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

大模型服务平台百炼