太香了!MaxCompute SQL AI:一行 SELECT 搞定情感分析|MaxCompute 实战

简介: 本文介绍MaxCompute SQL AI如何通过`AI_GENERATE`函数,直接在SQL中调用通义千问Qwen3-1.7B模型实现轻量级评论情感分析(正面/负面/中性)。无需切换环境、无需AI开发经验,仅需标准SELECT语句+精准提示词(含`/no_think`),即可完成端到端分析,兼顾准确性、效率与易用性。

简介: 本篇文章学习思路来源于【MaxCompute SQL AI 实操教程】0元体验使用大模型提效数据分析

https://developer.aliyun.com/article/1691912?spm=a2c6h.40901583.J_4084600820.3.3b0a3b32OrIIHd


MaxCompute SQL AI 让开发者无需切换开发环境、无需学习新框架,仅通过熟悉的 SELECT 语句就能调用 AI 能力,实现语义理解、内容生成等 AI 增强计算。本文档以 MaxCompute SQL AI 调用公有 Qwen3-1.7B 模型实现评论情感分析为例,详细介绍核心代码逻辑、执行流程、效果验证及使用注意事项,帮助 MaxCompute SQL 开发者快速掌握 “SQL+AI” 的轻量化情感分析落地方式。


MaxCompute SQL AI 支持直接通过 SQL 语句调用阿里云公有大模型,无需切换开发环境、无需掌握 AI 框架开发能力。本示例基于通义千问轻量版模型(Qwen3-1.7B-GGUF),实现对文本评论的情感分类(正面 / 负面 / 中性),适用于电商、客服、舆情分析等轻量级文本处理场景。


核心配置与数据表准备

-- 关键配置:开启MaxCompute公有模型使用权限(必选)
SET odps.sql.using.public.model=true;

-- 创建测试评论表:存储待分析的评论数据
CREATE TABLE IF NOT EXISTS test_sentiment_comments (
    comment_id BIGINT COMMENT '评论唯一标识ID',
    comment_text STRING COMMENT '待分析的评论内容'
) COMMENT '情感分析测试评论表';

-- 插入测试数据:覆盖正面、中性、负面三类情感场景
INSERT INTO test_sentiment_comments VALUES
(1, '今天天气真好,心情很不错!阳光明媚,适合出去散步。'),
(2, '今天天气真好,心情很不错!阳光明媚'),
(3, '科技发展日新月异,人工智能改变生活。'),
(4, '防控措施很到位,为医护人员点赞!'),
(5, '这个商品质量很差'),
(6, '快递速度还行,但包装有点破损,整体一般'),
(7, '这家餐厅的菜味道一般,服务也不热情,不会再来了');


调用 Qwen3-1.7B 模型实现情感分析

-- 核心逻辑:调用公有模型进行情感分类
SELECT 
    comment_id,
    comment_text,
    -- AI_GENERATE函数:调用Qwen3-1.7B模型生成情感分析结果
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,  -- 公有模型地址
        DEFAULT_VERSION,                                   -- 使用模型默认版本
        -- 提示词:精准约束模型输出范围,添加/no_think减少冗余输出
        concat('请对以下评论进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的评论:', comment_text, ' /no_think')
    ) AS sentiment_result
FROM test_sentiment_comments;


代码关键说明

SET odps.sql.using.public.model=true;开启公有模型调用权限,无此配置会导致模型调用失败

test_sentiment_comments业务数据表,存储结构化的评论 ID 和非结构化的评论文本

AI_GENERATEMaxCompute SQL AI 核心函数,用于调用大模型生成内容

bigdata_public_modelset.default.Qwen3-1.7B-GGUF阿里云公有模型地址,指定使用轻量版通义千问模型

concat(...)构造精准提示词,核心作用是:1. 明确任务(情感分析分类);2. 限定输出范围(仅正面 / 负面 / 中性);3. 添加

/no_think标记,避免模型输出冗余描述


执行效果与验证

image.png

image.png


为了达到测试的效果,以下内容的设置需要进行说明:

  • 输出准确性:模型严格遵循提示词约束,仅输出 “正面 / 负面 / 中性” 三类结果,无冗余内容,可直接用于后续业务逻辑处理;
  • 场景适配性:能准确识别纯正面、纯负面评论,也可区分无明确情感倾向、正反混合的中性评论;
  • 执行效率:7 条数据调用模型分析总耗时约 2.5 秒,轻量模型适配小批量数据快速分析。


同时,通过简单的使用,总结一下的使用注意事项:

  • 权限配置:必须执行SET odps.sql.using.public.model=true;开启公有模型权限,否则会提示模型访问失败;
  • 提示词编写:需明确限定输出范围,避免模型输出非预期内容(如 “该评论偏向正面”),/no_think标记建议必加;
  • 模型选择:Qwen3-1.7B 适合简单文本分类,复杂语义分析可替换为 Qwen3-7B/14B(需确认模型权限);
  • 数据规范:评论文本避免包含特殊字符(如 emoji、乱码),否则可能影响模型分析准确性;
  • 结果校验:批量处理时建议抽样校验结果准确性,对特殊场景可优化提示词或更换更大模型。


MaxCompute SQL AI 通过AI_GENERATE函数实现 SQL 与公有大模型的无缝衔接,无需 AI 开发经验即可落地文本分析能力;精准的提示词 +/no_think标记是保证模型输出格式统一、可用的核心;Qwen3-1.7B 轻量模型在简单情感分析场景中具备 “快、准、省” 的特点,适合中小规模数据的 AI 增强计算。

目录
相关文章
|
11天前
|
人工智能 Cloud Native API
从零到一:如何通过 OpenClaw 快速构建企业级专属 AI Agent 指南
阿里云OpenClaw是云原生大模型应用开发平台,提供低代码编排、强大RAG引擎、弹性架构与丰富插件,助企业快速构建深度耦合业务数据的专属AI Agent,降低大模型应用开发门槛。
243 0
|
1月前
|
人工智能 自然语言处理 网络安全
OpenClaw Skills是什么:一文读懂OpenClaw Skills+一键部署全教程,新手零代码上手
本文结合2026年最新版本特性、阿里云官方实操指南、OpenClaw官方Skills文档及开发者社区经验,全面解答“OpenClaw Skills是什么、能做什么”,详细拆解阿里云OpenClaw(Clawdbot)一键部署完整流程(含简单速记步骤),补充Skills安装、使用、管理全教程,搭配可直接复制的代码命令,语言通俗易懂、步骤清晰可落地,,确保新手小白既能吃透Skills核心逻辑,也能跟着步骤完成部署、灵活运用各类技能,真正让OpenClaw成为提升效率的“专属数字员工”。
3990 9
|
1月前
|
人工智能 API 机器人
OpenClaw 用户部署和使用指南汇总
本文档为OpenClaw(原MoltBot)官方使用指南,涵盖一键部署(阿里云轻量服务器年仅68元)、钉钉/飞书/企微等多平台AI员工搭建、典型场景实践及高频问题FAQ。同步更新产品化修复进展,助力用户高效落地7×24小时主动执行AI助手。
18006 87
|
16天前
|
SQL 关系型数据库 MySQL
分库分表下的分页查询:底层逻辑、全场景坑点与生产级最优解
分库分表环境下分页查询的挑战与解决方案 在分库分表架构中,传统分页查询面临数据错乱、性能下降等核心问题。本文剖析了五种主流解决方案: 全局视野法:全量查询后归并排序,保证准确性但性能随分页深度下降 游标分页法:基于值定位,性能稳定但仅支持顺序翻页 分片键路由法:精准定位分片,性能最优但需携带分片键 ES索引法:支持复杂查询和跳页,但引入额外组件 范围分片优化:减少扫描分片数,仅适用于范围分片场景 生产实践需注意排序字段唯一性、深分页限制、分片键选择等关键点。
155 2
|
16天前
|
存储 监控 API
百炼知识库扣费看不懂?阿里云百炼计费逻辑:规格费 + Token 费一次讲透
阿里云百炼知识库自2026年1月4日起正式计费,采用“规格费+Token费”双轨模式:规格费按标准版(0.03元/库/小时)或旗舰版(0.2元/RCU/小时)计;Token费按向量/排序模型实际调用量计(如0.0005元/千Token)。支持免费额度、资源包与后付费三级抵扣,含成本优化建议。
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元
阿里巴巴开源全新一代千问Qwen3.5-Plus:全球最强开源大模型,3970亿参数、仅激活170亿,原生多模态,支持图文视频理解与长视频分析;推理吞吐量最高提升19倍,API价格低至0.8元/百万Token。
以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元
|
16天前
|
人工智能 API
重磅!阿里云Coding Plan全面上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5
阿里云Coding Plan上线Qwen3.5、GLM-5、M2.5、K2.5四大顶尖开源模型,支持Qwen Code等工具自由切换。Lite/Pro套餐首月仅7.9元/39.9元,分别享1.8万/9万次请求。Qwen3.5以397B总参、17B激活参数实现高性价比,全面优化编程与Agent能力。
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
以小胜大!千问Qwen3.5重磅发布,每百万Token仅0.8元
阿里巴巴开源全新一代千问Qwen3.5-Plus,全球最强开源大模型:3970亿参数、仅激活170亿,原生多模态,支持图文视频理解与视觉编程;推理吞吐量最高提升19倍,API价格低至0.8元/百万Token。
|
11天前
|
消息中间件 运维 监控
利用阿里云 Serverless 架构构建游戏广告投放实时监控系统
本文介绍如何用阿里云Serverless服务(函数计算FC、RocketMQ、Tablestore)构建高并发、低成本的广告回调实时监控系统,支持秒级归因与聚合分析,零运维、弹性扩缩容,助力游戏买量高效决策。
57 1
|
1月前
|
存储 数据采集 人工智能
未来三年的核心竞争力:构建你的专属智能体
未来三年核心竞争力在于构建专属智能体——它不仅是工具,更是具备主动推理、长期记忆、多模态执行与社交协作能力的“第二大脑”。通过私有化部署、Agent集群编排与API生态接入,学生可实现人机深度协同,在职场与教育中赢得先机。(239字)
254 4

热门文章

最新文章