简介: 本篇文章学习思路来源于【MaxCompute SQL AI 实操教程】0元体验使用大模型提效数据分析
https://developer.aliyun.com/article/1691912?spm=a2c6h.40901583.J_4084600820.3.3b0a3b32OrIIHd
MaxCompute SQL AI 让开发者无需切换开发环境、无需学习新框架,仅通过熟悉的 SELECT 语句就能调用 AI 能力,实现语义理解、内容生成等 AI 增强计算。本文档以 MaxCompute SQL AI 调用公有 Qwen3-1.7B 模型实现评论情感分析为例,详细介绍核心代码逻辑、执行流程、效果验证及使用注意事项,帮助 MaxCompute SQL 开发者快速掌握 “SQL+AI” 的轻量化情感分析落地方式。
MaxCompute SQL AI 支持直接通过 SQL 语句调用阿里云公有大模型,无需切换开发环境、无需掌握 AI 框架开发能力。本示例基于通义千问轻量版模型(Qwen3-1.7B-GGUF),实现对文本评论的情感分类(正面 / 负面 / 中性),适用于电商、客服、舆情分析等轻量级文本处理场景。
核心配置与数据表准备
-- 关键配置:开启MaxCompute公有模型使用权限(必选) SET odps.sql.using.public.model=true; -- 创建测试评论表:存储待分析的评论数据 CREATE TABLE IF NOT EXISTS test_sentiment_comments ( comment_id BIGINT COMMENT '评论唯一标识ID', comment_text STRING COMMENT '待分析的评论内容' ) COMMENT '情感分析测试评论表'; -- 插入测试数据:覆盖正面、中性、负面三类情感场景 INSERT INTO test_sentiment_comments VALUES (1, '今天天气真好,心情很不错!阳光明媚,适合出去散步。'), (2, '今天天气真好,心情很不错!阳光明媚'), (3, '科技发展日新月异,人工智能改变生活。'), (4, '防控措施很到位,为医护人员点赞!'), (5, '这个商品质量很差'), (6, '快递速度还行,但包装有点破损,整体一般'), (7, '这家餐厅的菜味道一般,服务也不热情,不会再来了');
调用 Qwen3-1.7B 模型实现情感分析
-- 核心逻辑:调用公有模型进行情感分类 SELECT comment_id, comment_text, -- AI_GENERATE函数:调用Qwen3-1.7B模型生成情感分析结果 AI_GENERATE( bigdata_public_modelset.default.Qwen3-1.7B-GGUF, -- 公有模型地址 DEFAULT_VERSION, -- 使用模型默认版本 -- 提示词:精准约束模型输出范围,添加/no_think减少冗余输出 concat('请对以下评论进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的评论:', comment_text, ' /no_think') ) AS sentiment_result FROM test_sentiment_comments;
代码关键说明
SET odps.sql.using.public.model=true;开启公有模型调用权限,无此配置会导致模型调用失败
test_sentiment_comments业务数据表,存储结构化的评论 ID 和非结构化的评论文本
AI_GENERATEMaxCompute SQL AI 核心函数,用于调用大模型生成内容
bigdata_public_modelset.default.Qwen3-1.7B-GGUF阿里云公有模型地址,指定使用轻量版通义千问模型
concat(...)构造精准提示词,核心作用是:1. 明确任务(情感分析分类);2. 限定输出范围(仅正面 / 负面 / 中性);3. 添加
/no_think标记,避免模型输出冗余描述
执行效果与验证
为了达到测试的效果,以下内容的设置需要进行说明:
- 输出准确性:模型严格遵循提示词约束,仅输出 “正面 / 负面 / 中性” 三类结果,无冗余内容,可直接用于后续业务逻辑处理;
- 场景适配性:能准确识别纯正面、纯负面评论,也可区分无明确情感倾向、正反混合的中性评论;
- 执行效率:7 条数据调用模型分析总耗时约 2.5 秒,轻量模型适配小批量数据快速分析。
同时,通过简单的使用,总结一下的使用注意事项:
- 权限配置:必须执行
SET odps.sql.using.public.model=true;开启公有模型权限,否则会提示模型访问失败; - 提示词编写:需明确限定输出范围,避免模型输出非预期内容(如 “该评论偏向正面”),
/no_think标记建议必加; - 模型选择:Qwen3-1.7B 适合简单文本分类,复杂语义分析可替换为 Qwen3-7B/14B(需确认模型权限);
- 数据规范:评论文本避免包含特殊字符(如 emoji、乱码),否则可能影响模型分析准确性;
- 结果校验:批量处理时建议抽样校验结果准确性,对特殊场景可优化提示词或更换更大模型。
MaxCompute SQL AI 通过AI_GENERATE函数实现 SQL 与公有大模型的无缝衔接,无需 AI 开发经验即可落地文本分析能力;精准的提示词 +/no_think标记是保证模型输出格式统一、可用的核心;Qwen3-1.7B 轻量模型在简单情感分析场景中具备 “快、准、省” 的特点,适合中小规模数据的 AI 增强计算。