MaxCompute SQL AI 实操:使用大模型提效工作总结统计分析

简介: MaxCompute SQL AI赋能企业智能分析,通过SQL语句即可实现工作总结的自动分类、情感分析、关键信息提取与报告生成,无需复杂工具,高效安全地完成数据洞察,助力管理层快速决策。

一、引言

在企业日常运营中,工作总结统计是一项高频且重要的数据分析任务。传统的数据分析方法往往需要编写复杂的SQL查询、使用多种工具进行数据处理和可视化,耗时耗力。随着大模型技术的发展,MaxCompute SQL AI 全新上线,让数据分析师可以用熟悉的SQL语言直接调用大模型,实现更智能、更高效的数据分析。

本文将以"工作总结统计类数据"为主题,展示如何使用MaxCompute SQL AI功能,通过简单的SQL语句完成工作总结的智能分析,包括工作内容分类、情感倾向分析、关键信息提取等任务,帮助企业快速洞察员工工作状态和业绩情况。

二、场景描述

假设我们是一家互联网公司的HR分析师,需要对公司员工的季度工作总结进行统计分析。具体需求如下:

  1. 对员工工作总结进行自动分类(如项目开发、产品设计、运营推广、客户服务等)
  2. 分析工作总结中表达的情感倾向(正面、中性、负面)
  3. 提取工作总结中的关键成果和KPI完成情况
  4. 生成结构化的统计报告,方便管理层快速了解整体工作情况

传统方法需要:

  • 手动整理和分类工作总结
  • 使用复杂的文本分析工具进行情感分析
  • 人工提取关键信息
  • 花费大量时间生成报告

而使用MaxCompute SQL AI,我们可以通过简单的SQL语句实现上述全部功能。

三、准备工作

3.1 环境准备

  1. 登录MaxCompute控制台,创建一个MaxCompute项目
  2. 确保项目已开通SQL AI功能
  3. 配置好SQL开发环境(如DataWorks或MaxCompute客户端)

3.2 数据准备

我们首先需要创建一个包含员工工作总结的表:

-- 创建员工工作总结表
CREATE TABLE IF NOT EXISTS employee_work_summary (
    employee_id STRING COMMENT '员工ID',
    employee_name STRING COMMENT '员工姓名',
    department STRING COMMENT '所属部门',
    work_summary STRING COMMENT '工作总结内容',
    submission_date STRING COMMENT '提交日期'
);

-- 插入示例数据
INSERT INTO employee_work_summary VALUES
('E001', '张三', '技术部', '本季度主要完成了用户管理系统的升级开发,修复了3个关键bug,提升了系统性能约20%。同时参与了新项目的需求评审和技术方案设计,工作进展顺利。', '2025-03-31'),
('E002', '李四', '产品部', '本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线,用户反馈良好。但在跨部门协作中遇到了一些沟通障碍,导致部分功能延迟交付。', '2025-03-31'),
('E003', '王五', '运营部', '本季度组织了3场线上营销活动,累计参与人数超过10万,带来了2000个新用户注册。活动效果超出预期,团队配合默契。', '2025-03-31'),
('E004', '赵六', '客服部', '本季度处理了1500个客户投诉,解决率达到95%。通过优化客服流程,客户满意度提升了10%。但由于系统问题,部分投诉处理延迟,需要进一步改进。', '2025-03-31'),
('E005', '孙七', '技术部', '本季度主要负责数据仓库的维护和优化,完成了数据模型的重构,提高了查询效率。同时学习了新的大数据技术,为团队分享了相关知识。', '2025-03-31');

四、实操步骤

4.1 启用公共模型

首先,我们需要启用MaxCompute的公共模型功能:

SET odps.sql.using.public.model=true;

4.2 工作内容自动分类

使用MaxCompute SQL AI的AI_GENERATE函数,对员工工作总结进行自动分类:

SET odps.sql.using.public.model=true;
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary, ' /no_think')
    ) AS work_category
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary work_category
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 项目开发
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 产品设计
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 运营推广
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 客户服务
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 项目开发

4.3 情感倾向分析

结合用户提供的情感分析代码风格,我们可以优化情感分析功能。这里使用了/no_think指令后缀,有助于提高模型响应速度:

SET odps.sql.using.public.model=true;
SELECT  
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请对以下员工工作总结进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的工作总结:', work_summary, ' /no_think')
    ) AS sentiment
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary sentiment
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 正面
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 中性
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 正面
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 中性
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 正面

4.4 批量多维度分析

我们还可以将用户提供的代码结构扩展为批量多维度分析,同时完成分类和情感分析:

SET odps.sql.using.public.model=true;
SELECT  
    employee_id,
    employee_name,
    department,
    work_summary,
    -- 工作内容分类
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称。工作总结内容:', work_summary, ' /no_think')
    ) AS work_category,
    -- 情感倾向分析
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请对以下员工工作总结进行情感分析分类,输出结果仅限于以下三个选项之一:正面、负面、中性。待分析的工作总结:', work_summary, ' /no_think')
    ) AS sentiment,
    -- 工作态度分析
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结中体现的工作态度,输出结果仅限于以下三个选项之一:积极主动、一般、消极被动。工作总结内容:', work_summary, ' /no_think')
    ) AS work_attitude
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary work_category sentiment work_attitude
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 项目开发 正面 积极主动
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 产品设计 中性 一般
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 运营推广 正面 积极主动
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 客户服务 中性 一般
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 项目开发 正面 积极主动

4.5 关键信息提取

从工作总结中提取关键成果和KPI完成情况:

SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
    ) AS sentiment
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary sentiment
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 正面
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 中性
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 正面
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 中性
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 正面

4.4 关键信息提取

从工作总结中提取关键成果和KPI完成情况:

SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请从以下员工工作总结中提取关键成果和KPI完成情况,使用分号分隔。工作总结内容:', work_summary)
    ) AS key_achievements
FROM employee_work_summary;

执行结果:

employee_id employee_name department work_summary key_achievements
E001 张三 技术部 本季度主要完成了用户管理系统的升级开发... 完成用户管理系统升级开发;修复3个关键bug;提升系统性能约20%;参与新项目需求评审和技术方案设计
E002 李四 产品部 本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线... 完成产品A的迭代优化;完成5个功能模块的设计和上线;用户反馈良好
E003 王五 运营部 本季度组织了3场线上营销活动,累计参与人数超过10万... 组织3场线上营销活动;参与人数超过10万;带来2000个新用户注册;活动效果超出预期
E004 赵六 客服部 本季度处理了1500个客户投诉,解决率达到95%... 处理1500个客户投诉;投诉解决率95%;优化客服流程;客户满意度提升10%
E005 孙七 技术部 本季度主要负责数据仓库的维护和优化,完成了数据模型的重构... 完成数据仓库的维护和优化;完成数据模型重构;提高查询效率;学习新的大数据技术并分享

4.6 生成结构化统计报告

基于以上分析结果,生成结构化的统计报告:

-- 创建分类统计视图
CREATE OR REPLACE VIEW work_summary_statistics AS
SELECT 
    department,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
    ) AS work_category,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 生成部门统计报告
SELECT 
    department,
    work_category,
    sentiment,
    COUNT(*) AS employee_count,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请为以下部门工作统计数据生成一段简洁的分析报告:部门:', department, ',工作类别:', work_category, ',情感倾向:', sentiment, ',员工数量:', CAST(COUNT(*) AS STRING))
    ) AS analysis
FROM work_summary_statistics
GROUP BY department, work_category, sentiment;

执行结果:

department work_category sentiment employee_count analysis
技术部 项目开发 正面 2 技术部共有2名员工从事项目开发工作,他们的工作总结都表现出正面情感,说明技术团队对本季度工作成果较为满意。
产品部 产品设计 中性 1 产品部有1名员工从事产品设计工作,工作总结情感倾向为中性,可能需要关注跨部门协作中遇到的沟通问题。
运营部 运营推广 正面 1 运营部有1名员工从事运营推广工作,工作总结表现出正面情感,活动效果超出预期,团队配合默契。
客服部 客户服务 中性 1 客服部有1名员工从事客户服务工作,工作总结情感倾向为中性,虽然解决率达到95%,但系统问题导致的投诉处理延迟需要改进。

五、综合分析与应用

5.1 管理层决策支持

通过MaxCompute SQL AI的分析结果,管理层可以快速了解:

  1. 各部门工作分布情况:技术部主要从事项目开发,产品部负责产品设计,运营部专注于运营推广,客服部处理客户服务。

  2. 员工工作态度:大部分员工对工作表现出正面情感,说明整体工作氛围良好。

  3. 关键成果与问题

    • 技术部完成了系统升级和性能优化
    • 产品部遇到了跨部门协作问题
    • 运营部活动效果超出预期
    • 客服部需要解决系统问题导致的投诉延迟

5.2 后续优化建议

基于分析结果,我们可以提出以下优化建议:

  1. 加强跨部门协作:针对产品部遇到的沟通障碍,建议组织跨部门协作培训或建立更有效的沟通机制。

  2. 系统升级与维护:客服部提到的系统问题需要尽快解决,以提高客户满意度。

  3. 经验分享与复制:运营部的成功经验可以在公司内部分享,帮助其他部门提升工作效果。

  4. 个性化激励:针对表现优秀的员工,可以提供个性化的激励措施,保持团队的积极性。

六、使用体验与总结

6.1 使用体验

  1. 零门槛使用:不需要学习新的编程语言或工具,只需使用熟悉的SQL语句即可完成复杂的AI分析任务。

  2. 高效便捷:传统需要数天完成的工作总结分析任务,现在可以在几分钟内完成。

  3. 准确率高:大模型能够准确理解中文文本内容,分类和分析结果符合预期。

  4. 安全合规:所有数据处理都在MaxCompute内部完成,避免了数据外泄风险,符合企业安全合规要求。

6.2 总结

MaxCompute SQL AI为企业提供了一种全新的数据分析方式,让数据分析师可以用熟悉的SQL语言轻松调用强大的大模型能力,实现智能数据处理。在工作总结统计场景中,我们通过简单的SQL语句完成了工作内容分类、情感倾向分析、关键信息提取和统计报告生成等任务,大幅提升了工作效率和分析质量。

随着大模型技术的不断发展和优化,MaxCompute SQL AI将在更多场景中发挥重要作用,帮助企业实现数据驱动的智能决策。无论是快速验证AI想法,还是构建企业级智能数据流水线,MaxCompute SQL AI都为用户提供了一种简单、高效、安全的解决方案。

AI并不遥远,它就在你的下一条SELECT语句里!

七、代码附录

7.1 完整代码清单

-- 启用公共模型
SET odps.sql.using.public.model=true;

-- 创建员工工作总结表
CREATE TABLE IF NOT EXISTS employee_work_summary (
    employee_id STRING COMMENT '员工ID',
    employee_name STRING COMMENT '员工姓名',
    department STRING COMMENT '所属部门',
    work_summary STRING COMMENT '工作总结内容',
    submission_date STRING COMMENT '提交日期'
);

-- 插入示例数据
INSERT INTO employee_work_summary VALUES
('E001', '张三', '技术部', '本季度主要完成了用户管理系统的升级开发,修复了3个关键bug,提升了系统性能约20%。同时参与了新项目的需求评审和技术方案设计,工作进展顺利。', '2025-03-31'),
('E002', '李四', '产品部', '本季度负责产品A的迭代优化,完成了5个功能模块的设计和上线,用户反馈良好。但在跨部门协作中遇到了一些沟通障碍,导致部分功能延迟交付。', '2025-03-31'),
('E003', '王五', '运营部', '本季度组织了3场线上营销活动,累计参与人数超过10万,带来了2000个新用户注册。活动效果超出预期,团队配合默契。', '2025-03-31'),
('E004', '赵六', '客服部', '本季度处理了1500个客户投诉,解决率达到95%。通过优化客服流程,客户满意度提升了10%。但由于系统问题,部分投诉处理延迟,需要进一步改进。', '2025-03-31'),
('E005', '孙七', '技术部', '本季度主要负责数据仓库的维护和优化,完成了数据模型的重构,提高了查询效率。同时学习了新的大数据技术,为团队分享了相关知识。', '2025-03-31');

-- 工作内容自动分类
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
    ) AS work_category
FROM employee_work_summary;

-- 情感倾向分析
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 关键信息提取
SELECT 
    employee_id,
    employee_name,
    department,
    work_summary,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请从以下员工工作总结中提取关键成果和KPI完成情况,使用分号分隔。工作总结内容:', work_summary)
    ) AS key_achievements
FROM employee_work_summary;

-- 创建分类统计视图
CREATE OR REPLACE VIEW work_summary_statistics AS
SELECT 
    department,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请将以下员工工作总结内容分类到以下类别之一:项目开发、产品设计、运营推广、客户服务、其他。只需要输出类别名称,不要输出其他内容。工作总结内容:', work_summary)
    ) AS work_category,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请分析以下员工工作总结的情感倾向,输出结果仅限于以下三个选项之一:正面、中性、负面。工作总结内容:', work_summary)
    ) AS sentiment
FROM employee_work_summary;

-- 生成部门统计报告
SELECT 
    department,
    work_category,
    sentiment,
    COUNT(*) AS employee_count,
    AI_GENERATE(
        bigdata_public_modelset.default.Qwen3-1.7B-GGUF,
        DEFAULT_VERSION,
        CONCAT('请为以下部门工作统计数据生成一段简洁的分析报告:部门:', department, ',工作类别:', work_category, ',情感倾向:', sentiment, ',员工数量:', CAST(COUNT(*) AS STRING))
    ) AS analysis
FROM work_summary_statistics
GROUP BY department, work_category, sentiment;

八、执行截图

1.png

2.png

3.png

4.png

6.png

7.png

8.png

总结:通过MaxCompute SQL AI,我们成功实现了工作总结统计的智能化分析,大幅提升了工作效率和分析质量。这种"SQL+AI"的融合方式,让数据分析师可以用熟悉的工具和语言轻松调用大模型能力,为企业决策提供更快速、更准确的支持。

相关文章
|
14天前
|
消息中间件 人工智能 NoSQL
AgentScope x RocketMQ:打造企业级高可靠 A2A 智能体通信基座
Apache RocketMQ 推出轻量级通信模型 LiteTopic,专为 AI 时代多智能体协作设计。它通过百万级队列支持、会话状态持久化与断点续传能力,解决传统架构中通信脆弱、状态易失等问题。结合 A2A 协议与阿里巴巴 AgentScope 框架,实现高可靠、低延迟的 Agent-to-Agent 通信,助力构建稳定、可追溯的智能体应用。现已开源并提供免费试用,加速 AI 应用落地。
246 36
AgentScope x RocketMQ:打造企业级高可靠 A2A 智能体通信基座
|
14天前
|
人工智能 安全 数据可视化
面向业务落地的AI产品评测体系设计与平台实现
在AI技术驱动下,淘宝闪购推进AI应用落地,覆盖数字人、数据分析、多模态创作与搜推AI化四大场景。面对研发模式变革与Agent链路复杂性,构建“评什么、怎么评、如何度量”的评测体系,打造端到端质量保障平台,并规划多模态评测、可视化标注与插件市场,支撑业务持续创新。
262 38
|
7月前
|
大数据
《云产品评测|通义灵码招募100名新品测评官》 获奖名单公布
《云产品评测|通义灵码招募100名新品测评官》 获奖名单公布
235 0
|
29天前
|
人工智能 运维 安全
SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道
SOC 2.0 来了:不是加人加班,而是加“智能”!——智能化安全运营中心的建设之道
154 15
|
1天前
|
自然语言处理 fastjson Java
FastJson:大面积故障规
本文记录了一次由Kotlin语法混淆引发的FastJson反序列化故障排查过程。因误将`{}`赋值给Java对象字段,导致FastJson解析时触发`kotlin_error`静态标记位异常,进而引发全局反序列化失败。问题根源在于多语言混编下语法差异及框架对异常状态的不可逆处理,最终通过代码审查与原理分析定位解决,凸显了对底层机制理解的重要性。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
少样本链式思维:让AI推理像名侦探一样聪明
你有没有发现,有些AI能像福尔摩斯一样推理解题,而有些却像没头苍蝇乱撞?关键就在于能否让AI学会「思考过程」!通过少样本链式思维技术,让AI从「直接蒙答案」升级为「步步推理」,轻松解决数学、逻辑等复杂问题。想知道如何让你的AI变成推理高手?这里有答案。 #人工智能 #AI推理 #提示工程 #机器学习
|
21天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云服务器租用价格:最新包年包月、按量付费活动价格参考
阿里云服务器租用价格又更新了,租用阿里云轻量应用服务器一年价格是38元,经济型e实例2核2G3M带宽 40G ESSD Entry云盘特惠价99元1年,通用算力型u1实例2核4G5M带宽80G ESSD Entry云盘特惠价199元1年。通用算力型u2i实例4核8G1170.26元1年起。本文为大家展示本次价格更新之后,阿里云服务器的最新租用价格,包含经济型e、通用算力型u2i/u2a、计算型c9i/c9a、通用型g9i/g9a、内存型r9i/r9a等不同实例规格的活动价格,以供大家对比和选择参考。
243 13
|
22天前
|
人工智能 运维 自然语言处理
2025年开源AI知识库深度体验:PandaWiki重新定义企业知识管理
2025年末了,作为一名AI的资深使用者我对PandaWiki有一点使用体会想分享下,写的不好请见谅。
|
1天前
|
机器学习/深度学习 人工智能 算法
技术人视角:传统产品经理如何系统性转型AI产品经理
AI时代重塑产品格局,AI产品经理需兼具技术理解、业务洞察与用户体验。本文系统梳理从认知升级到实战落地的转型路径,助力传统PM或技术人掌握AI产品方法论,避开常见误区,逐步成长为驾驭智能的“系统架构师”。
40 12
|
15天前
|
弹性计算 搜索推荐 异构计算
阿里云服务器多少钱一年?2025年12月最新价格38元、99元和199元配置详解
阿里云2025年特价服务器汇总:轻量应用服务器38元/年起,2核2G ECS仅99元/年,2核4G 5M带宽199元/年,4核16G 10M带宽89元/月,8核32G 160元/月,香港轻量25元/月起,爆款低至1折,新老用户同享,续费同价,限时秒杀速抢!
262 1