在企业数据智能化转型过程中,不同角色的用户对数据的需求存在显著差异。技术专家需要精确的查询能力,而业务高管则更关注洞察和趋势分析。我司提供的基于本体论的数据智能引擎通过创新的双模式设计,完美解决了这一核心矛盾。
双模式架构:精准问数 vs 深度分析
精准问数模式:为技术专家赋能
对于熟悉数据库字段的用户,如部门领导、信息中心的系统管理员,我司数据智能引擎提供精准问数能力。系统像是一位数据库专家,能够理解自然语言中的各类条件输入,并整合已有的业务知识,自动实现基于条件的数据查询和计算。
典型场景:
"帮我统计2022年到2024年,每年、每个部门的人数净变化,按照部门和时间两个维度统计。"
"请统计过去一年中,售价波动超过20%的商品,并列出每款符合条件的商品,在过去一年当中的最低售价、最高售价、平均价。"
深度分析模式:为业务高管服务
对于不熟悉数据库字段的用户,如高级别领导,UINO数据智能引擎提供深度分析能力。系统像是一位数据分析专家,兼具业务知识、数据分析思路、数据库操作能力,并熟悉数据库字段情况。系统会自动理解方向性问题的意图,结合数据库字段情况,以数据分析思路,主动构思多组精准问数问题,并进行数据的查询和计算。
典型场景:
"帮我分析下最近五年的人事变化情况。"
"帮我分析下计算机学院里,哪些老师适合成为副院长的候选人。"
技术架构:多智能体协同工作
我司数据智能引擎由数十个智能体组成,通过ABC范式(A-筛选对象;B-构建属性字段;C-统计计算)实现企业级广泛精准问数。核心智能体包括:
意图澄清智能体:处理用户模糊或不精确的条件描述
指标热数据卡片智能体:通过向量匹配语义并映射查询卡片内DSL
问题拆解智能体:将复杂问题分解为可执行的子查询
DSL生成智能体:生成查询语言并从本体神经网络获取数据
计算pathon生成智能体:处理复杂计算逻辑
图表生成智能体:自动生成适配的可视化图表
质检智能体:验证知识调用和问题一致性,确保结果准确性
性能表现与资源需求
UINO数据智能引擎在实际应用中表现出色:
准确率:达到95%以上的测试样例准确率
响应时间:普通问数10-90秒,深度分析3-5分钟
并发能力:几乎全部取决于大模型的token和并发限制
数据规模:基础版本支持500属性字段,支持横向扩展
系统最小服务器资源配置要求:
CPU:32核 2.00GHz 以上
内存:128G
磁盘:1T(SSD固态硬盘更好)
操作系统:CentOS 7最新版 或者 Redhat7最新版
业务知识管理
我司数据智能引擎将业务知识与多智能体系统提示词做了解耦,支持在系统管理界面补充和管理业务知识。常见的业务知识包括:
专用术语(黑话):如"四上企业 = 规模以上工业 + 资质等级建筑业 + 限额以上批零住餐 + 规上服务业"
近似属性选择:如数据库里有"注册地"和"经营地",定义默认优先使用注册地
情境筛选规则:如"全校学生 = 学籍状态为'注册' + 排除'休学' + 排除'交换生'"
计算比率定义:如"挂科率"的分母到底是参考人数还是全班人数
这种设计使得系统能够持续学习和优化,同时保持高度的可维护性和可解释性。