数据挖掘

首页 标签 数据挖掘
# 数据挖掘 #
关注
27145内容
聚类算法和局部敏感哈希的区别?
聚类算法与局部敏感哈希均用于高维数据相似检索。局部敏感哈希通过哈希函数降维,速度快但精度低,适合表面特征匹配;聚类算法(如K-Means)保留高维特征,按距离划分簇,类内紧凑、类间分离,更适用于语义相似性检索,精度更高,但计算开销较大。两者权衡在于速度与准确性的取舍。
如何计算查询向量和压缩样本向量的距离(相似性)?
通过分段聚类与查表法,将高维向量压缩为32比特,计算查询向量与样本向量距离时,先分4段并查预建的距离表,以O(1)时间获取每段与聚类中心距离,最后合并得总距离,大幅提升相似性计算效率。
阁下AI平台:工具生成效率的实际观察
在我们实际使用阁下AI平台的过程中,其工具生成效率确实给我们留下了深刻印象。它能够将传统需要数周甚至数月的手工开发工作,压缩到以分钟或小时计算,并且生成结果的成功率和质量都保持在线。以下是我们结合真实使用情况整理的一些数据与观察。
|
1天前
|
《游戏官网高价值技术服务的搭建与实践》
本文聚焦游戏官网突破公告、下载单一功能的技术升级路径,针对玩家停留时间短、粘性不足的痛点,提出六大高价值技术赋能方向。从搭建沉浸叙事矩阵、行为映射资产工坊,到打造动态平衡观测站、跨端感知协同层,再到上线技能谱系解构实验室与生态共创孵化池,每个方向均落地于具体技术实践,通过玩家行为数据联动、跨端数据同步、低门槛创作工具赋能等手段,构建“叙事-资产-共创”的官网生态闭环。文章强调技术与玩家需求的深度耦合,摒弃传统浅层互动模式,让官网从过渡页面转变为玩家主动沉浸的生态枢纽,实现用户停留时长与忠诚度的双重提升。
阁下AI平台:工具生成效率的实际观察
在我们实际使用阁下AI平台的过程中,其工具生成效率确实给我们留下了深刻印象。它能够将传统需要数周甚至数月的手工开发工作,压缩到以分钟或小时计算,并且生成结果的成功率和质量都保持在线。以下是我们结合真实使用情况整理的一些数据与观察。
重磅发布|数据分析Agent白皮书:揭秘Data x AI的底层逻辑与未来关键
《2025数据分析Agent白皮书》内容聚焦数据分析Agent的技术路线、落地方案与未来方向,希望能将Quick BI团队多年积累的思考传递给所有关心数据领域技术和应用发展的用户。
国内知名AI Agent智能体全解析:从技术原理到顶尖产品,一篇读懂
凌晨三点,财务实习生还在手动粘贴数据?市场经理苦于海量反馈无法分析?2025年,AI Agent正悄然改变职场:它能听懂指令、跨系统操作、自动生成报告,成为真正“会干活”的数字员工。从实在Agent的实用落地,到百度“伐谋”的自我演化,再到讯飞星火、通义千问、飞书Aily的行业深耕,智能体已进入金融、制造、医疗一线。成本降本、效率翻倍、决策更准——这不是未来,是正在发生的现实。了解国内主流智能体产品与真实应用场景,掌握这场“人工智能+”变革的关键入口。
干货收藏|深度解析数据分析Agent技术原理与产品发展
《2025数据分析Agent白皮书》内容聚焦数据分析Agent的技术路线、落地方案与未来方向,希望能将Quick BI团队多年积累的思考传递给所有关心数据领域技术和应用发展的用户。
广告系统:广告引擎如何做到在 0.1s 内返回广告信息?
广告系统是互联网公司核心营收支柱,如Google、Facebook超80%收入来自广告。其背后依赖高性能广告引擎,实现高并发、低延迟的精准投放。本文深入解析广告引擎架构,涵盖标签检索、向量匹配、打分排序与索引优化四大关键技术,揭示如何在0.1秒内完成从请求到返回的全流程,支撑千人千面的智能广告体验。
|
2天前
|
携手中国科学院青年科学家,我们上线了这款AI科研助手
中国科学院大学他山协会推出AI科研助手「他山科研IDE」,已登陆阿里云云工开物平台及云市场。该工具支持文献检索、数据分析、论文撰写等全流程,助力科研自动化。同期,“Agent for Science”实训营将于12月启动,提供系统课程与前沿讲座,由阿里云提供模型与算力支持,推动AI赋能科研创新。
免费试用