数据挖掘的搜索结果-阿里云开发者社区

游客vt33yqkn3w53i

|

9小时前

|

博文

技术人对抗焦虑的加减法

通过“课题分离”减少焦虑内耗，聚焦自我成长。以螺旋上升的认知与技能匹配合理欲望，避免低水平勤奋。培养心力、脑力、体力三大能力，觉醒本质思考，实现破局。学习重在内化，举一反三，方能持续进阶。（238字）

# 存储 # 算法 # 架构师 # 数据挖掘 # 程序员

游客dng4gjyb342he

|

12小时前

|

博文

基于自适应分水岭和亲和传播聚类的彩色图像分割

# 机器学习/深度学习 # 编解码 # 算法 # 数据挖掘 # 计算机视觉

游客mvvez3b2rcu5s

|

14小时前

|

博文

大模型应用开发中MCP与Function Call的关系与区别

MCP与Function Call是大模型应用中的关键技术。前者是跨模型的通用协议，实现多工具标准化连接；后者是模型调用外部功能的机制。MCP如“桥梁”，支持多系统协同；Function Call似“工具手”，执行具体任务。二者互补，推动AI应用向更高效、开放的方向发展。

# 人工智能 # JSON # 数据挖掘 # API # 数据安全/隐私保护

游客qbwohdg5vs6oq

|

21小时前

|

博文

向量检索：提供智能匹配能力

向量检索通过将广告与用户兴趣映射为高维向量，实现智能匹配，突破传统标签定向局限。借助“聚类+倒排索引+乘积量化”技术，可在毫秒级高效完成海量向量近邻搜索，提升广告召回精准度与系统性能。

# 数据挖掘 # 索引

游客qbwohdg5vs6oq

|

22小时前

|

博文

如何对乘积量化进行倒排索引？

结合聚类、乘积量化与倒排索引，可高效实现近似最近邻检索。先用K-Means将样本分为1024类，以类中心为基准计算残差向量，并用乘积量化压缩存储。查询时，先定位最近聚类，查倒排表获取候选向量，再通过量化距离计算快速返回Top-K结果。该方法大幅减少搜索空间，在保证精度的同时提升速度，广泛应用于图像检索、推荐系统等领域，适用于各类高维向量的快速匹配。

# 存储 # 人工智能 # 算法 # 数据挖掘 # 索引

游客qbwohdg5vs6oq

|

22小时前

|

博文

如何使用聚类算法进行相似检索？

利用聚类算法构建倒排索引，可高效实现相似检索。先将数据划分为若干聚类（如1024个），以聚类ID为Key建立索引。查询时，定位最近聚类，通过索引获取候选集并计算距离，返回Top K结果。针对候选过多或过少，可采用层次聚类细化划分，或扩展至次近聚类补充检索，提升效率与准确性。

# 算法 # 数据挖掘 # 索引

游客qbwohdg5vs6oq

|

22小时前

|

博文

如何使用乘积量化压缩向量？

乘积量化通过将高维向量划分为多个低维子空间，对每个子空间聚类并用聚类ID表示子向量，大幅压缩存储空间。例如，1024维向量可分段聚类，用32比特替代原始4KB空间，压缩率达1/1024，显著提升内存加载与检索效率。

# 存储 # 算法 # 数据挖掘

游客qbwohdg5vs6oq

|

22小时前

|

博文

聚类算法和局部敏感哈希的区别？

聚类算法与局部敏感哈希均用于高维数据相似检索。局部敏感哈希通过哈希函数降维，速度快但精度低，适合表面特征匹配；聚类算法（如K-Means）保留高维特征，按距离划分簇，类内紧凑、类间分离，更适用于语义相似性检索，精度更高，但计算开销较大。两者权衡在于速度与准确性的取舍。

# 机器学习/深度学习 # 算法 # 数据挖掘

游客qbwohdg5vs6oq

|

22小时前

|

博文

如何计算查询向量和压缩样本向量的距离（相似性）？

通过分段聚类与查表法，将高维向量压缩为32比特，计算查询向量与样本向量距离时，先分4段并查预建的距离表，以O(1)时间获取每段与聚类中心距离，最后合并得总距离，大幅提升相似性计算效率。

# 存储 # 数据挖掘

游客rs7q4jesaolmy

|

22小时前

|

博文

阁下AI平台：工具生成效率的实际观察

在我们实际使用阁下AI平台的过程中，其工具生成效率确实给我们留下了深刻印象。它能够将传统需要数周甚至数月的手工开发工作，压缩到以分钟或小时计算，并且生成结果的成功率和质量都保持在线。以下是我们结合真实使用情况整理的一些数据与观察。

# 人工智能 # 自然语言处理 # 前端开发 # 算法 # 数据挖掘

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

数据挖掘