开发者社区> 问答> 正文

simhash算法的算法思想是什么啊?

已解决

simhash算法的算法思想是什么啊?

展开
收起
游客ihzapojsw2ysk 2022-07-26 22:07:19 394 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    simhash算法的主要思想是降维,将高维的特征向量映射成一个低维的特征向量,通过两个向量的HammingDistance来确定文章是否重复或者高度近似。

    Google采用这种算法来解决万亿级别的网页的去重任务

    2022-07-26 23:00:15
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
数据+算法定义新世界 立即下载
袋鼠云基于实时计算的反黄牛算法 立即下载
Alink:基于Apache Flink的算法平台 立即下载