开发者社区 问答 正文

simhash算法的算法思想是什么啊?

已解决

simhash算法的算法思想是什么啊?

展开
收起
游客ihzapojsw2ysk 2022-07-26 22:07:19 428 分享 版权
1 条回答
写回答
取消 提交回答
  • 推荐回答

    simhash算法的主要思想是降维,将高维的特征向量映射成一个低维的特征向量,通过两个向量的HammingDistance来确定文章是否重复或者高度近似。

    Google采用这种算法来解决万亿级别的网页的去重任务

    2022-07-26 23:00:15
    赞同 展开评论
问答分类:
问答地址: