开发者社区> 问答> 正文

一键扫描关联文件

场景:

获取用户本地磁盘文件名,匹配数据库中的记录。进行关联。

比如用户D盘里有一个战狼2.mp4文件,扫描到后,要和数据库中战狼2中的记录进行关联,

用户磁盘文件的名称是不一样的比如说xxx战狼2xxx.mp4等等吧,这种文件,该如何跟数据库中匹配。
数据库中的记录也可能是战狼2xxx,或者名称是战狼二xx
比如有些电影是系列的:谍影重重系列,用户的磁盘文件是谍影重重2001,谍影重重2002 。。而数据库中存储的名称是谍影重重1,谍影重重2。。。诸如此类的。
如何做到精确匹配呢?
我见过豆瓣有个插件,就是能根据我本地的影片文件,自动获取到影片详细资料信息(导演,主演等等),例如这样的?
目前的想法是用中文分词,匹配。但是精准度有点差
如下图的这种做法
QQ_20180820194548

展开
收起
影视达人 2018-08-21 10:57:05 1960 0
1 条回答
写回答
取消 提交回答
  • 自由散漫的开发者,哇哈哈

    第一种,首先你的词库要非常庞大,比如战狼2这个词,你要在自己的数据库里存上战狼2、战狼二、战狼xxx2等词,用本地的文件名去库里匹配,先精准再模糊。这些词应该来源于各大下载网站。
    第二种,视频、音频都有自己的唯一标识,可以使用MD5或者关键帧来判断。最简单的就是MD5校验,这种校验可以识别改名的文件;关键帧校验比较耗时,根据视频的某些帧对比判断。
    推荐MD5+文件名识别

    2019-07-17 23:01:43
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载