基础内容:排序,找出缺失值。
学习本章的前,我是建议去跑一遍gitee上的代码的。
排序问题由来
视频获取后,根据命名,排序是错的。问题除了命名以外还有一个因素就是多线程并发的原因。
好了,看图说话;看到了吗,顺序还是很明显不对的,这样合成视频的时候,那就是十分混乱的。所以需要解决一下。
def sava_Video(self): """合成代码""" path = 'report/' save_list = [] files = os.listdir(path) print(len(files),[_[:-3] for _ in files]) with open('res.txt','r',encoding='utf-8') as r: values = r.read() sorted_list = [x[-12:-4] for _, x in sorted(zip(files, eval(values)))] print(len(sorted_list),sorted_list)
总体的代码就是这样了。跑一下看看:
看到,还是不一样啊,别急,上面的打印是ts文件的,这正是我要处理的。
这样看,基本上以对上了,没错了。
为什么这么写?因为傻了。这样本质上并没有排序。
这也证明了,代码还是写少了。
思路是这样没错,但是,其实并没有必要。
正解: 我只需要获取
with open('res.txt','r',encoding='utf-8') as r: values = r.read()
即可,为什么,不是需要排序然后合成吗?
这就是误区,为什么一定要给ts文件排序?
为什么一定要读取下载好的ts文件名称进行 合并,这不就把简单的事情复杂化了吗!
我们只需要获取.m3u8解析出来的ts文件名称序列即可,因为这已经是排序的了。然后我们提取关键字进步查找合并即可。
def sava_Video(self): """合成代码""" path = 'report/' files = os.listdir(path) print(len(files),[_[:-3] for _ in files]) with open('res.txt','r',encoding='utf-8') as r: values = r.read() for file_path in eval(values): with open(path+file_path[-12:-4]+'.ts', 'rb') as f1: with open(path + "电影.mp4", 'ab') as f2: f2.write(f1.read())
看到了吗。挖取名称,按照顺序循环,查找指定path中的文件名一一合并即可,不需要再对files中的ts文件进行排序了。
再次排序这样做会让合并出的mp4播放起来卡顿。
找出缺失值
再上面的基础上,我还整了一个错误,
sorted_list = [x[-12:-4] for _, x in sorted(zip(files[:-3], eval(values)))]
嗯哼,瞬间麻痹,排序出来少了三个值,为此没多想,直接找少了哪三个值。
你会怎么想?循环判断?还是什么?
集合解法:
file_set = set([_[:-3] for _ in files]) list_set = set(sorted_list) missing_set = file_set - list_set missing_values = list(missing_set) print("缺失值:",missing_values)
这就搞定了,少了什么值就出来了。然而并没有什么卵用,刚开始的思路纠错了。
好了,本章修正后的获取电影源码放在了:https://gitee.com/qinganan_admin/reptile-case/tree/master/%E7%94%B5%E5%BD%B1
——————修成合成顺序.py————————