全民k歌 and B站 爬取

简介: 全民k歌 and B站 爬取

1.全民k歌

全名k歌文件格式为m4a
爬取实例:

from urllib import request
import re
import os
import json
#个人主页地址
url = "https://kg.qq.com/node/personal?uid=609c9a8d2729378330"

html = request.urlopen(url).read().decode('utf-8')
data = re.findall(r'"ugclist":.*?],', html)#获取页面中数据json,处理有点糙,不过能用哈
ugclists = data[0][10:-1]
for ugclist in json.loads(ugclists):#json.loads把字符串转json,以前没使过Python,这里好像说是什么dict的,也就是key=>value的数据格式,很好理解
    print(ugclist['shareid'])#这个数据很关键是每首曲子的id值
    print(ugclist['title'])#每首歌的名字
    title = ugclist['title']
    shareid = ugclist['shareid']
    data_url = "http://cgi.kg.qq.com/fcgi-bin/fcg_get_play_url?shareid=" + shareid #通过解析获取到的文件地址及拼接形式,也就是这个曲子的文件下载地址
    # 设置保存歌曲的路径,否则会保存到程序当前路径
    path = r'/media/××××××××××/music/'  # 路径前的r是保持字符串原始值的意思,就是说不对其中的符号进行转义
    file = path + title + '.m4a'
    is_set = os.path.exists(file)#这里做了简单的文件存在与否的判断,这样以后再执行,文件不会丢失或增多,或覆盖或重复爬取
    # 如果文件存在则跳过
    if is_set == False:
        request.urlretrieve(data_url, path + title + '.m4a')  # 使用request.urlretrieve直接将所有远程链接数据下载到本地

2.bilibili

b站短视频由两个m4s文件组成,一个是音频,一个是视频

目录
相关文章
|
2月前
|
前端开发 JavaScript 开发者
惊!这些前端技术竟然能让你的网站在社交媒体上疯传!
【10月更文挑战第30天】在这个信息爆炸的时代,社交媒体成为内容传播的重要渠道。本文介绍了前端开发者如何利用技术让网站内容在社交媒体上疯传,包括优化分享链接、创建引人注目的标题和描述、利用Open Graph和Twitter Cards、实现一键分享功能以及创造交互式内容。通过这些方法,提升用户分享意愿,使网站成为社交媒体上的热门话题。
51 2
|
算法 前端开发
微信严打刷量后 自媒体的出路在何方?
作为一个极为稳定的自媒体生态,微信公众号很少有大动作。
微信严打刷量后 自媒体的出路在何方?
|
搜索推荐 视频直播 双11
春晚与微博成“老夫老妻”,社交媒体为何从不缺席?
春晚与微博成“老夫老妻”,社交媒体为何从不缺席?
171 0
春晚与微博成“老夫老妻”,社交媒体为何从不缺席?
|
Web App开发 安全 定位技术
印度宣布封禁59款中国app,抖音微信躺枪,互联网公司出海之路再生波澜
印度应用下载榜第一的 app 是抖音,手机销量第一的品牌是小米,这个国家却突然间选择了封禁中国 app。
160 0
印度宣布封禁59款中国app,抖音微信躺枪,互联网公司出海之路再生波澜
果冻有家:租房场景中的共享社交融合;腾讯公关回应微信谣言。
果冻有家:租房场景中的共享社交融合;腾讯公关回应微信谣言。
341 0
|
Web App开发 前端开发 数据库
分析Ajax抓取今日头条街拍美图
声明:此篇文章主要是观看静觅教学视频后做的笔记,原教程地址https://cuiqingcai.com/ 实现流程介绍 1.
1369 0
|
数据采集 API 定位技术

热门文章

最新文章