如何用str.format()批量生成网址【以豆瓣读书为例】

简介: 如何用str.format()批量生成网址【以豆瓣读书为例】

1 用法说明


str.format() 方法通过字符串中的花括号 {} 来识别替换字段从而完成字符串的格式化。


1.1 写法

简单字段名有三种写法:

  • 省略不写 {}
  • 数字 {十进制非负整数}
  • 变量名 {合法的Python标识符}:在生成网址中可应用


1.2 举例

# 省略不写
print("hello!{}".format('火柴先生'))
#OUTPUT:hello!火柴先生
# 变量名
print("hello!{name}".format(name='火柴先生'))


2 应用:豆瓣读书


2.1 初步

打开网页选择一个自己感兴趣的标签,这里我选择“股票”标签进行后续操作。

ae7fc932276b43d6813f086df17a5376.png


拖动到最下方有翻页功能,点击后一页

image.png


2.2 分析URL

通过上图中url[(https://book.douban.com/tag/股票?start=20&type=T),不难发现其生成逻辑

  1. tag后为对应的细分书籍标签
  2. start值为对应书本起始数,第三页start值变为40可推测其每页显示数量为20本书


2.3 生成

  • 利用上面学习的方法先生成一条地址
# url:https://book.douban.com/tag/股票?start=20&type=T
"https://book.douban.com/tag/股票?start={num}&type=T".format(num=20)


在notebook中运行结果如下:

image.png


  • 通过简单for循环批量生成网址,构思分为如下几步:
  1. 先创建一个网址模板
  2. 生成一个空列表,用来存储批量生成的网址
  3. 执行循环,注意这里的循环次数根据具体情况来设置


template="https://book.douban.com/tag/股票?start={num}&type=T"
url_list=[]
# 下面设置40,因为股票类的书籍只有40页
for p in range(0,40):
    url=template.format(num=p*20)
    url_list.append(url)
url_list


执行效果如下:

image.png


参考链接:

Python 中 str.format() 方法详解_团子大圆帅的博客-CSDN博客_

目录
相关文章
|
Python 数据挖掘 Windows
Python---qq群聊天记录词云分析
python拥有近13w个第三方库,其中有很多优秀的库,比如wordcloud,scipy,jieba等库,能快速实现很多功能,比如制作一个QQ群聊天记录词云…… 工具:PyCharm, Python3.6.5 1.获取数据源 qq左下角 导出消息记录 要用.txt导出到任意盘符,接下来就要对导出的txt文件进行数据分析。
2667 0
|
2月前
|
Python
还不会免费将PDF转为Word?你可以试试这3种工具!
还不会免费将PDF转为Word?你可以试试这3种工具!
|
程序员 开发者 Python
小白学Python:提取Word中的所有图片,只需要1行代码
小白学Python:提取Word中的所有图片,只需要1行代码
|
XML 数据采集 Web App开发
XPath数据提取与贴吧爬虫应用示例
XPath(XML Path Language)是一种用于在XML文档中定位和选择节点的语言。它提供了一种简洁的方式来遍历和提取XML文档中的数据。
106 1
|
搜索推荐 Python
【小白必看】利用Python生成个性化名单Word文档
【小白必看】利用Python生成个性化名单Word文档
91 0
|
数据采集 Python
python自动签到参考网站
python自动签到参考网站
|
缓存 网络协议 JavaScript
从输入URL到Web页面呈现,这中间到底经历了什么?本文为您解惑!
从输入URL到Web页面呈现,这中间到底经历了什么?本文为您解惑!
74 0
|
数据采集
【详细步骤解析】爬虫小练习——爬取豆瓣Top250电影,最后以csv文件保存,附源码
【详细步骤解析】爬虫小练习——爬取豆瓣Top250电影,最后以csv文件保存,附源码
290 0
|
网络协议 分布式数据库 开发工具
面试必学:输入 URL到页面的全过程-----五步完成、简单明了
面试必学:输入 URL到页面的全过程-----五步完成、简单明了
156 0
面试必学:输入 URL到页面的全过程-----五步完成、简单明了
|
数据采集 存储 关系型数据库
基于Python的爬虫演示示例-以电影网站为例
爬取的数据最终会存到MYSQL服务器的表中,可以写程序将数据展示出来。注意的时会对IP进行限制封号,200条为限,超过IP会被限制,可以换一个IP进行抓去。主要研究爬虫的基本使用规范和语法,相对较为简单,供大家学习参考
230 0
基于Python的爬虫演示示例-以电影网站为例
下一篇
无影云桌面