Python 给自己的博客做个目录,从网页中抓取标题和创建日期

简介: Python 给自己的博客做个目录,从网页中抓取标题和创建日期

从今年元旦开始学C++,3月中旬开始移师Python,已创建了近百篇博客,有必要编个目录总结一下学习成果了 :)

import urllib.request
lsturl=['https://blog.csdn.net/boysoft2002/article/details/', '112895584', '113916668', '115311607', '111057600', '112058765', '112649841', '112692650', '112758172', '112779716', '112852909', '112856888', '112983320', '112988386', '113037891', '113097166', '113145924', '113358043', '113446108', '113457253', '113529687', '113575820', '113622310', '113667015', '113697110', '113730868', '113772948', '113777228', '113787352', '113839813', '113858220', '113866928', '113872254', '113900792', '113926135', '114001024', '114047975', '114110148', '114154178', '114155994', '114163091', '114218122', '114175726', '114263346', '114222330', '114278061', '114300111', '114379446', '114383181', '114392833', '114416302', '114420231', '114441632', '114493856', '114557442', '114661201', '114702681', '114727175', '114801480', '114854993', '114896783', '114921167', '114927920', '115016170', '115044792', '115141151', '115190848', '115221872', '115260859', '115263165', '115289048', '115335269', '115359958', '115386613', '115407588', '115419833', '115425651', '115427777', '115438094', '115495837', '115563015', '115609329', '115641162', '115680965', '115796371', '115711808', '115917064', '115985659', '116240602', '116358084', '116376069', '116400341']
lsturl=[lsturl[0]]+sorted(lsturl[1:])
for i in range(1,len(lsturl)):
    url=lsturl[0]+lsturl[i]
    req=urllib.request.Request(url)
    try:
        resp=urllib.request.urlopen(req)
        data=resp.read().decode('utf-8')
        start=data.find('<title>')
        end=data.find('</title>')
        t=data[start+7:end]
        t=t.replace('_boysoft2002的专栏-CSDN博客','')
        d=data.split('<span class=\"time\">')[1]
        d=d.split('</span>')[0][:10]
        print(i,d,'《'+t+'》')
        print('<br><a href=\"'+url+'\">',url,'</a><br>')
    except:
        print('Error')






目录
相关文章
|
3天前
|
Python
用python转移小文件到指定目录并压缩,脚本封装
这篇文章介绍了如何使用Python脚本将大量小文件转移到指定目录,并在达到大约250MB时进行压缩。
14 2
|
7天前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
37 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
19天前
|
前端开发 搜索推荐 算法
中草药管理与推荐系统Python+Django网页界面+推荐算法+计算机课设系统+网站开发
中草药管理与推荐系统。本系统使用Python作为主要开发语言,前端使用HTML,CSS,BootStrap等技术和框架搭建前端界面,后端使用Django框架处理应用请求,使用Ajax等技术实现前后端的数据通信。实现了一个综合性的中草药管理与推荐平台。具体功能如下: - 系统分为普通用户和管理员两个角色 - 普通用户可以登录,注册、查看物品信息、收藏物品、发布评论、编辑个人信息、柱状图饼状图可视化物品信息、并依据用户注册时选择的标签进行推荐 和 根据用户对物品的评分 使用协同过滤推荐算法进行推荐 - 管理员可以在后台对用户和物品信息进行管理编辑
55 12
中草药管理与推荐系统Python+Django网页界面+推荐算法+计算机课设系统+网站开发
|
3天前
|
数据采集 存储 JavaScript
构建您的第一个Python网络爬虫:抓取、解析与存储数据
【9月更文挑战第24天】在数字时代,数据是新的金矿。本文将引导您使用Python编写一个简单的网络爬虫,从互联网上自动抓取信息。我们将介绍如何使用requests库获取网页内容,BeautifulSoup进行HTML解析,以及如何将数据存储到文件或数据库中。无论您是数据分析师、研究人员还是对编程感兴趣的新手,这篇文章都将为您提供一个实用的入门指南。拿起键盘,让我们开始挖掘互联网的宝藏吧!
|
9天前
|
数据采集 存储 数据挖掘
如何利用Python进行网页数据抓取
本文将详细介绍如何使用Python进行网页数据抓取。首先,我们将了解什么是网络爬虫以及其基本原理。然后,逐步讲解如何使用Python的requests库和BeautifulSoup库来抓取和解析网页数据。最后,通过实例展示如何实际应用这些技术来获取所需的数据并进行简单的数据处理。希望通过这篇文章,读者能够掌握基本的网页数据抓取技巧,并能在实际应用中灵活运用。
|
27天前
|
数据采集 JavaScript 前端开发
构建简易Python爬虫:抓取网页数据入门指南
【8月更文挑战第31天】在数字信息的时代,数据抓取成为获取网络资源的重要手段。本文将引导你通过Python编写一个简单的网页爬虫,从零基础到实现数据抓取的全过程。我们将一起探索如何利用Python的requests库进行网络请求,使用BeautifulSoup库解析HTML文档,并最终提取出有价值的数据。无论你是编程新手还是有一定基础的开发者,这篇文章都将为你打开数据抓取的大门。
|
27天前
|
数据采集 JavaScript 前端开发
构建你的第一个Python爬虫:抓取网页数据入门指南
【8月更文挑战第31天】在数字时代,数据是新的石油。本文将引导初学者通过简单的步骤,使用Python编程语言创建一个基础的网络爬虫程序。我们将探索如何从网络上提取信息,并理解背后的原理。无论你是编程新手还是想要扩展你的技术工具箱,这篇文章都将为你提供一条清晰的道路,让你学会编写能够自动获取网络数据的脚本。准备好开始你的网络数据抓取之旅了吗?让我们现在就开始吧!
|
27天前
|
数据采集 JavaScript 前端开发
Python 爬虫实战:抓取和解析网页数据
【8月更文挑战第31天】本文将引导你通过Python编写一个简单的网络爬虫,从网页中抓取并解析数据。我们将使用requests库获取网页内容,然后利用BeautifulSoup进行解析。通过本教程,你不仅能够学习到如何自动化地从网站收集信息,还能理解数据处理的基本概念。无论你是编程新手还是希望扩展你的技术工具箱,这篇文章都将为你提供有价值的见解。
|
1天前
|
数据采集 人工智能 数据挖掘
Python编程入门:从基础到实战的快速指南
【9月更文挑战第25天】本文旨在为初学者提供一个简明扼要的Python编程入门指南。通过介绍Python的基本概念、语法规则以及实际案例分析,帮助读者迅速掌握Python编程的核心技能。文章将避免使用复杂的专业术语,而是采用通俗易懂的语言和直观的例子来阐述概念,确保内容的可读性和实用性。