《智慧的网络爬虫》— HTML概述

简介: 网页是构成网站的基本元素,它是一个包含HTML标签的纯文本文件,通常是由图片;链接;视频;声音;文字等元素组成。通常我们所看到的网页,常以 .htm 或 .html 后缀结尾的文件,因此将其俗称为HTML文件。HTML;CSS;JS是学习爬虫的基础,是必须要了解的,此篇文章我讲述了HTML5对于爬虫所要必备的基础知识

什么是网页和网站?

​ 在文章开始之前,我们先了解一下什么是网页和网站

​ 网页是构成网站的基本元素,它是一个包含HTML标签的纯文本文件,通常是由图片;链接;视频;声音;文字等元素组成。通常我们所看到的网页,常以 .htm.html 后缀结尾的文件,因此将其俗称为HTML文件

​ 网站可以认为是放在服务器上的一个文件夹,它包含了很多的网页文件以及很多子文件夹,用户访问网站其实就是读取文件的内容

一:HTML概述

1.HTML简介:
  • ​ HTML是纯文本标记语言,是互联网上用于编写网页的主要语言
  • ​ HTML文件可以直接由浏览器解释执行,且无须编译
  • ​ 一个HTML文件是由一系列的元素和标签组成的,元素是HTML文件的重要组成文件,而标签用来规定元素的属性和它在文件中的位置
2.HTML文件基本结构:

一:标签

​ HTML是一种计算机语言,但它不能编程,只能用来标记网页中的内容,HTML通过不同的标签来标记不同的内容,格式,布局等

​ HTML标签分为单独出现的标签和成对出现的标签

(1)单独标签:其作用是在相应的位置插入元素

<元素名称>

(2)成对标签:仅对包含在其中的文件部分产生作用

注意:大多数的标签都是成对出现的,由开始标签和结束标签组成

<元素名称>要控制的元素</元素名称>

注意:在HTML标签中不区分大小写,

,和其效果是一样的

(3)属性:在HTML标签中。还可以设置一些属性,用来控制HTML标签所建立的元素,这些属性位于首标签中

<元素名称 属性1 = "值1" 属性2 = "值2"......>要控制的元素</元素名称>

二:元素

​ 当用HTML标签将一段文字包含在中间时,这段文字与包含文字的HTML标签被称为一个元素

​ 在所有的HTML文件中,最外层的元素都是由

标签建立的,在标签所建立的元素中,包含了两个主要的子元素,这两个子元素是由与标签所建立的

​ 其中

标签所建立的元素内容为头部也就是文件标题;而标签所建立的元素内容为文件主体

三:HTML的基本标签

(1)文件开始标签

​ 在任何一个HTML文件里,最先出现的标签就是

,它用于表示该文件是以HTML编写的

是成对出现的,开始标签和结束标签分别位于文件的最前面和最后面,文件的所有内容和HTML的其它标签都包含在标签里面
<html>
    该文件的全部元素
</html>

注意:

标签不带任何属性

(2)文件头部标签

也是一个成对出现的标签,用来表示网页头部的标签,而头部是用来规定该文件的标题,也就是浏览器的标题栏,和文件的一些属性

​ 在由

标签所定义的元素中,并不放置网页的任何内容也就是它并不属于HTML文件的主体;它仅放置关于HTML文件的信息(标题,编码方式及URL等信息)这些信息大部分是用于提供索引,辨认等应用的

注意:如果HTML文件不需要提供相关信息,则可以省略

标签

(3)文件标题标签

标签之间的,并且
目录
相关文章
|
2月前
【计算机网络】第三章 数据链路层(概述 封装成桢 差错检错)
【计算机网络】第三章 数据链路层(概述 封装成桢 差错检错)
32 0
|
27天前
|
网络协议 网络安全 网络性能优化
【计算机网络概述】第一章:概论 1.2什么是网络边缘
【计算机网络概述】第一章:概论 1.2什么是网络边缘
|
2月前
|
网络协议 算法 Java
【Java网络编程】网络编程概述、UDP通信(DatagramPacket 与 DatagramSocket)
【Java网络编程】网络编程概述、UDP通信(DatagramPacket 与 DatagramSocket)
37 3
|
14天前
|
网络协议 Java 开发者
网络编程概述
网络编程
32 8
|
27天前
|
网络协议 API
【计算机网络概述】第二章:应用层:2.1 应用层原理
【计算机网络概述】第二章:应用层:2.1 应用层原理
|
27天前
|
网络协议 网络架构 C++
【计算机网络概述】第一章:概论 1.1什么是Internet
【计算机网络概述】第一章:概论 1.1什么是Internet
|
27天前
|
存储 缓存 算法
【计算机网络概述】第一章:概论 1.3什么是网络核心
【计算机网络概述】第一章:概论 1.3什么是网络核心
|
2月前
HTML概述
HTML概述。
23 4
|
2月前
|
安全 网络协议 网络安全
网络安全概述
网络安全概述
30 4