http与www服务概念详解

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介:

HTTP超文本传输协议

html页面标记语言

www万维网

 端口21  ftp

     22  ssh

     25  smtp

     3306 mysql

     873  rsync

     161  snmp

     111  rpc

     3389  

     80

     443  https

     110  pop3

      53  dns

 

curl -I www.baidu.com 查看网站头部信息 200表示服务器返回成功。

http请求流程:

osi模型中的应用层协议,http协议的重要应用是www服务

获取ipdns本地缓存表查找,网关DNS查找

dns解析流程

建立TCP连接

用户访问网站基本流程

 

htmlxmlshtmljpgjscssswfaviwmvflv等都属于静态页面。

静态网页容易被搜索引擎收录,所以很多时候需要将动态转成静态便于排名靠前增加点击率。

静态网页没有数据库支持,所以大量信息的网站不适合用静态的。

 

动态网页:服务端解析,效率远不如静态网页。用户注册、用户登录、在线调查,投票、用户管理、订单管理、发博文等。aspaspxphp,jsp,do,并且常伴随?&等。

架构优化:效率很差,并发也很低,尽可能转换成静态网页提供服务。

静态:动态-------10:1  系统架构师和程序架构师的职责。

伪静态就是将动态伪装成静态,其实还是动态,主要是修改了域名地址,目的是便于搜索收录,但并不能提升网站的性能,反而下降,转换时消耗资源。并发量不是很大时可以做伪静态,更新频率很快的业务也没必要做动转静,伪静态就非常好。

 

异步,消息中间件、消息队列就是让动态转静态。

web3.0web2.0的替代物,以用户为中心,动态页面为主,智能化人与人机器的交流。10兆,全视频的网络,这才像web3.0

 

传统页面布局:表格

现在:DIV+CSS,载入更快,降低流量成本提升用户体验,更有效率,保持视觉一致性,有利于搜索引擎收录,对浏览者和浏览器更具有亲和力。

 

java的解释器:tomcat(小型互联网公司)/resin( 大型互联网公司)/weblogic(传统行业)/jboss(淘宝)

 

赶集网:日200-300万人访问。

PV:PAGE VIEW 页面浏览量或点击量,用户每次刷新即被计算一次。用户发出,服务器回馈就叫一个pv,打开一个页面就一次pv,打开一个链接就是一次pv,有些网站为防止刷pv会在页面底部嵌入一个js来统计。

 

如果一个用户访问赶集网,你觉得平均会产生多少pv?几个-几十个

赶集网日ip300万,那么你估计下pv能有多少,3000+。吹牛可以说pv,最主要的是有多少人看到,这才是广告商中意的。

uv:一个人访问记一个uv,通过不同技术方法来记录,实际会有误差。每次请求的信息内部都包含了你电脑的一些信息,比如:ip地址,请求发出的时间,浏览器版本,操作系统版本等等。也就是满足同一共同特征的就叫同一ip。问题是多人一个电脑。

ip/pv的度量:

pv的度量

1、分析web服务的访问日志(排除jscss各种图片),htmlphp

2、在所有页面结尾,嵌入js程序(GA),传给统计服务器。

3、用第三方大家比较信任的统计工具(GA)。

ip的度量:

1、分析web服务的访问日志,去重。

2、在所有页面结尾,嵌入js程序(GA),传给统计服务器。

3、用第三方大家比较信任的统计工具(GA)。

 

session()和cookie(客户端用户)的区别是uv的一个补充,也就是浏览器发出请求后,服务端会发一个cookie放在客户端的c盘,这个cookie也包含了服务器信息,访问时间,访问了哪些页面等等。也不太精准,比uv好点,但很多用户手动删了cookie就统计不了了。

 

并发:每秒网站服务器最大响应的用户请求数?

正确理解:单位时间内,服务器能够同时处理的最大连接数。

 

查看网站排名、ippv的地址:

http://alexa.chinaz.com/?domain=google.com

查看网站排名的地址:

http://www.alexa.com/siteinfo/weibo.com

 

网站

ip(万)

pv(万)

机器数

www.51cto.com

40

80-100

30

www.ganji.com

120-150

1000-1200

200

www.58.com

100-12

1600

30-400

www.weibo.com

3000-4000

10000-20000

1000

www.taobao.com

7000-8000

60000-100000

10000


awstats:抓取ip连接数然后排序,可查出ip连接的情况。

uniq:去重,把重复的行去掉。-c 去重计数。相邻一样的才能去重。

sort:对一个文本的行进行排序。-n按数字排序,-r倒序,-t分隔符,类似awk-F,cut-d-k指定按哪列排序。

 

awk -F / {print $3} oldboy.log|sort|uniq -c|sort -nr 去重计数按倒序排列。

本文转自  流颗星  51CTO博客,原文链接:http://blog.51cto.com/liukexing/1966107


相关文章
|
3月前
|
Java Maven Windows
使用Java创建集成JACOB的HTTP服务
本文介绍了如何在Java中创建一个集成JACOB的HTTP服务,使Java应用能够调用Windows的COM组件。文章详细讲解了环境配置、动态加载JACOB DLL、创建HTTP服务器、实现IP白名单及处理HTTP请求的具体步骤,帮助读者实现Java应用与Windows系统的交互。作者拥有23年编程经验,文章来源于稀土掘金。著作权归作者所有,商业转载需授权。
使用Java创建集成JACOB的HTTP服务
|
2月前
|
关系型数据库 MySQL 数据库
vertx 的http服务表单提交与mysql验证
本文介绍了如何使用Vert.x处理HTTP服务中的表单提交,并通过集成MySQL数据库进行验证,包括项目依赖配置、表单HTML代码和完整的Vert.x服务代码。
29 2
|
4月前
|
机器学习/深度学习 Ubuntu Linux
在Linux中,如何按照该要求抓包:只过滤出访问http服务的,目标ip为192.168.0.111,一共抓1000个包,并且保存到1.cap文件中?
在Linux中,如何按照该要求抓包:只过滤出访问http服务的,目标ip为192.168.0.111,一共抓1000个包,并且保存到1.cap文件中?
|
5月前
|
运维 Serverless API
Serverless 应用引擎使用问题之如何开发HTTP服务
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
|
4月前
|
负载均衡 中间件 Go
五分钟给你的 gRPC 服务加上 HTTP 接口
五分钟给你的 gRPC 服务加上 HTTP 接口
|
5月前
|
Java Spring
spring cloud gateway在使用 zookeeper 注册中心时,配置https 进行服务转发
spring cloud gateway在使用 zookeeper 注册中心时,配置https 进行服务转发
128 3
|
5月前
|
文字识别 前端开发 API
印刷文字识别操作报错合集之通过HTTPS连接到OCR服务的API时报错,该如何处理
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
5月前
|
消息中间件 API 数据库
在微服务架构中,每个服务通常都是一个独立运行、独立部署、独立扩展的组件,它们之间通过轻量级的通信机制(如HTTP/RESTful API、gRPC等)进行通信。
在微服务架构中,每个服务通常都是一个独立运行、独立部署、独立扩展的组件,它们之间通过轻量级的通信机制(如HTTP/RESTful API、gRPC等)进行通信。
|
4月前
|
网络协议 Go
【go笔记】简单的http服务
【go笔记】简单的http服务
|
5月前
|
机器学习/深度学习 人工智能 文字识别
文本,文字识别02----PaddleOCR基础概念及介绍,安装和使用,人工智能是一种使计算机模仿人类的一种技术,PaddleOCR的安装地址-https://www.paddlepaddle.org
文本,文字识别02----PaddleOCR基础概念及介绍,安装和使用,人工智能是一种使计算机模仿人类的一种技术,PaddleOCR的安装地址-https://www.paddlepaddle.org