大型网站优化指南:打造流畅的在线体验

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
云数据库 RDS PostgreSQL,高可用系列 2核4GB
简介: 大型网站优化指南:打造流畅的在线体验

大型网站

大型网站是指具有高并发、大流量、高可用性、海量数据处理能力,并能提供7*24小时不间断服务的网站。

这些网站通常面临用户分布广泛、网络情况复杂、安全环境恶劣等挑战。

同时需要快速适应市场变化和用户需求,通过渐进式的发展策略运营成大型网站。

大型网站的目标包括提供快速访问体验、高安全性、可扩展性,以及通过硬件的增加或减少来提高处理能力或降低成本。

名词解析

  • pv (page views) 即页面浏览量;用户每1次对网站中的每个网页访问均被记录1次
  • uv (unique visitor) 是指不同的、通过互联网访问、浏览这个站点的自然人
  • ip 指访问某个站点的不同IP地址的数量

通过名词定义:大型网站一般是指24小时内pv值达到百万或千万级别,uv值十万以上,ip值十万以上的网站

大型网站的问题

大并发

在同一个时间点,有大量的客户来访问我们的网站,如果访问量过大,就可能造成网站瘫痪。

解决方案: 浏览器与服务器之间采用负载均衡 ,负载均衡有硬件:NetScalerF5(效果好,价格昂贵),软件有:LVSNginx

大流量

有大量的图片,视频,flash, 这样就会对流量要求高,需要更多更大的带宽。

解决方案:

  1. 可以启用apache自带的数据压缩机制( gzip  , deflate )
  2. 使用CDN(内容分发网络)服务

CDN(内容分发网络):大型网络巨头公司在全世界都分布有CDN节点(阿里、腾讯),你购买他们的服务,然后别人要访问你服务器上的数据,比如是北京网友访问,他先找北京周边的CDN服务节点,看他上面有想要的资源没有,第一次是没有的,然后北京CDN就再到你的服务器上下载内容,并保存起来、这样,下一次有人再来访问你的资源,就可以直接在CDN上读取,速度更快

注意:防止黑客的DDOS攻击:肉鸡、最有效的办法就是CDN,因为不同地区的IP访问的都是他们当地的 CDN,就算再大的流量也不怕

大存储

海量数据需要存储。大量的数据读写操作,数据库可能无法响应

大型网站架构

分层+负载均衡+集群(简单来说就是通过增加服务器来分流)。服务器与数据库之间:读写分离、主从同步

优化

使用缓存技术

  • 内存缓存:redismemcachemysql数据库(memory引擎)
  • 页面缓存: 页面静态化

页面静态化

因为很多动态网址,要访问数据库,这样造成访问速度慢,因为我们可以把动态页面,改成静态页面,从而减少对数据库的访问次数,提速。

数据库优化

表的设计满足3NF

1NF

指表的属性(列)具有原子性, 即表的列的不能再分了,不能有重复的列

2NF

所谓2NF,就是指我们的表中不能有完全重复的一条记录(行).一般情况下通过设置一个主键来搞定,而且该主键是自增的。

3NF

所谓3NF就是指,如果列的内容可以被推导(显示推导,隐式推导)出,那么我们就不要单独的用一列存放。

所有的规则都是建立在实际上面的,一般设计是遵循3NF的,有时也会反3NF比如学生表的总金额,班级的总金额

开启慢查询

#慢查询开启,后面的文件路径是可以更改的
log_slow_queries="D:/log/mysql_slow.log"  
#1定位超过多少秒为慢查询
long_query_time=1
#上面的语句的意思是,超过1秒钟的语句,会被记录在D:/log/mysql_slow.log这个文件中
需要去里面看是那一条语句有问题
# Time: 180922 18:20:16 #语句执行的时间
# User@Host: root[root] @ localhost [127.0.0.1] #数据库的用户和域名
# query_time: 执行时间   #lock_time:等待时间
# Query_time: 1.693957  Lock_time: 0.000000 Rows_sent: 0  Rows_examined: 1
SET timestamp=1537611616;
#执行的语句
delete news,news_content from news left join news_content on news.news_id = news_content.news_id whe
开启慢查询牺牲sql的执行效率
一般是项目上线前一个月开启
还有就是项目运行一年之后开启一个月

分析sql查询语句

# 在查询语句前面加上explain用于分析语句,看查询了多少条,用没有用到索引
explain SELECT * from emp where ename="odAsmf";
# 查询出来的数据有
selecp_type:查询类型(slmple:简单查询)
type :all 表示全表查询
possible_keys :表示有什么索引可以用
 key: 当前用到的索引
rows:扫描了多条数据



根据分析结果,看如何添加索引

索引的原理:二叉树,平衡二叉树

索引的优缺点

索引的缺点:
增删改速度慢.. 
优点:
查询速度快…

索引一般使用最左匹配:就是复合索引,只能匹配最左边的

常用索引

主键索引
  primary
唯一索引
  unique
  用在身份证 用户名等等
  
普通索引
  normal
  在不能用使用上面两种情况下使用
搜索功能的时候,一般where后面字段需要添加索引

数据类型的选择

  1. 小于255个用varchar(255)
  2. 大于255用text
  3. 数字用int  tinyint
  4. 价格 decimal 元     int 分
  5. 手机号 varchar(20)
  6. 时间 int   时间戳
  7. md5加密  varchar(32)

一般情况,不参于运算都可以用varchar的

总结

在考虑优化大型网站的时候一般按照如下步骤优化:

1.静态资源用CDN加速

2.优化数据库

  • 表的设计要合理(满足 3NF )
  • 添加索引(主键索引|全文索引|唯一索引|普通索引|空间索引)
  • 优化 sql 语句
  • 分表( 水平分表,垂直分表),分区 mysql 数量级 千万   字段复杂 百万
  • 读写分离
  • 优化 my.ini 配置
  • 软件硬件应当升级

3. 优化慢查询

  1. 开启慢查询
  2. explain 分析 SQL 语句
  3. 合适地方添加索引(主键 -> 唯一 -> 普通)

4. 优化缓存

结合 redis 做缓存处理

5. 考虑分库分表

主从同步 读写分离

采取 分表 10G1000W 才考虑

查询的时候,where 后面的字段一般要索引

6. 增加物理设备


相关文章
|
SQL 监控 网络协议
线上故障如何快速排查?来看这套技巧大全
有哪些常见的线上故障?如何快速定位问题?本文详细总结工作中的经验,从服务器、Java应用、数据库、Redis、网络和业务六个层面分享线上故障排查的思路和技巧。较长,同学们可收藏后再看。
线上故障如何快速排查?来看这套技巧大全
|
人工智能 监控 Swift
魔搭社区LLM模型部署实践 —— 以ChatGLM3为例
本文将以ChatGLM3-6B为例,介绍在魔搭社区如何部署LLM
|
关系型数据库 MySQL 数据库
rds备份与恢复
rds备份与恢复
837 3
蓝牙HID协议笔记【转】
蓝牙HID协议笔记 转自:http://blog.sina.com.cn/s/blog_69b5d2a50101emll.html 1.概述     The Human Interface Device (HID)定义了蓝牙在人机接口设备中的协议、特征和使用规程。
4644 0
成功解决{‘error_code‘: 18, ‘error_msg‘: ‘Open api qps request limit reached‘}
成功解决{‘error_code‘: 18, ‘error_msg‘: ‘Open api qps request limit reached‘}
成功解决{‘error_code‘: 18, ‘error_msg‘: ‘Open api qps request limit reached‘}
|
9月前
|
供应链 数据库连接 PHP
反向海淘商业模式案例:Pandabuy VS Hoobuy VS CSSBUY 无货源淘宝微店代购系统搭建攻略
反向海淘是全球化下新兴的电商模式,满足海外消费者对中国高性价比商品的需求。Pandabuy、Hoobuy 和 CSSBUY 等平台整合供应链和物流资源,实现中国商品高效流通。本文分析这些平台商业模式,提供无货源代购系统搭建攻略及PHP代码示例,涵盖数据库连接、订单处理和商品查询等功能。随着市场需求增长、供应链优势、技术支持和政策利好,反向海淘前景广阔。
|
人工智能 自然语言处理
业界首家!阿里云智能媒体服务,卓越级通过中国信通院大模型媒体处理评估
阿里云智能媒体服务作为业界首家获得中国信通院“卓越级”通过。
业界首家!阿里云智能媒体服务,卓越级通过中国信通院大模型媒体处理评估
|
XML JSON API
深入理解RESTful API设计:最佳实践与实现
【10月更文挑战第9天】深入理解RESTful API设计:最佳实践与实现
593 1
|
DataWorks 安全 数据管理
《DataWorks的合规性和安全性》
【8月更文第14天】随着大数据技术的发展和应用,数据处理平台的安全性和合规性变得尤为重要。阿里云DataWorks作为一款集数据集成、开发、治理于一体的数据中台产品,提供了全面的数据管理解决方案。本文旨在探讨DataWorks在保障数据安全与合规方面的机制和技术实现,并通过具体案例和代码示例来展示其功能。
312 2
|
机器学习/深度学习 数据采集 网络安全
使用Python实现深度学习模型:智能网络安全威胁检测
使用Python实现深度学习模型:智能网络安全威胁检测
701 6