领读:
这篇文章比较简要,说了一下主流的选型,小公司可以快速搭建项目!一般来说,我建议大家先找开源项目,能在现成开源项目上再二次修改,这样无疑大量减少开发时间和提高效率!
其实这里面主要给大家说的是技术选型。
由于我中型互联网公司工作,针对用于手机 APP 或者 pc 的后台开发,基本可以支撑几万用户。本文会对可能用到的相关技术进行技术选型的说明,以及技术的架构介绍
技术指标
说一下一些技术指标的计算过程可以作为其他同学的参考
- QPS, 如果是 5 万日活,使用集中在每天的 4 小时,每个用户大概产生 100 的请求,那么平均下来,我们系统大概应该支撑的请求为:50000 * 100 / (4 * 60 * 60) = 350 qps/s
- 业务数据 业务量,我们自己是新闻业务,可能会有其他的业务,比如游戏,商城等等,基本每天新增的业务数据都会在同一个量级, 每日 10000, 另外跟用户相关的信息也是比较大的一块,比如用户的订阅等行为,一共 5 万的用户,保存相关信息可能大概需要 100 条的数据。
- 缓存大小 主要业务数据和用户相关的热点数据限时保存在缓存中, 大概需要 5 个 G 左右。
- 日志大小 用户日志和请求日志。大概每天 3 个 G 左右
- 这些数据需要运维人员的估算,
技术架构
我们基于阿里云来搭建,对图中的内容和技术选型进行一下说明:
负载均衡
可选方案:SLB, Nginx.
- SLB 要收钱,但是比较便宜,有保证,不会挂。但是可配置的很少,不能根据域名做 ip 映射
- Nginx, 没啥缺点,需要一定的知识。建议:SLB + Nginx, SLB 绑定域名作为统一的入口,然后每个服务器上再搭建 Nginx.
- 大多数金融公司的选择
CDN
用于缓存静态文件等等。七牛和阿里的都还可以。
- 七牛要做的久一点, 各种图片处理的接口要完善一些
- 阿里的 CDN 要稍微好一点点, 但是没有不安全的访问方式,访问稍微没有那么灵活。图片处理功能弱一点。
- 是解决前端延迟的好办法
- 搜索公纵号:MarkerHub,关注回复[ vue ]获取前后端入门教程!
分布式调用框架
目前可选的有 ZK + dubbo. ZK + Motan, ZK + dubbox, edas。
- dubbo, 阿里的服务治理框架,已经不维护了,切换反应有点慢
- dubboX, 当当基于 dubbo 搞的,还在维护可以一用,推荐。
- Motan, 微博的服务治理矿建, 刚开源,需要学习一下, 推荐。
- Edas, 阿里云服务,要收钱,侵入型很强,不推荐
MQ
可选的有:ActiveMQ, rocketMQ, robbitMQ,Kafka 各有好处, 但是考虑到运维的难度,推荐 rocketMQ。
Redis
用来做缓存, 自建成本有点高,需要 Codis, 分片,集群,主从等等,很麻烦。建议直接用阿里的也可以用来处理分布式的数据共享 session 的工具、
数据库
主要基于读写分离和主从复制考虑,目前可以自建和选用阿里的 DRDS。
- DRDS 要花钱,成本较高,没有必要
- 自建, 不用中间件,直接 1 写 2 只读, 然后配置读写分离的数据源,内网 SLB 进行读集群。解决之。
搜索
apache solr 搜索引擎。相比其他用起来还可以。建议 ELK, 可以自动同步数据库,除了搜索引擎的功能外,还可以做日志搜索,监控系统。代码管理工具Jenkins 与 Sonar 集成是代码管理工具重要体现。apache 中 sonar 代码管理。是我们优化方案找出代码不规格的重要工具、Jenkins 是我们打包发布重要工具。
一些典型的业务场景说明
把业务底层做成 SOA 模块,通过分布式调用框架对外提供服务。后期进行 SOA 到微服务的改造都会涉及。单独做一个小的系统来运行定时任务热点数据放缓存,然后通过 MQ 来更新缓存日志等数据有必要可以考虑上个 Mongo