短URL服务的设计以及实现

简介: 短URL服务的设计以及实现

1 长地址和短地址案例


想必经常收到这样的短信。短信中的链接一般都是短链接,类似于下图这样,这就是短地址,而


1.png


而当我打开改短地址时,则发生重定向到长地址,如下图所示


0.png


2 短地址的优点


许多平台(微博)有字数限制,链接太长导致没有办法写正文,因此影响内容的传播

短链接更加简洁友好。通俗的说就是好看

短连接会更安全,不会暴露一堆后面的参数

方便做一些统计


3 基本原理


3.1 生成长链接到短链接的基本步骤


1.前端传入要生成短链接的长链接地址(www.baidu.com)


2.后端根据前端传入的长链接地址(www.baidu.com)去数据库中查询是否已生成,如果生成则直接返回已生成的短链接,否则根据一定的规则生成新链接(www.yuming.cn/123456)


3.将短链接返回给前端用户,供用户进行操作


4.在浏览器中输入短链接请求服务器,服务器匹配数据返回长链接地址,从而访问到真正的长链接地址


3.2 关键Q&A


3.2.1 长地址与短地址的一一对应关系


短地址与长地址是一一对应还是一对多还是多对多?显然一个短地址对应一个长地址才是合理的,那这里我们需要自己封装或者寻找一个可以实现长短地址一一映射的函数,最好还能有从还能保持反向转换的能力。但是很遗憾,这样的算法不存在。那么怎么才能实现一对一呢?正确的思路是建立一个发号器,每次有一个新的长URL进来,我们就增加一。其实数字是一对一的,只要一个地址不存在,就给他一个自增的数字,如下图所示,那这么就实现了长地址与短地址的一一对应关系。


2.png


3.2.2 长地址与短地址的映射关系如何存储


我们返回的短URL一般是将数字转换成32进制,这样子可以更加有效的缩短URL长度。但是32进制的数字对计算机来说只是字符串,怎么存储呢?直接存储字符串对等值查找好找,对范围查找等太不友好了。

其实可以直接存储10进制的数字,只需要在业务逻辑层加一个进制转换的函数即可。这样不仅占用空间少,对查找的支持较好,同时还可以更加方便的转换到更多/更少的进制来进一步缩短URL。如下图所示。


3.png


当浏览器中访问www.yuming.cn/3oi0时,我们是可以获取3oi0参数的,然后对该参数进行解析10进制为123456,去数据库中查询123456的记录,就获取到原长地址URL,那这样数据库中也就不用去存短地址了。如下图所示。


4.png


3.2.3发号器高可用


很多时候我们依赖的是MySQL做发号器,每一次发号都需要访问一次MySQL来获取当前的最大号码,并且在获取之后更新最大号码,这个压力是比较大的。但是当发请求增大,对数据库的压力太大,可能会造成瓶颈。这里有两种思路。


批量发号(单点服务):

我们可以每次从数据库获取10000个号码,然后在内存中进行发放,当剩余的号码不足1000时,重新向MySQL请求下10000个号码.在上一批号码发放完了之后,批量进行写入。这样可以将对数据库持续的操作移到代码中进行,并且异步进行获取和写入操作,保证服务的持续高并发。

分布式发号(分布式服务):

上面设计的系统是有单点的,那就是发号器是个单点,容易挂掉。

可以采用分布式服务,分布式的话,如果每一个发号器进行发号之后都需要同步给其他发号器,那性能其实也得不到保证。假设我们有两个发号器,一个发单号,一个发双号,发号之后不再是递增1,而是递增2。


3.2.4地址重定向:301和302


●301永久重定向:第一次请求拿到长链接后,下次浏览器再去请求短链的话,不会向短网址服务器请求了,而是直接从浏览器的缓存里拿,减少对服务器的压力。


●302临时重定向:每次去请求短链都会去请求短网址服务器(除非响应中用 Cache-Control 或 Expired 暗示浏览器进行缓存)



性能&统计:

使用 301 虽然可以减少服务器的压力,但是无法在 server 层获取到短网址的访问次数了,如果链接刚好是某个活动的链接,就无法分析此活动的效果以及用于大数据分析了。


而 302 虽然会增加服务器压力,但便于在 server 层统计访问数,所以如果对这些数据有需求,可以采用 302,因为这点代价是值得的,但是具体采用哪种跳转方式,还是要结合实际情况进行选型。


目录
相关文章
|
2月前
|
域名解析 缓存 网络协议
浏览器中输入URL返回页面过程(超级详细)、DNS域名解析服务,TCP三次握手、四次挥手
浏览器中输入URL返回页面过程(超级详细)、DNS域名解析服务,TCP三次握手、四次挥手
|
5月前
|
编解码 Linux 开发工具
如何启动Windows平台轻量级RTSP服务生成RTSP拉流URL
为满足内网超低延迟需求,我们开发了轻量级RTSP服务模块,避免用户额外部署服务器。此模块集成于推送端SDK中,支持Windows、Linux、Android及iOS平台,可将本地音视频数据编码后通过RTSP协议提供。具备RTSP鉴权、单播/组播等功能,支持H.264/H.265编码,同时可创建多个服务实例,并查询连接数。实测总延迟约200-300毫秒,兼具稳定与高效。
102 1
|
7月前
|
文字识别 小程序 API
视觉智能开放平台产品使用合集之使用SDK进行视频活体检查时,如何将视频URL传递给后端服务
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
缓存 Java Spring
解决IDEA报错:无法检索应用程序 JMX 服务 URL[Failed to retrieve application JMX service URL]亲测可用
解决IDEA报错:无法检索应用程序 JMX 服务 URL[Failed to retrieve application JMX service URL]亲测可用
2398 1
|
8月前
|
监控 数据库
第六十七章 使用 Web 服务监控 IRIS - 监控 Web 服务的 URL
第六十七章 使用 Web 服务监控 IRIS - 监控 Web 服务的 URL
53 0
|
8月前
|
机器学习/深度学习 人工智能 API
人工智能平台PAI产品使用合集之机器学习PAI-EAS部署好后,服务的公网API和URL怎么配置
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
8月前
|
机器学习/深度学习 存储 人工智能
机器学习PAI endpoint确实是您服务的公网URL
机器学习PAI endpoint确实是您服务的公网URL
134 2
|
缓存 前端开发 安全
微服务轮子项目(06) - 服务认证架构设计(URL级权限控制)
微服务轮子项目(06) - 服务认证架构设计(URL级权限控制)
93 0
|
安全 前端开发 网络安全
网站漏洞检测服务对URL跳转漏洞检测分析
网站渗透测试是指在没有获得网站源代码以及服务器的情况下,模拟入侵者的攻击手法对网站进行漏洞检测,以及渗透测试,可以很好的对网站安全进行全面的安全检测,把安全做到最大化。在挖掘网站漏洞的时候我们发现很多网站存在域名跳转的情况,下面我们来详细的讲解一下。
393 0
网站漏洞检测服务对URL跳转漏洞检测分析
|
Web App开发 存储 编解码
hashify.me 神奇的在线服务 将整个文档存储在 URL 中
Hashify 是一个非常奇特的在线服务,它的目标不是解决一个问题,而是提出一个疑问:当我们把整个文档储存在 URL 中时会发生什么样的事情?
146 0
hashify.me 神奇的在线服务 将整个文档存储在 URL 中