搭建百万级别邮件发送平台

简介:

一. 前言

调用邮件接口发送邮件是再简单不过的功能。但是要做成平台并且支持百万级别的发送量,就没那么简单。

如何快速的将数百万封邮件推送出去?这个功能看上去和发送数百万条短信一样。找个靠谱的第三方推送平台,起多个进程,分分钟的事情,瓶颈肯定是在第三方平台而不是我们这里。但是这个简单的百万级别邮件发送平台(EDM)耗费了我3个多月的时间。

EDM(Email Direct Marketing)主要用于较大量的营销和推广类邮件发送。我搭建的EDM平台主要用于给订阅用户发送推广类邮件和通知类邮件。

二. 思考

最初我们的需求是需要定期给100W用户推送邮件,接到这个需求时我最初的想法如下:

  1. 因为发送邮件、短信、APP推送的业务非常相似,所以我打算做成一个消息中心,发邮件功能只是调用消息中心接口时传的一个名为email的消息类型。

  2. 因为第三方邮件平台对接口调用频率肯定会有限制,所以我们需要计算申请多少个发件邮箱,起多少个发送进程。

  3. 因为邮件是按顺序发送(新用户先发,老用户后发),所以需要在进程间进行通信,使用信号量或者消息队列。

  4. 还有一些零散的优化点。比如要支持任务中断,支持用户已读功能,邮件样式需要兼容Mac版Outlook客户端,右上角一定要有『在浏览器中查看此邮件』,右下角要有『取消订阅』。

依照如上规划,EDM平台很快就搭建完成,各个功能点测试一路畅通,于是正式上线投入生产。看着自己一气呵成写的项目完美上线,心情无比舒畅,不过这只是噩梦的开始……

按道理说不可能出问题,EDM项目中使用的每一个技术点都是我拿手的方案……当问题出现时我才发现EDM项目原来这么难,很多问题不是技术能解决的。成功投递一封邮件很简单,但是成功投递100W封就难于上青天,技术只是解决问题的工具,当出现的问题没法用工具解决时,我们只能寻求理论支撑。

三. 我要的理论支撑

我接触互联网时QQ这种IM工具就人人必备了,邮件对我来说是一种古老的沟通工具,除了工作中需要使用外,生活中都不会打开。Gmail中全是Facebook,Twitter,Linkedin的广告,QQ和网易邮箱更是惨不忍睹。这也导致我对Email协议的了解少的可怜。而我首先要面对的就是各种『反垃圾邮件策略』导致的投递失败问题。

反垃圾邮件策略有很多,Email协议也定义了大量的规范,详情 http://www.faqs.org/rfcs/ 我将拿出主要的优化点来说明。

  1. 添加 MX 与 SPF 记录

    MX(Mail Exchanger)是邮件交换记录,它指向一个邮件服务器,用于电子邮件系统发邮件时根据收信人的地址后缀来定位邮件服务器。用户可以将该域名下的邮件服务器指向到自己的mail server上,然后可自行操控所有的邮箱设置。

    SPF (Sender Policy Framework)发信者策略架构,通常都直接称为SPF,SPF是为了防范垃圾邮件而提出来的一种DNS记录类型,它是一种TXT类型的记录,它用于登记某个域名拥有的用来外发邮件的所有IP地址。

    SPF是跟DNS相关的一项技术,它的内容写在DNS的txt类型的记录里面。MX记录的作用是给寄信者指明某个域名的邮件服务器有哪些。SPF的作用跟MX相反,它向收信者表明,哪些邮件服务器是经过某个域名认可会发送邮件的。

    SPF的作用主要是反垃圾邮件,主要针对那些发信人伪造域名的垃圾邮件。

    这两个参数很好加,添加两条DNS解析记录就行。

  2. 支持 DKIM、DMARC 协议

    DKIM(DomainKeys Identified Mail)域名密钥识别邮件标准。发送方会在电子邮件的标头插入DKIM-Signature及电子签名信息。接收方则透过DNS查询得到公钥后进行验证。

    DMARC(Domain-based Message Authentication, Reporting and Conformance)由Paypal,Google,微软,雅虎,ReturnPath等15家行业巨头(主要包括 金融机构,Email服务提供商,数据分析机构等)联手宣布成立了新的互联网联盟,致力于提交并推广一款[DMARC]新电子邮件安全协议。随着该联盟的日渐发展,继而有网易等其他行业先行者也加入到其中。

    这两个协议特别不好加……如果你使用的是阿里云邮箱服务,可以联系客服帮忙添加。

  3. 配置 List-Unsubscribe

    List-Unsubscribe用来设置取消订阅参数,通常设置一个收件箱,比如 unsubscribe@test.com。主流的邮件服务器都会检测有没有该参数,有的话会直接在客户端显示一个『取消订阅』的按钮。比如Gmail中有时候就会显示,点击这个按钮就会自动往 unsubscribe@test.com 发送一封邮件,我们需要实时去检测 unsubscribe@test.com 邮箱中有没有收到用户发送的邮件,有的话下次就别再给该用户发邮件了,否则处罚严重。

    如果你不设置这个参数很容易被邮件服务商拒收或者限制频率。List-Unsubscribe参数是设置在Email协议的请求头中,并不是在邮件内容中添加一个『取消订阅』的超链接。

  4. 调试技巧

    可以到 http://www.mail-tester.com/ 去看邮件的得分情况,主要就是检测如上参数,生效与否一目了然。

    Gmail中可以查看原始邮件的内容,https://mail.google.com/mail/u/0/#inbox

配置了如上所有参数之后,我们平台发送的邮件到测试平台测试得分基本在99分以上,皆大欢喜!不过开心的太早了,通过配置各种协议和参数我们只能提高邮件的到达率,但是并不能保证邮件不被拒收。国内的邮件服务商网易和腾讯属于邮箱巨头,这两巨头并不是所有邮件都收,他们的策略如下:

  1. 每分钟,每小时,每天都有对应的发送量限制;

    针对不同的厂商我们通过计划任务去执行不一样的发送频率,比如网易的每分钟只发15个,腾讯的每分钟只发20个,以此类推……但是我们有上百万封邮件要发送,肯定不能发几个月。于是申请了多个邮箱来同时发送,这些发送逻辑都能通过代码实现,代码能解决的问题都不算问题。

  2. 邮件内容的质量把控

    归根到底如果邮件内容的质量很低,技术优化的再好用户还是会扔到垃圾桶或者举报。举报的次数一多,邮件服务商给的额度就越低,比如一分钟只让发5封……100万封得发送2年(当然真实情况不会这样,加入邮件服务商的联盟之后都好办)。

    所以我们花了大量的工作在邮件内容的把控上,每一封发出去的邮件都需要多人审核,多端多平台样式测试。最后确保每一封邮件都很精致,让用户有欲望打开。当然作为程序员,很多我很反感和觉得不适合的内容最后还是会发送到用户手中,这点技术没办法优化。

四. 最后

现在EDM平台能保证邮件的到达率保持在96%以上,百万级别的邮件发送一次就是几千块钱的费用,如果不努力提高送达率就是把钱打水漂,做这个功能也没有存在的意义。写代码时间越久就越发的觉得技术只是拿来服务用户的,如果代码产生不了价值其实就是垃圾代码。

目录
相关文章
|
开发工具 git Python
彻底解决 git push 的【pack exceeds maximum allowed size】
彻底解决 git push 的【pack exceeds maximum allowed size】
1862 0
|
Ubuntu 关系型数据库 MySQL
如何在 Ubuntu 20.04 上安装 MySQL
MySQL是最流行的开源关系数据库管理系统。它速度快,容易使用,容易扩展,并且流行的LAMP和LEMP的一部分。 这篇指南讲解了如何在 Ubuntu 20.04上安装和保护 MySQL。 一、前提条件 确保你以 sudo 用户身份登录 二、在 Ubuntu 上安装 MySQL 在写作这篇文章的时候,Ubuntu 源仓库中最新的 MySQL 版本号是 MySQL 8.0。
58639 4
如何在 Ubuntu 20.04 上安装 MySQL
|
2月前
|
存储 安全 数据库
使用 Docker 部署 Clawdbot(官方推荐方式)
Clawdbot 是一款开源、本地运行的个人AI助手,支持 WhatsApp、Telegram、Slack 等十余种通信渠道,兼容 macOS/iOS/Android,可渲染实时 Canvas 界面。本文提供基于 Docker Compose 的生产级部署指南,涵盖安全配置、持久化、备份、监控等关键运维实践(官方无预构建镜像,需源码本地构建)。
3268 7
|
安全 网络协议 网络安全
无需花钱!教你申请免费 IP 地址 SSL 证书的完整指南
为IP地址配置SSL证书较为复杂,因大多数免费SSL证书仅支持域名验证,而不支持IP地址。SSL证书基于域名进行身份验证,而IP地址缺乏类似机制。通常,免费证书提供商如Let's Encrypt不支持IP地址,但JoySSL提供针对IP地址的免费试用SSL证书服务。用户需访问JoySSL官网注册并填写特定注册码230922获取资格,后续按提示提交申请并验证IP地址所有权。审核通过后可获得证书。JoySSL还提供多样化的证书选择、简便申请流程和优质技术支持,满足不同需求。
|
算法 Python
SMOTE
【6月更文挑战第26天】
1103 1
|
缓存 关系型数据库 MySQL
mysql用in查询大量数据的方法
在MySQL中使用 IN 子句来查询大量数据时,性能可能会成为一个问题
1232 0
|
存储 Web App开发 Ubuntu
整理16款适用于较旧低配置电脑的最佳Linux发行版
在本指南中,趣云笔记(https://www.ecscoupon.com/)介绍了一些最好的Linux发行版,你可以将它们安装在旧PC上并为其注入新的活力。
28754 0
|
算法 定位技术 Python
秒懂算法 | A*算法实现最优路径规划
启发式探索是利用问题拥有的启发信息来引导搜索,达到减少探索范围、降低问题复杂度的目的。A*寻路算法是启发式探索的一个典型实践,在寻路搜索的过程中,给每个节点绑定了一个估计值(即启发式),在对节点的遍历过程中采取估计值优先原则,估计值更优的节点会被优先遍历。
3738 1
秒懂算法  | A*算法实现最优路径规划
AVI格式视频文件编码格式缺少编码解释器且该项目的编码格式不受支持(0xc00d5212错误)
AVI格式视频文件编码格式缺少编码解释器且该项目的编码格式不受支持(0xc00d5212错误)
4833 0
AVI格式视频文件编码格式缺少编码解释器且该项目的编码格式不受支持(0xc00d5212错误)
|
安全 PHP 数据库
PHP中双引号引起的命令执行漏洞
PHP中双引号引起的命令执行漏洞在PHP语言中,单引号和双引号都可以表示一个字符串,但是对于双引号来说,可能会对引号内的内容进行二次解释,这就可能会出现安全问题。 0|1正文举个简单例子 <?php$a = 1;$b = 2;echo '$a$b';//输出结果为$a$becho "$a$b";//输出结果为12?>可以看到这两个输出的结果并不相同。
1455 0

热门文章

最新文章