为什么我们总是抢不到回家的票?为什么过年回家票一放出来就被人一枪而空?火车高铁票还分学生票和成人票?这些你都知道吗?hackTalk今天就来告诉你关于抢火车票的网络知识。
按道理讲,黄牛抢票是个很正常的现象,他们其实也是模拟人买票进行的操作只不过他们是替人买票,然后赚取佣金的,有需求才会有市场,这个现象其实侧面也反应出购票市场的刚需。但是,如果有人破解并利用了12306安全机制这个问题就不一样了,通过黑客的方式破解了12306相关的安全机制,并利用漏洞进行抢票,整个流程会有社会各种人群的介入,过程中有产生很大利益,在利益的趋势下,什么事件都有可能发生,抢票正是其中的一点。破解12306网站的安全机制,在技术上或许不难,因为在网络世界里,没有一个系统是绝对安全的系统。但是对于黄牛来说,他们都是靠抢票来获取相关的“薪水”,估计很少会出破解某网站程序的人才,最大的可能就是黑客参与其中,破解并收取相关费用,这下问题就来了,若真是黑客帮助了黄牛,并且从中收取费用,这就涉及到一个犯罪动机的问题,黄牛组织牺牲大众抢不到票的利益来换取他们的部分利益,并且和黑客合作作案,这已经是一个比较严重的犯罪行为了。
但是,如果是正常的购买呢,那就其实不涉及犯法了。下面我们还原一下黄牛抢票的过程:先用软件注册一千个账号,刷票先,先把这一千个账号登陆,cookie独立保存,设置好区间和车次,获取验证码,识别验证码,模拟订单提交。那么哪一步对于黄牛来说是难的,登陆这千个账号吗,即使没有软件,手动登陆也不是问题,但是早已经有网站或者工具可以实现开一千个页面并且独立保存cookie。其实真正的难点在于识别验证码并提交订单,但是随着机器学习越来越成熟,这个功能破解也变得越来越简单
这是我们熟悉的验证码的页面,利用机器学习,完全可以实现识别这些图片的内容或者标签,并匹配相关内容
我尝试直接将图片处理后丢入 google、百度的识图接口,返回的结果你们也可以自己去测试,关键词基本上都可以识别到,接着我进行了下一步的处理工作,再次利用第三方软件识别中文字符,然后将字符与图片字符进行匹配。然后测试12306登陆验证码的图片通过率,这个概率大概在 85% 左右。所以,仅仅是技术爱好者动用一些公用接口就轻松能识别图片内容,而且一旦识别后,还可以将这张出现过的图片存库,再次出现就更加快速准确的定位了。暂且不谈图像识别和机器学习这样高大上的破解方法了,现在这些技术已经相当成熟,任何一个稍微学过机器学习的程序员都能够破解这些图片。图片验证码之所以不安全,是因为目前的图片识别技术也是相当的成熟。12306 这些图片如果是人工标记,无疑是将自己摆到一个愚公移山的悲壮位置;如果是机器识别,也一样是可以被识别内容,即用图片内容的识别作为验证核心将毫无意义。所以其实整个抢票的流程几乎都是在模拟人工操作,只是利用了我们现有的技术,对这个人工操作进行了智能化的处理。
这就是为什么我们总是抢不到票的原因了,分母一定的时候,黄牛扩大了分子提高了抢票概率,而我们只是分母之中的“1”,自然概率就低很多了,那么怎样才能彻底杜绝黄牛抢票呢,实话实说,上有政策下有对策,这始终是场博弈。