【回声】反机器的验证码,反人类的12306

   |    2020年10月24日  |   首页  |    0 条评论  |    10

ad


【回声】反机器的验证码,反人类的12306

【回声专题】反机器的验证码,反人类的12306

摘要:验证码技术最初是为了防止程序对计算机的

来自美国的四位程序员Mark D. Lillibridge,MartínAbadi和Krishna Bharat。和安德烈·布罗德(Andrei Broder)应该不会想到,18年后大洋彼岸的中国人民,正在一个名叫12306的铁路购票网站上与验证码斗智斗勇,当初他们使用防御机器人的设计如今却遭到中国人民的

上个世纪九十年代末,网络还刚刚兴起。可是用户面临的一个亟需解决的问题就是在使用搜索引擎的时常被恶意计算机程序篡改搜索结果,以及大量的垃圾邮件

验证码的出现是为了“反机器”,是为了将人类和计算机程序区分出来的算法,目的是为用户上网

于是上文的四名程序员就在1997年研发出一种“选择性限制计算机系统访问方法”!(选择性限制访问计算机系统的方法)。在他们给美国专利局提交的专利申请中,详细突破了这一方法的想法和细节,他们通过“扭曲字符识别”,也就是我们现在经常看到最普通的那种对字符进行变形,缩放,或者在字符背后添加干扰

但是这种限制措施面临最核心的问题就是你如何区分放置电脑前的是一个人类而不是一段计算机程序?早在1947年科学家阿兰•图灵!就认为人和机器人是有区别的,他提出的“图灵测试”可以通过询问机编写的一系列问题进行测量判定,即“人向机器质疑” “”。但是验证码却是“反图灵测试”,即“机器向人提问”。2003年,美国卡耐基•梅隆大学的路易斯•冯•安领导的CMU研究组正式提出“验证码”这一步骤。概念,自动开放式人机区分图灵测试

CAPTCHA的目的就是区分计算机和人类的一种程序算法,这种程序必须能够生成并评估人类容易通过但计算机却通不过的测试。但是这个要求本身就是一个悖论

一个稳健,能被辩护,因为这意味着一个CAPTCHA必须能生成一个它自己不能通过的测试。为了与计算机抗衡,人们便开启了各种各样的验证码设计之路。

在CAPTCHA设计中,文本验证码是一种广泛的验证码形式。它需要广泛使用的CAPTCHA需要能够快速产生大量测试,需要考虑用户在语言,文化背景,甚至身体状况方面的差异。用户识别并输入扭曲图像中的字符,通常采用两种手段提高测试的安全性:1,图像变形。对字符进行尺寸缩放,旋转,扭曲等增大识别精度。2,添加噪声。添加线,块,较小的字符等噪声干扰识别。

转换字符分割和OCR技术的发展,通过采用点计数,垂直水平投影等图像预处理结果,谷歌算法对扭曲文本类验证码的识别率已经达到了99%,换句话说,这种验证码已经不再能准确检测出放置电脑前的了是人类还是程序了。但是为了保证网络服务的安全性,人们必须不断开发出在垂直方向能抵御机器攻击的CAPTCHA技术。

图像验证法因此应运而生。它是基于图像分类,目标识别,场景理解等计算机视觉领域较难的AI问题。开发者可以建立图像数据库,通过图像分类,例如:呈现给用户某种动物的四幅图片和一张动物名称列表,用户不需要键入动物

但是这种CAPTCHA有个明显的缺点端,用户再次拥有了这个图像数据库,算法自然不攻自破。为了增加破解难度,一家国外的流浪动物领养网站将传统的单选模式扩大到多选模式,结果显示随机猜测攻击的成功率仅为1/54000。谷歌通过一种基于图像方向识别的CAPTCHA发生了什么,测试要求用户将一幅图像旋转到

在“验证码”这片星辰大海上,国外的研究者往往是各出奇招。2009年,一家位于美国纽约的Solve Media公司甚至将验证码应用到商业领域。当您在登陆购物网站或收发邮件时,不必再纠结于那些乱七八糟的数字和字母的组合,取而代之是广告或常见品牌的标志。当展开一幅广告图片时,您只需填入它是哪家公司即可,这个便是广告验证码。自打该系统上线以来,Solve Media就吸引了2000年来出版商以及超过75个广告商使用这个平台,包括丰田,微软,环球影业,美国在线和Tribune

Facebook在2011年还推出了社会身份识别信息的验证形式。“我们会提供你的好友的照片让你来填写他们的姓名,黑客们可能会知道你的密码,却不知道

同时,越来越智能的验证码也将另一部分人类挡在了外边,那是视觉残障者,他们根本无法辨认澳洲的一名盲人韦恩•霍金斯在接受采访时就指出:“ CAPTCHA根本无法识别残疾人类”。他在互联网上发动了请愿,动员那些互联网公司放弃验证码这一愚蠢的验证形式。甚至CAPTCHA有语音验证,但语音背景噪声大且难以辨认,并且由于语音验证对资料库和网络带宽要求比较高,

被嫌弃的12306验证码成为阻挡大家过年回家的防线,面对骂声和质疑,12306奋发图强,花费多,收效

中国铁路总局2013年上线的12306网站只是需要确保在公众在同时进行购票时网站不会瘫痪,还要想办法与那些抢票软件做斗争。过去两年时间里,12306网站验证码机制的升级,显示形式也越来越奇葩,其中,2013年12月升级为彩色动态验证码; 2014年1月升级为新版静态验证码; 2014年年12月升级为完全看不清的“群魔乱舞”验证码; 2015年3月16日,需要一定的知识储备,眼神不好下不了手,手机端更彻底清且使用至今的图片验证码正式上线。

12306解释说图形验证码不足加高是为了防止黄牛。虽然高难度的验证码使来自外部的攻击变小了,但用户体验却变差了。在今年的春运抢票中,许多网友

根据360浏览器公布的数据显示,12306网站的购票验证码共有581万种,按照要输入两个关键字的规则,分成组合多个336980种。一次性输入正确的比例为8%,两次输入准确的比例为27%,三次甚至4次以上输入准确的比例为65% 。如果一次性输入成功的平均用时为5秒的话,按照热门车票“秒光”的情况计算,每输错一次验证码,就意味着当次购票成功率下降80%左右。

实际上,12306网站降低了验证码的图片质量,,,增加了关键词,当你在输错时刷新多次后图片即将由8张变成16张,这让12306网站验证码看起来不仅仅是不人性化,还特别是“反人类”。

分类起12306越走越复杂的验证码之路。国外的科技公司正着手把这个恼人的玩意变得简化。去年年底,谷歌正式宣布他们绝大部分的“验证码”都将被一个简单的校准所代替,用户只需替换“我不是机器人(I't a robot)”即可。如此,用户不必再输入一些失真的单词或数字了,谷歌表示在大多数

[详细]

[下一个,他们可以判断出一个真人和一个自动程序之间的不同,称为区别人类和机器之间的微妙差异,在于逐步移动鼠标的那一瞬间。

ad
回复 取消