【密码学相关】百度验证码的相关解析及探究
我说要有光2008/09/06软件综合 IP:河北
百度贴吧中的验证码钥匙被称为BS,这个名称的由来来源与其贴吧源代码中的一个隐藏提交数据<input type=hidden name=bs value="*************************">,这段字符串由百度贴吧的发帖或回帖界面提供,与它相对应的是两个值,既str2和word1,其中word1为手工填写的验证码内容,str2为防止伪造BS的一个对应参数,它在爆吧的环节中起到一个重要的作用,就是收集到足够的BS后同时发出,可以达到一瞬间刷满屏幕的效果

首先现在BS最后32位是类似16进制的字符串
去掉这最后的32位后,是一串带有很多3的
比如13935303236323这样
这些3是干扰,要去掉
处理后的字串,第一位固定为1,第二位代表一个长度,比如5,那么后5位就是这个吧的lm值。之后一段是由获取这个BS的Ip计算出的,也就类似封IP时的那个参数。再后面一段是个随机数。再后面是0000000012564123这样,是当前时间,以秒为单位

比如
313531383831363130393033393337313731303832333437343536303030303030303030303030303031323230363434343231B236CF43CF23960E945076B042249072

去掉最后32位是
313531383831363130393033393337313731303832333437343536303030303030303030303030303031323230363434343231

去掉干扰3
151881610903937171082347456000000000000001220644421
分割
1 5 18816 10903937 171082347456 000000000000001220644421

第一段固定是1
第二段是5,表示第三段长度为5
第三段是lm值,这个是123吧的lm值,没有建立的贴吧lm值为0
第四段是已经被加密的我的IP地址
第五段或许是随机的
第六段是现在的时间戳


下面是百度贴吧中的一段源代码,其中有一个函数叫fr_as_js_tr,它通常由101~110的数字和0x0fffffff以及一些数学运算符组成,同样由百度贴吧的发帖或回帖界面提供,它返回的值既str2,每个str2对应着一个BS,这导致了伪造BS不可行
function fr_as_js_tr(){ return ((((((((((0x0fffffff&110)|108)&102)^105)&105)|108)&109)&109)|103)|103);}


以上这些已知资料是我在百度玩爆吧的一个朋友总结出来的,但这些还远远不够

因为现在每个BS的寿命大概为15分钟,并且仅仅对应一个贴吧(lm值),这使得长时间的挖坟或爆吧不可行,对IP的限制同样使代理服务器的方案失效,所以我们现在希望能够通过探究bs(验证码钥匙)、word1(验证码)、str2(BS防伪造串)之间的关系让爆吧这种古老的游戏重新变得有趣起来,但以我们目前所掌握的数学及密码学知识还无法解决这样一个问题,所以希望得到这里的高手们的协助

以下是百度贴吧的一段源代码(尚未创建的贴吧,lm = 0)

来自:计算机科学 / 软件综合
5
已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也
shuimi126
15年9个月前 IP:未同步
43109
强的没话说!
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
AnthraX
15年9个月前 IP:未同步
43117
百毒的验证码貌似不是那么花哨,采用ocr的方法好了……
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
93°
15年9个月前 IP:未同步
43119
LS所言差矣
百度验证码识别我研究了很久
OCR技术我也有,一度接近成功
但是最重要的问题就是:百度的验证码是全部黏在一起的,这使得无法切分,自然无法识别。不想某些网站的验证码,有一点点分开,我也可以根据曲线和其他参数轻松搞定,就一个字:贱
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
noname剑人
15年9个月前 IP:未同步
43161
对于验证识别不在行
膜拜+学习
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

所属专业
上级专业
同级专业
我说要有光
进士 学者 机友 笔友
文章
317
回复
5531
学术分
15
2008/03/06注册,2时1分前活动

Inspiration, Innovation, Discovery

主体类型:个人
所属领域:无
认证方式:手机号
IP归属地:未同步
文件下载
加载中...
{{errorInfo}}
{{downloadWarning}}
你在 {{downloadTime}} 下载过当前文件。
文件名称:{{resource.defaultFile.name}}
下载次数:{{resource.hits}}
上传用户:{{uploader.username}}
所需积分:{{costScores}},{{holdScores}}下载当前附件免费{{description}}
积分不足,去充值
文件已丢失

当前账号的附件下载数量限制如下:
时段 个数
{{f.startingTime}}点 - {{f.endTime}}点 {{f.fileCount}}
视频暂不能访问,请登录试试
仅供内部学术交流或培训使用,请先保存到本地。本内容不代表科创观点,未经原作者同意,请勿转载。
音频暂不能访问,请登录试试
支持的图片格式:jpg, jpeg, png
插入公式
评论控制
加载中...
文号:{{pid}}
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}