前情概要

yolo是一个很厉害的数据标注算法,已经有好几个版本,其中的V11版本非常厉害,不管是训练速度、还是准确程度(同等数据集的情况下)都领先于其他的数据标注算法。
所以我们这次围绕着对人才呀验证码的数据标注实现自动识别验证码为契机和例子以学习yoloV11的数据标注功能。


本着学习的想法,其实市面上有大多数OCR(亦或者在本地部署OCR、接码平台)的技术可识别此类验证码,但效果不太理想,在计算类验证码中,其中的"/(除)"和"1"非常相似,很难有OCR能够识别出差异,并且有时候能取到运算数字但无法取到运算符号,这是一个糟糕的情况,所以本着学习的方式我们训练一个模型来查看是否能通过验证码识别。

数据分析

平台网址

aHR0cDovL3JlbmNhaXlhLnZpcC8=

接口抓包

目前对人才呀的在登录账号时弹出的验证码进行抓包,分析接口。
其中网站有WevDev拦截技术,无法通过F12/右键/开发者工具 打开Dev,并且如果在网站访问前打开的Dev会被强行关闭并且跳出网站,遇到这个问题就需要跟栈分析,而不能像之前遇到"debugger"一样通过堆栈分析,具体方案如下:

访问网站之前打开Dev并设置在脚本第一句启动断点

因为这个网站在实际运行当中,无法打开Dev,所以我们需要在打开这个网站之前,将Dev打开,并且设置为脚本都自动断点,逐步分析,查看具体是哪一段的JS代码阻止了Dev的打开。如图所示。
1.png

跟着断点逐步分析,定位到JS文件

更新中......

分类: 数据采集与自动化处理 标签: 暂无标签

评论

暂无评论数据

暂无评论数据

目录