手机条码扫描app推荐 验证码图标不显示怎么办( 二 )


乍一看,好像真有免费的午餐,随便下载个CNN-python项目,改几行代码,然后开始疯狂标注数据过程,就能跑出来模型 。
笔者自己最初也是这么想的,只求简单粗暴,于是弄了几个项目下来跑了之后,发现代码是可以用,但是效果非常拉跨,单个字符识别正确率很低,70%不到,4-6个字符那正确率就更低了,基本上达不到高正确率,可用性非常一般 。对于一个有追求的程序猿,不可能这么就完事了,于是,这就有了这个项目的整活 。
在使用这些开源项目的过程中,发现下载的项目实现过程大都分为2种思路,第一种无需图片切割,直接数据标注训练模型;第二种为图片验证码进行字符切割,然后为单个字符进行分类训练 。项目执行的具体过程就不演示了,有兴趣的读者开源自行捣鼓,下面就是笔者自己对2种思路适用方式的实践思考总结:
1. 第一种无需图片切割
优点:简单粗暴,通用性强,直接用各种卷积神经网络模型硬怼图片验证码提取特征,适合知道验证码生成的正向代码过程,用代码生成图片验证码数据给模型训练 。
缺点:数据量小时模型拟合效果差,需要大量人工标注数据,不太适合不知道验证码生成规则,少量标注数据 。
【手机条码扫描app推荐 验证码图标不显示怎么办】2. 第二种进行字符切割
针对验证码生成规则,分析验证码各种背景干扰、噪声点像素、字体形变和累叠、字符位置随机及个数不定、反色等情况,对图片逆向处理,达到局部字符可切割,降低卷积模型层次,降低数据标注量,实现字符分类 。
优点:可针对单一图片验证码做特殊预处理,可实现部分字符切割,针对字符小图进行分类训练,小批量数据标注就可以训练模型达到高拟合效果,达到可用
缺点:通用性不强,训练模型只适用特定图片验证码,复杂验证码可能无法切割XDM,等等,还有一种思路:
笔者自己学习OpenCV时想到的,通过图片预处理,轮廓检测,然后对A-Z,0-9字符通过SIFT算法进行特征提取,最后跟需要匹配的字符进行FLANN匹配,理想很丰满,然后编写相关代码后发现由于验证码的正向生成过程导致字符特征变化太大,并不适合,于是放弃采用该思路,代码见上述代码链接中的python项目image_match.py 。
根据以上思路总结,根本没有免费的午餐,好的数据和特征工程同等重要,要实现好的效果,都是要根据具体问题具体分析,所以笔者分析自己的图片验证码识别案例,更适合第二种,另外一点原因大批量标注数据人工成本过高,个人不太喜欢 。以下将附带案例详细介绍第二种识别思路的实现过程 。
三、实现思路 根据需求初步分析,大概可分为四个步骤:

猜你喜欢