CAPTCHA识别器可分辨94.4%的暗网CAPTCHA

发布时间：2022-02-10 09:47:14 所属栏目：安全来源：互联网

导读：研究人员提出基于机器学习的CAPTCHA识别器，可以识别94.4%的暗网CAPTCHA。当前，网络攻击和数据泄露等网络犯罪数量指数级增长。因此，使暗网变得更加透明对于针对性的网络攻击防御具有重要意义。研究人员想要创建一个将网络威胁情报流水线化处理的系统，这

研究人员提出基于机器学习的CAPTCHA识别器，可以识别94.4%的暗网CAPTCHA。

当前，网络攻击和数据泄露等网络犯罪数量指数级增长。因此，使暗网变得更加透明对于针对性的网络攻击防御具有重要意义。研究人员想要创建一个将网络威胁情报流水线化处理的系统，这就需要系统能够识别当前需要手动识别的CAPTCHA验证码。

CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart，全自动区分计算机和人类的图灵测试)的目的是区分计算机和人类的一种程序算法，是一种区分用户是计算机和人的计算程序，这种程序必须能生成并评价人类能很容易通过但计算机却通不过的测试。为了保护暗网网站免受DDoS攻击等的威胁，当前暗网网站在登录页都使用了CAPTCHA。而且这些CAPTCHA都是定制的，使得开发一个高准确率的CAPTCHA识别器非常困难。因此从暗网市场和论坛自动化地收集网络威胁情报都变得非常困难和昂贵。

为解决这一问题，研究人员提出一种基于机器学习方法的CAPTCHA识别器——DW-GAN。与近年来基于人工智能方法的CAPTCHA识别器方法不同，DW-GAN 使用GAN来去除背景噪声，使用增强的字母分割算法来处理可变字符长度的CAPTCHA图像。

识别器可以通过去除图像噪声、识别字母之间的边界、将内容分割为单个字母的形式来区分字母与数字。因此，CAPTCHA的大小并不影响识别器的有效性，尤其是识别3次的累计性能方面。不同CAPTCHA大小的识别准确率如下图所示：

从字符识别方面来看，识别器使用多个本地区域提取的样本来识别线、边等精细化特征，因此不会受到字符旋转、字体大小变化、颜色混合等的影响。研究人员对DW-GAN方法在不同数据集上进行了测试，其中包括在现实场景Yellow Brick的测试。研究人员从Yellow Brick收集了1831个非法产品，其中有286个网络安全相关的项目，包括102个窃取的信用卡、131个窃取的账户、9个伪造的扫描文件、44个黑客工具和1223条毒品相关的信息。

（编辑：宁德站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

微软曝光Nimbuspwn漏洞	说说网络攻击预测技术
FBI警示针对美国农业部	企业安全运营必备的几