加入收藏 | 设为首页 | 会员中心 | 我要投稿 52站长网 (https://www.52zhanzhang.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 搭建环境 > Linux > 正文

一种对加密后的随机编码字符文件进行解析的方法及装置制造方法及图纸

发布时间:2022-12-03 10:03:13 所属栏目:Linux 来源:互联网
导读: 本发明专利技术公开了一种对加密后的随机编码字符文件进行解析的方法及装置,方法包括:获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素

本发明专利技术公开了一种对加密后的随机编码字符文件进行解析的方法及装置,方法包括:获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容;根据字体结构像素内容按照类型对应配色生成待识别的图片;对待识别的图片进行文字识别,根据文字识别结果获取加密后的随机编码字符对应的真实字体,解析完成。本发明专利技术实施例对网页中加密后的随机编码字符进行解析,并生成待识别的图片,通过自动识别技术对待识别的图片进行识别,从而获取加密的随机编码字符对应的真实字体,为查看和保存加密的字符带来了方便。

A method and device for analyzing the encrypted random coded character file

全部详细技术资料下载

【技术实现步骤摘要】

一种对加密后的随机编码字符文件进行解析的方法及装置

本专利技术涉及数据存储

,尤其涉及一种对加密后的随机编码字符文件进行解析的方法及装置。

技术介绍

很多网页的页面的字符,在查看网页源代码时,字符是一些随机编码的字符,这些字符在后台文件中找到其真实的形状都是通过0,1两种像素点来进行存储的,如果将0,1分成黑白像素点显示到图片上,可以看到该字符真实的页面显示内容,但是如果想要保存该网页页面的内容,直接保存下来的被加密的乱码,无法对原来真实的页面内容进行解析查看。因此,现有技术还有待于改进和发展。

技术实现思路

鉴于上述现有技术的不足,本专利技术的目的在于提供一种对加密后的随机编码字符文件进行解析的方法及装置,旨在解决现有技术中无法对网页内容上的乱码进行解析查看的问题。本专利技术的技术方案如下:一种对加密后的随机编码字符文件进行解析的方法,所述方法包括:获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容;根据字体结构像素内容按照类型对应配色生成待识别的图片;对待识别的图片进行文字识别,根据文字识别结果获取加密后的随机编码字符对应的真实字体,解析完成。可选地,所述获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容前,包括:在浏览器页面检测到用户的页面字符查看指令后,查看对应的页面后台源码;若源码中显示内容不是字符,则页面字符为加密后的随机编码字符。可选地,所述获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容,包括:访问加密后的随机编码字符所在的网页文件,获取网页文件内容;读取网页文件中加密后的随机编码字符对应的字体结构像素内容,并将读取的字体结构像素内容以预定的字体格式类型进行保存。

可选地,所述字体结构像素内容包括0和1两种像素点类型;所述根据字体结构像素内容按照类型对应配色生成待识别的图片,包括:按照0和1两种像素点类型组成的字体结构像素内容按照不同配色生成待识别的图片。可选地,所述按照0和1两种像素点类型组成的字体结构像素内容按照不同配色生成待识别的图片,包括:获取要绘制的图片的尺寸大小、页面后台源码中的加密字符对应的字符串、预定的字体格式类型及0和1两种像素点分别对应的待填充的颜色;根据绘制的图片的尺寸大小、页面后台源码中的加密字符对应的字符串、预定的字体格式类型及0和1两种像素点分别对应的待填充的颜色,生成待识别的图片。可选地,所述真实字体为汉字、字母、数字中的一种或多种的组合。可选地,所述对待识别的图片进行文字识别,根据文字识别结果获取加密后的随机编码字符对应的真实字体,解析完成,包括:获取汉字、字母、数字的训练样本图片;构建卷积神经网络的卷积层、池化层和全连接层;根据训练样本图片对卷积神经网络进行训练,当网络的输出的正确率达到预设的正确率后,生成目标卷积神经网络模型,将目标卷积神经网络模型存储到指定文件目录;调用目标卷积神经网络模型,在目标卷积神经网络模型输入待识别的图片,获取目标卷积神经网络模型的输出结果,输出结果为加密后随机编码字符对应的真实字体,解析完成。

本专利技术的另一实施例提供了一种对加密后的随机编码字符文件进行解析的装置,所述装置包括至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的对加密后的随机编码字符文件进行解析的方法。本专利技术的另一实施例还提供了一种非易失性计算机可读存储介质,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行上述的对加密后的随机编码字符文件进行解析的方法。本专利技术的另一种实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被处理器执行时,使所述处理器执行上述的对加密后的随机编码字符文件进行解析的方法。有益效果:本专利技术公开了一种对加密后的随机编码字符文件进行解析的方法及装置,相比于现有技术linux编码,本专利技术实施例通过网页中加密后的随机编码字符进行解析,并生成待识别的图片,通过自动识别技术对待识别的图片进行识别,从而获取加密的随机编码字符对应的真实字体,为查看和保存加密的字符带来了方便。

附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1为本专利技术一种对加密后的随机编码字符文件进行解析的方法较佳实施例的流程图;图2为本专利技术一种对加密后的随机编码字符文件进行解析的装置的较佳实施例的硬件结构示意图。具体实施方式为使本专利技术的目的、技术方案及效果更加清楚、明确,以下对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。以下结合附图对本专利技术实施例进行介绍。本专利技术实施例提供了一种对加密后的随机编码字符文件进行解析的方法。请参阅图1,图1为本专利技术一种对加密后的随机编码字符文件进行解析的方法较佳实施例的流程图。如图1所示,其包括步骤:步骤S100、获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容;步骤S200、根据字体结构像素内容按照类型对应配色生成待识别的图片;步骤S300、对待识别的图片进行文字识别,根据文字识别结果获取加密后的随机编码字符对应的真实字体,解析完成。具体实施时,本专利技术实施例通过页面的html文件找到页面加密字符对应的字体结构像素内容;将0,1类型的字体结构像素内容生成按照不同配色生成图片;运用自动识别技术进行图片的文字识别,找到加密字符对应的真实字体名称,完成解析。

真实字体为汉字、字母、数字中的一种或多种的组合。具体地,进行图片的文字识别可采用训练好的cnn卷积神经网络或采用OCR技术对图片内容中的文字进行识别。其中,卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习(deeplearning)的代表算法之一。卷积神经网络仿造生物的视知觉(visualperception)机制构建,可以进行监督学习和非监督学习,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化(grid-liketopology)特征,例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程(featureengineering)要求。OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。在进一步地实施例中,获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密

【技术保护点】

1.一种对加密后的随机编码字符文件进行解析的方法,其特征在于,所述方法包括:获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容;根据字体结构像素内容按照类型对应配色生成待识别的图片;对待识别的图片进行文字识别,根据文字识别结果获取加密后的随机编码字符对应的真实字体,解析完成。

【技术特征摘要】

1.一种对加密后的随机编码字符文件进行解析的方法,其特征在于,所述方法包括:获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容;根据字体结构像素内容按照类型对应配色生成待识别的图片;对待识别的图片进行文字识别,根据文字识别结果获取加密后的随机编码字符对应的真实字体,解析完成。2.根据权利要求1所述的对加密后的随机编码字符文件进行解析的方法,其特征在于,所述获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容前,包括:在浏览器页面检测到用户的页面字符查看指令后,查看对应的页面后台源码;若源码中显示内容不是字符,则页面字符为加密后的随机编码字符。3.根据权利要求2所述对加密后的随机编码字符文件进行解析的方法,其特征在于,所述获取加密后的随机编码字符所在的网页文件,根据网页文件获取加密后的随机编码字符对应的字体结构像素内容,包括:访问加密后的随机编码字符所在的网页文件,获取网页文件内容;读取网页文件中加密后的随机编码字符对应的字体结构像素内容,并将读取的字体结构像素内容以预定的字体格式类型进行保存。4.根据权利要3所述的对加密后的随机编码字符文件进行解析的方法,其特征在于,所述字体结构像素内容包括0和1两种像素点类型;所述根据字体结构像素内容按照类型对应配色生成待识别的图片,包括:按照0和1两种像素点类型组成的字体结构像素内容按照不同配色生成待识别的图片。5.根据权利要求4所述的对加密后的随机编码字符文件进行解析的方法,其特征在于,所述按照0和1两种像素点类型组成的字体结构像素内容按照不同配色生成待识别的图片,包括:获取要绘制的图片的尺寸大小、页面后台源码中的加密字符对应的字符串、预定的字体格式类型及0和1两种像素点分别对应的待填充的颜色;根据绘制的图片的尺寸大小、页面后台源码中的加密字符...

【专利技术属性】

技术研发人员:黄兴鲁,

申请(专利权)人:深圳数位传媒科技有限公司,

类型:发明

国别省市:广东,44

全部详细技术资料下载 我是这个专利的主人

(编辑:52站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!