基于预训练语言模型的钓鱼URL检测方法及系统.pdf
美丽****ka
亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于预训练语言模型的钓鱼URL检测方法及系统.pdf
本发明公开一种基于训练语言模型的钓鱼URL检测方法及系统,方法包括:获取URL数据源,构建URL语料库;构建URL分词系统,训练URL分词系统及初始化词嵌入,得到URL初始化子词向量;构建多层网络编码器,基于三元组掩码对多层网络编辑器进行训练,得到模糊掩码语言模型;对模糊掩码语言模型进行微调处理以得到钓鱼URL检测任务模型;将待测URL输入至所述钓鱼URL检测任务模型中,得到检测结果。本发明具有极高的钓鱼网站检测成功率,公开数据评估上识别率达到99%以上;只需要将原始的URL送入到模型中,模型会自动地执行
基于URL语言特征的钓鱼网站检测算法.docx
基于URL语言特征的钓鱼网站检测算法基于URL语言特征的钓鱼网站检测算法摘要:随着互联网的发展,钓鱼网站的数量和种类日益增多,给用户的网络安全带来了严重的威胁。因此,研究和开发一种高效准确的钓鱼网站检测算法变得至关重要。本论文提出了一种基于URL语言特征的钓鱼网站检测算法,旨在通过URL中的语言特征来自动识别和防范钓鱼行为。首先,本文介绍了钓鱼网站的定义和特点,并列举了目前广泛应用的钓鱼网站检测方法。接着,我们详细介绍了基于URL语言特征的钓鱼网站检测算法的设计和实现。最后,通过实验证明了该算法的有效性和
基于URL的网络钓鱼检测机制的研究与实现.docx
基于URL的网络钓鱼检测机制的研究与实现网络钓鱼是一种利用虚假网站,诱导用户输入个人敏感信息,从而进行信息窃取或其他欺诈行为的攻击手段。根据统计数据,网络钓鱼已经成为网络犯罪中非常有影响力的攻击手段之一。为了应对这一威胁,学者和工程师们采取了多种措施。其中之一是基于URL的网络钓鱼检测机制。1.研究意义钓鱼攻击具有很高的欺骗性和隐蔽性,常常让普通用户难以辨别真伪。因此,发展一种高效的网络钓鱼检测机制对于网络安全至关重要。基于URL的网络钓鱼检测机制就是一种有效的手段,能够帮助用户和网站建立一个可靠的安全屏
基于预训练语言模型的在线处方风险自动识别方法及系统.pdf
本发明的一个技术方案是提供了一种基于预训练语言模型的在线处方风险自动识别方法,其特征在于,包括以下步骤:智能检索;智能匹配;智能生成;合理用药自动审方;在线支付;物流配送。本发明的另一个技术方案是提供了一种基于预训练语言模型的在线处方风险自动识别系统。本发明基于健康档案的应用预训练语言模型的在线处方风险自动识别的方法,可让复诊患者在线上快速检索到自身健康档案,依据就诊记录和用药明细智能且快速形成复诊续方单并完成审方,简化复诊患者的就医问诊流程,帮助复诊患者快速购买支付所需药品,并协调药品库存和物流使其及时
基于预训练模型变种的新闻文本分类方法及系统.pdf
本发明公开了一种基于预训练模型变种的新闻文本分类方法及系统,属于文本分类领域。本发明采用BERT和RNN复合模型对数据集中的特征进行有效提取,对于已经经过预训练的BERT模型,其广泛适用于下游任务的各个集合,不需要利用重复数据进行训练,同时基于self‑attention机制可以有效的可以不仅可以得到源端与目标端词与词之间的依赖关系,同时还可以有效获取源端或目标端自身词与词之间的依赖关系。在此基础上,引入了RNN模型,用于捕捉长距离文本依赖上信息丢失的问题,对结果进行特征融合,在新闻文本分类上取得了较为理