一种基于隐多粒度局部特征的中文分词方法.pdf
山柳****魔王
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种基于隐多粒度局部特征的中文分词方法.pdf
本发明实施例公开了一种基于隐多粒度局部特征的中文分词方法。属于信息处理领域。该方法的特征包括:先利用多卷积核的卷积神经网络处理待分词文本,得到待分词文本的隐多粒度局部特征;再经过一个k‑max池化层,仅保留其中比较重要的局部特征;接着由一个双向的LSTM循环神经网络将句子中的上下文信息联系起来;最后应用标签推断,得到句子级别上的最优分词结果。本发明通过结合隐多粒度局部特征和上下文信息,使得分词效果得到提升,具有很大的实用价值。
基于Lattice-LSTM的多粒度中文分词.docx
基于Lattice-LSTM的多粒度中文分词标题:基于Lattice-LSTM的多粒度中文分词摘要:中文分词是中文自然语言处理任务中的重要一环,对于提高其他文本处理任务的效果至关重要。当前的中文分词方法在维持高精度的同时,普遍存在分词歧义和处理复杂句子结构的困难。为了解决这些问题,本论文提出了基于Lattice-LSTM的多粒度中文分词方法。该方法将LSTM网络与Lattice图结构相结合,有效地解决了分词歧义并能够处理复杂句子结构。实验结果表明,该方法在中文分词任务中取得了优秀的性能。1.引言中文分词是
一种基于词的关联特征的中文分词方法.pdf
本发明涉及一种基于词的关联特征的中文分词方法,属于信息处理技术领域。本发明从文本库中选出需要处理的文本,并对文本库进行预处理,包括去符号并使其形成语句,利用去符号后的语句构建语料库。采用前后拼接词的分词方法,对步骤a1中的语料库进行分词,形成分词碎片。采用二元切分前后词拼接,三元切分前后词拼接,四元切分前后词拼接方法,形成一个二元候选词库,三元候选词库和四元候选词库。对统计好了的词频的候选词设定一个词频门限,并对其进行判决,满足此判决的保留,形成新的语料库。
一种基于多粒度特征的身份认证方法.pdf
本发明公开了一种基于多粒度特征的身份认证方法,首先基于自编码‑多维泰勒网模型对接收数据进行多级数学表示,然后采用扩展Kalman滤波方法提取多级数学表示的多粒度特征,最后基于Gap度量方法对接收数据及合法数据的多粒度特征进行多尺度认证;计算每级粒度特征的Gap度量元素和,并与预定阈值比较。本发明采用上述身份认证方法,辅助卡方检测器的身份认证方法,对强隐蔽性的攻击方法进行检测,有效为工业信息物理系统提供防护。
一种基于LSB序列局部特征的通用隐写检测方法.docx
一种基于LSB序列局部特征的通用隐写检测方法随着信息技术的快速发展,隐写术成为了信息安全领域的一个重要研究方向。在现实生活中,人们经常使用隐写技术向所发送的信息中隐藏一些不希望他人知晓的内容。因此,对隐写技术的研究成为了信息隐藏和信息安全领域的研究热点。隐写检测是一项比较新的领域,旨在研究如何检测出潜藏于文件中的隐写信息。隐写检测在网络安全、数字版权保护、刑事侦查等领域有着广泛的应用。传统的隐写检测方法主要基于统计分析和机器学习技术,但这些方法往往需要大量的时间和计算资源,且检测精度很难保证。在本论文中,