基于概念空间的文本语义索引

一、基于概念空间的文本语义索引（论文文献综述）

岳雪^[1]（2021）在《“普京政治话语”中政治文化观念的系统建构与演化研究（2000-2020）》文中研究指明在国内外学界,普京政治话语研究已成为一个重要的“现象级”话题。普京自2000年上任至今走过了20年的执政历程,与此同时俄罗斯的政治话语历经20年的动态发展建构出一种独具特色的“普京政治话语”,借助各种语言手段和话语实践呈现领导人政治文化观念的输出与传递。政治文化观念是政治语言学框架下一个复杂的观念系统,基于文化观念理论衍生而出并应用于政治语言学之中。政治文化观念根植于政治话语当中,通过挖掘其中的社会实践应用揭示出语言背后权力与意识形态之间的深层次关系。政治文化观念在不同的历时时期展现出政治文化观念的动态演化,每个政治文化观念之间不是孤立的,是彼此紧密相连的整体。政治文化观念是在政治与语言的博弈中形成,政治文化观念作为政治话语的系统构成,其总和构成政治语言世界图景,任何一个政治文化观念都是政治语言世界图景的片段写照。政治文化观念贯穿于政治交际主体、政治话语实践和政治语言世界图景这一动态的主体对话关系之中。从政治语言学视角出发,各国领导人政治话语中的政治文化观念问题是跨学科、跨文化交际研究中的热点和趋势,具有一定的研究意义和实践价值。普京政治话语对内宣传政治理念,对外表明国家立场,对其政治文化观念的研究有助于掌握俄罗斯国家政策和理解俄罗斯政治赖以生存的社会实践,对我国政治话语建构以及政治文化观念传递具有一定的参考和借鉴。本文以政治语言学与语言文化学研究理论为基础,以2000-2020年期间俄罗斯总统国情咨文和普京“直播连线”政治话语为例,借助语料库等研究方法,在政治语言学视域下对普京政治话语中的政治文化观念进行深层次、多维度的动态剖析。本文三个研究问题之间层层递进,逐步深入,具体如下:1.在微观层面上,普京政治话语借助何种语言表达手段实现政治文化观念的呈现与传递?政治文化观念具有怎样的主题分类?2.在宏观层面上,普京政治话语实践中体现的政治文化观念有何特征?其深层释义具有何种动态演化?最终生成怎样的政治文化观念系统,其意义建构如何?3.普京政治话语中政治文化观念系统建构何种政治现实,传递何种价值观?政治文化观念系统建构与演化研究背后体现出怎样的权力与意识形态演化?为解决本文研究问题,我们根据文化观念理论、费尔克劳批评话语分析方法以及政治语言学研究方法建立本研究分析框架,分别从文本、话语实践以及社会实践三个维度对普京政治话语中的政治文化观念进行描写性与解释性的演化研究,具体得出以下结论:第一、在微观层面的文本分析维度,政治文化观念具有动态性,每一历时阶段都展示出不同的政治和文化属性,呈现出动态的变化趋势,不同主题分类的政治文化观念在不同的历时时期都具有十分重要的研究价值。分析得出结论:国家治理的分期与政治文化观念系统的分期存在潜在的联系,受到政治文化观念的内在驱动,普京政治话语中政治文化观念的历时演化经历了从初步到成熟,从零散到系统的发展历程,呈现出由内而外-内外并重-由外而内动态“回归”的历时发展轨迹。普京政治话语中的政治文化观念研究载体分为语言载体和言语载体,其中语言载体从不变性与可变性入手,主要包括旧的政治文化观念词淡出,旧的政治文化观念词新用以及政治文化观念新词的产生和年度政治词汇的使用。言语载体从言语化分析入手,主要表现为政治交际方面的研究。此外本研究发现,普京政治话语借助政治文化观念的周期变化、文化因素和语义元素三方面的语言表征类型实现政治文化观念的动态呈现。第二、在宏观层面的话语实践维度,通过语料库的话语实践分析,本研究发现,普京政治话语中政治文化观念的话语实践特征主要体现为空间性、过程性、恒定性、普遍性、发展性与动态性,具体呈现为心理、属性、状态、行为、目标、范围、时间、空间以及方式等方面。普京政治话语中政治文化观念的深层释义主要围绕“爱国主义”、“民族主义”以及“强国主义”展开,重点论述核心政治文化观念“强国主义”的动态演化。政治文化观念研究的核心在于人,主要探讨人-语言-政治世界的主体间对话关系,而从政治交际的角度则体现为发话人、政治文本/政治话语、受话人之间的主体间对话关系。不同时期的政治文化观念、政治话语与意义是三维互动的共变关系,呈现为不同时期执政理念的变迁。政治文化观念与政治话语不是简单的映现关系,而是一种实现意义的互动关系。政治文化观念作为政治话语的系统构成,并以政治话语为载体经历由深层到表层、由潜在到显现、由不可见到可见,由非言语化到言语化的动态过程:政治文化观念——政治话语或政治文本（内部言语——外化——外部言语——观念词载体）——政治语言世界图景。第三、在社会实践维度上,明晰普京政治话语中政治文化观念系统建构与演化研究反映出的执政理念变迁以及权力与意识形态演化。研究发现:政治文化观念动态演化经历了从萌芽到深入再到巅峰最后转向回归的动态发展轨迹,呈现为“形成崛起”时期——“稳定发展”时期——“普京思想延续”时期——“缓慢发展”时期——“保守回归”时期,具体表现为政治文化观念“强国”——“民生”——“民族价值观”——“普京主义时期”的继承与延续——“梅普思维”时期的新发展与新举措——“爱国团结”——“发展”——“保守”的转变,同时也印证了政治文化观念主题分类在具体政治话语中的实践,在此基础上归纳总结出政治文化观念系统建构与演化研究的政策启示和借鉴。

杨淞淳^[2]（2021）在《中文电子病历文本检索关键技术研究》文中提出随着信息技术的不断进步,医院信息化建设取得了突飞猛进的发展。电子病历（Electronic Medical Record,EMR）以电子化方式记录了患者在医院就诊时产生的全部医疗记录,是患者诊治信息的核心内容,具有举足轻重的作用,在国内外得到广泛应用。随着医院诊疗活动的开展,电子病历系统存储数据量也与日俱增,海量的存储数据一方面为医护人员提供了全面的信息,另一方面也给迅速准确获取特定信息带来了很大障碍。基于上述情况,信息检索（Information Retrieval,IR）技术中的文本检索技术（Text Retrieval,TR）被引入到电子病历系统中。通过文本检索技术,医护人员可以迅速在海量患者数据信息中定位到自己所需的信息,进而提高医疗服务的效率和质量,同时为临床科研提供助力。。然而,由于中文电子病历特有的语言特点和结构特点,常规的文本检索算法在中文电子病历检索方面准确性欠佳,还有很大改进空间。具体而言,主要存在如下问题:（1）为了提高电子病历文本检索结果的全面性,检索扩展算法（Query Expansion,QE）被引入到电子病历检索系统中。通过在原始结果中添加与查询语句相关的扩展词,可以获得更加全面的结果,显着提高电子病历文本检索的召回率,满足用户的检索需求。但是,已有的检索扩展算法抽取的检索扩展词中可能存在着无关词语,其权重也存在着不合理之处,造成检索漂移现象,即检索扩展算法带来大量无关的检索结果,进而造成检索准确率的严重下降。（2）大多数检索扩展算法的相关研究将扩展词和对应权重直接添加到原始查询语句中,并采用传统的检索算法计算电子病历文档的检索得分。这个过程只侧重于查询语句的重构,忽视了检索过程的优化。测试表明,即便是采用高质量的检索扩展词和权重,仍然存在着一定程度的检索漂移现象。（3）检索结果排序是检索算法的一个重要步骤,而大多数已有的电子病历检索排序算法只基于文档中的词频计算电子病历文档的检索分数,没有充分考虑到中文电子病历多字段和否定含义较多的结构和语言特点,使得基于词语匹配的算法可能检索到与用户检索本意无关的电子病历文档,影响检索的准确率和召回率。为了优化中文电子病历文本检索算法,本文基于中文电子病历的语言和结构特点,结合检索临床需求,对中文电子病历文本检索中的关键技术进行了深入研究,提出了基于知识图谱的扩展词选择和权重赋值算法、检索扩展算法及检索排序算法,并基于优化后的检索算法设计实现了一个中文电子病历文本检索系统。测试结果表明,上述检索算法在准确性和全面性方面均有显着提高,为有效发掘利用电子病历的临床诊疗和科研价值提供了工具支持。本文的主要研究成果如下:1.为改进检索扩展词和对应权重的质量,提升检索扩展的准确率和召回率,提出并设计了一种基于中文医学知识图谱和标准术语集的检索扩展词抽取和权重赋值算法。算法首先对常用的自然语言表示模型进行选择和测试,选取最合适的模型进行电子病历文本的语义相似度计算;然后从中文医学知识图谱和标准术语集中抽取同义词和上下位词作为扩展词;最后基于语义相似度、共现频率和类别权重完成扩展词权重的计算。测试表明,与基于共现频率的算法、基于分数方程的算法、基于余弦相似度的算法、基于Kullback-Leibler散度的算法及基于概念的算法等5种业界常用的基准算法相比,本文算法的前10准确率至少提升了9.38%,前30召回率至少提升了55.22%,在显着提高检索结果全面性的同时,也在一定程度上提升了检索结果的准确性。2.为进一步减少检索扩展中查询漂移带来的影响,设计了一种基于检索分数调整和二次排序的检索扩展算法。算法对扩展词对应的检索分数进行约束,同时选取疾病、症状、治疗过程和药物术语进行二次排序效果测试,采用各种组合策略测试不同术语的二次排序表现,选取最优组合。根据测试结果,从检索结果排序靠前的文档中,抽取治疗过程术语和药物术语计算二次排序分数,并结合调整后的检索分数和二次排序分数计算最终检索分数。测试表明,算法相比于基准算法,前10准确率至少提升了40%,前30召回率至少提升了24.8%,前30平均正确率均值（Mean Average Precision,MAP）至少提升了19.8%。3.在上述改进算法基础上,为进一步提高检索的准确率,设计了一种基于字段权重和否定关系检测的检索排序算法。算法在改进的检索扩展算法基础上,在检索分数计算中引入了中文电子病历的字段权重和文档中的否定关系。测试表明,检索排序算法在设计的检索扩展算法的基础上,前10准确率提升了10.2%,前30召回率提升了32.1%,前30MAP提升了45.0%,提升了检索结果的临床意义。4.开发了基于改进检索算法的中文电子病历文本检索系统。检索系统首先基于Postgre SQL数据库及Python中Count Vectorizer和lil＿matrix模块设计数据索引模块,同时基于改进的检索算法设计全文检索模块和高级检索模块,并基于用户的检索行为和检索需求设计检索提示模块和错误纠正模块,增加检索系统的智能化程度,提升用户的使用体验。本研究完成了中文电子病历文本检索部分关键技术的研究,基于文本检索的临床需求和中文电子病历文档的语言和结构特点,对检索扩展词选择及权重赋值算法、检索扩展算法和检索排序算法进行优化改进,并基于改进的算法构建检索系统。相比于传统的检索算法,本研究设计的算法显着降低了查询漂移带来的影响,提高了检索结果的准确性和全面性;构建的检索系统基于临床需求向用户提供了多元化的功能,进而为开展临床诊疗和临床科研工作提供了更为便利的工具。

金海^[3]（2021）在《基于否定关键词和语义处理的空间关键词查询研究》文中研究指明随着多媒体网络和GPS全球定位服务系统的发展和相关应用普及,海量且多维度的数据呈现爆发式的增长,包括大量带有关键词属性的空间文本对象数据。目前主要通过空间数据库查询处理技术对这些数据进行分析处理,其中最重要的核心问题就是空间关键词查询技术,它能够利用兴趣点本身的空间属性与文本属性并综合考虑他们与查询之间的相关性,快速返回给用户满足查询需求的兴趣点。现有的空间关键词查询技术主要集中在经纬度坐标之间的距离计算以及精确的文本匹配,忽略了用户在查询当中排斥的关键词属性,且在此查询过程中仅仅依赖于文本之间的精确匹配,对于查询中文本信息与兴趣点信息不能完全匹配的查询,极有可能造成在一定区域内没有返回结果的情况。对此,本文的具体工作如下:（1）针对查询中忽略了用户排斥属性的问题,本文提出了一种新的带否定关键词约束的查询模式。首先,采用Geohash字符串表示兴趣点对象,对字符串排序后插入B+树作为二叉树的叶节点,通过二叉树过滤带否定关键词的对象,构建了基于Geohash的混合索引结构BGIB-Tree。在此索引基础上,基于Geohash编码的递归性,设计了前缀匹配搜索算法,采用区域编码和对象编码前缀匹配的剪枝策略,使得无需进行距离计算通过字符串比对即可快速找到满足空间约束的对象,通过这些对象的id在倒排索引中双向搜索即可完成查询,从而能够有效处理用户在查询当中输入的否定关键词信息。将此算法与R树法相比,准确率提高了29%。（2）针对一词多义现象或者用户输入错误易导致不能返回给用户最精确的查询结果的问题。本文提出了结合空间、语义、文本三层结构的聚类混合索引树（GB2-Tree,Geohash Binary BC-IDistance Tree）。首先在空间维度使用降维算法使得剪枝效果达到最优,并且在语义层运用BC-i Distance索引将高维语义向量进行聚类,按照其主题分布距离即可快速准确地找到与查询语义相近的对象。将此算法与NIQ算法相比,平均查询效率提高了19.6%。

吴鹏^[4]（2021）在《多形态软件代码同源判定技术研究》文中认为近年来,以软件代码为载体的网络安全问题频频发生,软件代码同源判定作为解决网络攻击溯源等安全问题的共性关键技术变得尤为重要,准确定位软件代码来源已成为各方关注的焦点。由于当前软件代码具备运行平台多样、变形手段繁多、表现形式复杂等多形态特点,导致其同源判定极为困难。如何有效的发现多形态软件代码同源,对增强我国网络空间安全的防护力、威慑力至关重要。面向多形态软件代码的同源判定,首先需厘清软件代码同源的概念及边界,实现其定性定量描述;其次需关注软件代码同源特征表示及其处理效率,研究新方法解决其时空开销大的问题;再次需考虑软件代码同源特征损失的应对措施,探索新思路解决其表征困难的问题;最后需针对新形态软件易变形的特点,设计新算法解决其同源判定方法适应性不足的问题。本文围绕多形态软件代码同源判定问题,深入分析了相关领域的技术发展趋势及面临的主要挑战,重点研究了多种形态软件代码的同源判定方法,并基于此构建了原型系统。主要贡献如下:（1）针对大规模软件代码同源判定时空效率不高的问题,提出了基于Motif结构的软件代码同源快速判定方法,通过对大规模软件语义结构图的有效表征,实现了大规模软件代码同源的快速判定。提出了基于函数调用图Motif结构的特征表示方法以及Motif结构提取算法,实现了Motif结构对软件代码函数调用图的表征,并设计了Motif结构及其频率分布的相似度计算方法,实现了软件代码同源快速判定。实验结果表明,本文方法在准确率、鲁棒性及耗时等方面均有明显优势,使其可应用于大规模软件代码同源的快速判定。（2）针对软件代码变形导致同源特征难以表征的问题,提出了基于混合语义的二进制代码同源判定方法,通过对多形态二进制代码潜在同源特征挖掘,实现了多形态二进制代码同源的准确判定。提出了文本语义及结构语义混合的特征表示方法,实现了文本嵌入与图嵌入相结合的混合语义表达,设计了混合语义模型嵌入孪生神经网络框架的方法,实现了二进制代码同源判定模型构建。实验结果表明,本文方法有效提升了二进制代码同源判别效果,该算法在多种测试条件下具有良好的稳定性,可支持多种形态二进制软件代码同源的准确判定。（3）针对新形态软件代码同源判定方法适应性不足的问题,提出了多维度的移动应用同源判定方法,通过对移动应用分区域的特征表示与计算,实现同源移动应用的准确识别。提出了移动应用整体、资源及代码等多维度的特征表示及针对性的处理算法,实现了不同侧面的同源判定,设计了多种相似度算法的联合及优化策略,实现了移动应用同源的准确判定。实验结果表明,本文方法在同源判定准确率和速度等方面具有显着优势,并在真实环境中表现良好,且不依赖有监督数据,可作为移动应用市场安全策略的有效补充。

崔婉秋^[5]（2021）在《基于深度学习的社交网络跨媒体突发事件检测与搜索研究》文中研究说明随着社交网络的蓬勃发展,社交网络大数据以丰富的跨媒体形式呈现出巨大的增长趋势。由于发布的消息具有快速传播和广泛共享的特点,社交网络跨媒体大数据揭示了大量真实的社会现象,蕴含了海量有价值的突发事件。因此,为了满足大量用户和组织者对突发事件有效管理和形式分析的需求,针对社交网络展开突发事件检测与搜索的研究具有重要的价值和意义。然而,社交网络突发事件中消息的描述形式具有一定的随意性和语义稀疏性,跨媒体数据之间存在着特征空间异构等特点,使得在社交网络大数据中进行突发事件检测与搜索面临着极大的挑战。本文围绕社交网络突发事件检测与搜索问题,对基于社交网络多属性特征的突发事件语义获取与表达、基于深度语义哈希的社交网络突发事件语义分析以及基于多视角图注意力网络的社交网络跨媒体突发事件检测与搜索等关键理论与技术进行了研究。本文取得的主要研究成果如下:（1）针对社交网络跨媒体数据中信息稀疏以及现有方法没有充分挖掘数据之间的关联关系和扩展语义的问题,提出了基于社交网络多属性特征的突发事件语义获取与表达方法,包括基于社交与概念化扩展的短文本语义获取与表达算法（SCSE）和基于标签异构图模型的图像语义获取与表达算法（HHGM）。在短文本方面,SCSE算法基于外部知识库获取短文本显性语义,通过融合话题标签和链接信息等社交网络多属性特征构建社交与概念化语义图模型,挖掘短文本之间潜在的语义相关性。基于社交与概念化语义信息对短文本扩展,在一定程度上克服了突发事件文本数据的语义稀疏性,获取了短文本显隐性扩展的语义特征表示。在图像方面,HHGM算法通过在图像数据中引入话题标签,构建了异构的社交网络图模型,实现了对图像之间语义关联的分析。基于图卷积神经网络的邻居聚合特性,通过关联标签对图像语义进行补充和学习,获取了具有丰富语义表示的图像特征。实验结果表明,提出的SCSE与HHGM算法在社交网络短文本和图像语义的获取与表达中,能够有效地缓解社交网络多模态数据的稀疏性,具有较好的语义获取与表达性能。（2）针对现有的社交网络突发事件语义分析方法在深度语义特征学习和分析中很难克服自身的语义局限性,导致突发事件检测和搜索效果较差的问题,提出了基于双重语义扩展与深度哈希模型的短文本语义分析算法（SCSE-DH）,实现高效的突发事件检测和搜索。在提出的SCSE算法的基础上,建立了深度哈希模型,在双重语义扩展后的短文本中进行深度语义特征分析和学习,获得了社交网络短文本蕴意丰富、表示精炼的语义分析结果。基于堆栈式自编码器与语义哈希网络的联合训练学习,有效地捕获和压缩了短文本的内部语义,通过逐层降维保留了短文本的语义信息。基于深度语义哈希特征进行事件检测和搜索,取得了显着的效果。实验表明提出的SCSE-DH算法在短文本语义分析中以及在突发事件检测和搜索任务中的有效性。（3）针对现有的突发事件检测与搜索研究仅面向单一特征进行学习,导致重要信息缺失或对跨媒体信息无法有效融合的问题,提出了基于时间信息指导的多视角图注意力网络模型（T-MVGAN）。建立了社交网络突发事件的多视角模型,在文本、图像和时间因素三个方面对突发事件进行全面综合表示,实现了社交网络跨媒体突发事件特征之间的互补和关联。构建了社交网络跨媒体突发事件异构图模型,基于提出的HHGM算法获取图像语义特征,在文本异构图模型中,学习短文本的语义特征和时间分布特征。建立时间分布信息引导的多视角图注意力网络,将时间特征作为社交网络跨媒体数据之间的共识信息和关联桥梁,对文本和图像特征进行融合,获得了社交网络跨媒体突发事件的有效表示,实现了突发事件检测和搜索。实验表明,T-MVGAN模型能够获得社交网络跨媒体突发事件丰富的特征表示,具有较好的社交网络突发事件检测与搜索的性能。（4）综合提出的基于社交与概念化扩展的短文本语义获取与表达算法（SCSE）、基于标签异构图模型的图像语义获取与表达算法（HHGM）、基于双重语义扩展与深度哈希模型的短文本语义分析算法（SCSE-DH）与基于时间信息指导的多视角图注意力网络模型（T-MVGAN）,实现了基于深度学习的社交网络跨媒体突发事件检测与搜索系统,包含社交网络突发事件语义获取与表达模块、社交网络突发事件深度语义分析模块、跨媒体突发事件检测与搜索模块。该系统对本文提出的算法进行了性能的评估和结果展示。社交网络跨媒体突发事件检测与搜索模块分别针对突发事件检测与突发事件搜索两种任务,给出了指定时间段内发生的社交网络跨媒体突发事件的结果以及给定查询内容下的社交网络跨媒体突发事件的搜索结果。该系统验证了本文提出的算法的有效性。

戚园园^[6]（2021）在《基于特征表示学习的文本检索研究》文中认为文本检索是自然语言处理领域中的重要内容,也是大数据和人工智能时代的基础支撑技术。文本检索不但是人们从互联网大数据中获取所需信息的有效手段,也是开发其他智能系统,如问答对话系统的重要条件。判断一篇文档是否与用户查询相关是文本检索的核心问题。为了解决这一问题,文本检索模型通常将用户查询和候选文档映射到同一向量空间,继而计算它们之间的相关性。这便是文本检索的文本特征表示和相关性计算。文本特征表示有经典统计和机器学习两类方法。而查询与文档的相关性定义也有逻辑值和实数值两种。当相关性为逻辑值时,还需要利用专门的排序算法对所有相关文档进行排序。当相关性为实数值时,相关性本身便是对文档进行排序的依据。本文对上述问题进行了深入系统的研究,取得的主要创新性成果如下:1.提出一种基于显着上下特征表示的文本检索模型。采用滑动窗口的方法寻找文档中与查询具有显着语义相关性的上下文,利用这些上下文获得文档的显着上下文特征表示,从而更好解决长文档与查询间的匹配问题。新的文本特征表示中包含上下文信息,联合构建层次化的文本相关匹配,实验结果表明该模型同时提高了文本检索的精度和召回率。2.提出一种基于卷积图拓扑特征表示的文本检索模型。将查询和文档的上下文向量转换为图拓扑结构后,利用图卷积网络生成新的文本特征。此类文本特征表示不仅包含上下文信息,同时还包含全局结构化信息。实验结果表明该模型有效改善了文本检索精度。3.提出一种交互图拓扑特征表示的文本检索模型。结合双向注意力网络和图注意力网络将上下文向量表示转换为基于交互图拓扑特征的文本表示。此类文本特征表示不仅包含上下文信息,同时还包含交互信息和不同注意力加权后的全局结构化信息。实验结果验证了该模型的有效性。

程子轩^[7]（2021）在《面向用户知识需求的微信公众平台知识资源聚合及服务研究》文中研究说明移动互联网时代,微信公众平台已成为人们交流、休闲、学习、生活的一部分,随着以传播知识为主的微信公众号涌现,微信公众平台也逐渐成为人们获取知识的重要途径。一些综合性或专业领域微信公众号发布各类科普知识和前沿资讯,一些学术类微信公众号专业发布学术领域内相关的学术知识,部分高校学报和高校图书馆微信公众号还专门开设“学术播报”、“学术快讯”等专栏,用于发布学术讲座及学术前沿知识。各类机构或个人通过微信公众平台发布大量科普型知识、专业发展前沿资讯、专业学术知识以及学术专题等,能够满足不同专业和认知层面的用户知识内容的需求。然而,微信公众平台知识内容以用户生成为主,其庞大纷杂的微信公众平台账号主体导致了平台信息和知识质量的参差不齐、出现信息过载和迷航现象,对海量知识资源缺乏科学高效的组织和管理。当前,随着大数据、人工智能等技术的发展,简单提供知识资源内容已经无法满足微信公众平台用户知识服务需求。智能时代,用户对知识质量和知识服务模式提出了更高的要求,促使微信公众平台知识组织和服务转型。如何在海量纷杂的信息中筛选出真正需要和感兴趣的知识资源内容不仅是广大微信用户面临的困扰,更是微信公众平台需要关注并急需解决的问题。鉴于此,本文将知识聚合理论与方法引入到微信公众平台知识资源组织及服务研究中,提出了面向用户知识需求的微信公众平台知识聚合及服务体系框架。首先,构建了微信公众平台用户画像并对用户知识需求进行了分析,从知识单元和句子层面分别提出了基于标签聚类和基于摘要生成的微信知识资源聚合方法,并基于不同知识资源聚合方法设计了微信公众平台知识推荐服务和知识集成服务两种知识服务模式。最后提出了提升微信公众平台知识聚合及服务能力的对策建议。本文主要开展了以下方面的研究:（1）面向用户知识需求的微信公众平台知识聚合及服务体系框架构建。通过辨析知识聚合服务与用户知识需求之间的关系,明确了微信公众平台面向用户需求开展知识聚合的必要性和可行性。阐述了微信公众平台知识聚合概念、目标与原则以及聚合服务要素,认为微信公众平台知识聚合是为了满足用户个性化知识需求,通过计量分析、数理统计、数据挖掘、人工智能等方法分析挖掘知识单元的内在联系,将微信公众平台复杂多样化、数量庞大、无序碎片的领域知识资源重新组织和序化,形成结构完善的知识体系,为后续微信公众平台知识聚合服务提供资源保障。通过分析面向用户需求的微信公众平台知识聚合服务组成要素、动因及过程,提出了面向用户需求的微信公众平台知识聚合服务体系架构,将其划分为数据资源层、用户需求挖掘层、知识资源聚合层、服务提供层4个主要模块。（2）微信公众平台用户画像构建与需求分析。基于VALS2模型从宏观层面对微信公众平台使用者构建群体用户画像,将用户划分为初期引入参与型、成长型和成熟型用户3类,并绘制各类用户特征的标签词云。分析不同类型的用户知识需求形成的过程,并建立微信公众平台用户知识需求层次模型。综合用户画像和用户知识需求层次构建了微信公众平台用户知识服务需求模型,凸显微信公众平台知识服务现状与用户知识需求的巨大差距。（3）基于标签聚类的微信公众平台知识聚合方法。提出融合Word2vec模型和TextRank算法的微信公众平台知识资源标签抽取方法,将关键词作为标签表达文本知识资源内容的主题思想及关键内容。提出基于改进BIRCH聚类算法的微信公众平台文本标签聚类方法,在原算法执行过程中融合K-means算法初选聚类中心,并综合考虑用户需求因素。最后以微信公众平台发布的“认知计算”领域文章为例进行实证研究,研究发现本文提出的基于改进Birch算法的聚类结果主题分布较为合理,各个类之间的区分度较为明显,类簇大小的差距较小,其效果要优于基于K-means算法、基于Spectral Clustering算法和基于Birch算法的聚合效果。（4）基于摘要生成的微信公众平台知识聚合方法。提出基于改进TextRank算法的微信公众平台知识摘要生成方法,分别设计了单文本摘要生成和单领域多文本的知识摘要生成方法。在单文本摘要生成方面,通过综合考虑用户需求、句子位置、标题相似度等因素提高摘要生成效果。在单领域多文本摘要生成方面,采用Doc2vec模型进行文本向量化,对文档集中的句子进行主题细分,并运用MMR算法进行句子冗余处理,提高生成结果的准确性。以微信公众平台发布的“认知计算”领域文章为例进行实证研究,研究发现运用本文方法生成的文本摘要能够较好的匹配用户需求,能够实现面向用户需求的个性化抽取和生成,准确率明显优于其他算法。且本文算法生成的摘要,具有较好的语意连贯性,便于读者的理解和进一步掌握文章主旨大意。（5）基于知识聚合的微信公众平台创新知识服务模式。以微信公众平台知识聚合及服务体系框架为基础,针对不同层面的知识聚合,构建了基于知识标签聚类的微信公众平台知识推荐服务和基于摘要生成的微信公众平台知识集成服务两种服务模式。分别阐述了两种知识服务的概念、知识服务要素和知识服务过程。（6）微信公众平台知识聚合及服务能力提升对策。分别从用户知识需求外化表达及挖掘、新技术应用和融合改进和微信公众平台创新服务理念及加强运营管理三个方面提出提升微信公众平台知识聚合及服务能力的对策建议。本文从理论层面将知识聚合理论和方法引入到微信公众平台,解决其知识组织和服务问题,扩展了知识聚合相关研究的领域和视角。同时,本文对微信公众号发布的知识内容进行知识主题聚类和自动化摘要生成,并建立了相应的知识聚合服务体系,丰富了社交媒体平台创新知识服务理论体系,为新媒体知识服务提供理论和技术支持。在实践层面,本文面向微信公众平台中不同微信公众号发布资源内容的知识聚合,分别进行了知识主题发现和自动生成摘要知识聚合技术实证,为微信公众平台知识资源组织管理提供了技术方法和手段。同时,提出的对策建议和服务模式也为微信公众平台开展创新型知识服务提供参考依据和建议。

张佳奇^[8]（2021）在《互联网语境下的群域话语研究》文中研究表明本文全面考察依托于技术媒介的社会结构和组织形式中的群体话语交互状况,论证群域话语概念,尝试建构群域话语分析框架,揭示互联网时代人际交流的一些新特征,探索分析群域话语与以往个人交谈、公众性交流不同的特点和话语篇章的组织规律,探究立场建构与话语协商的句法及语用特征。全文共分八章,具体内容如下:第一章“绪论”,主要交代本文的选题缘起及研究的主要问题,从理论意义和现实应用两个方面概括选题研究的价值及意义;梳理了网络语言研究、当代话语分析理论、互动社会语言学理论的相关研究现状,并就本文的理论背景及依据进行了交代;论述社会符号学理论和功能语篇分析的基本观点及理论主张,梳理主要的研究成果;在此基础上,阐释本文的理论架构和研究方法;最后,对文中的语料来源及标注符号进行说明。第二章“新媒体群域类型与群域话语的功能层次”,本章基于网络群体交流的研究对象及社会网络关系的分布情况,建立“群域”概念,并就相关问题展开了讨论。群域话语的生成过程中,计算机网络媒介不只是信息传递的渠道和载体,其本身的技术导航及功能设置对信息交互模式的引导和人际互动方式有重要的影响。新媒体群域中的话语交互由情景语境的触发产生,群域情景语境和话语意义之间存在一个属于话语参与者的“认知中介”,情景语境的虚拟和现实融合程度与“话语基调”中成员间的“相熟度”共变,并决定“个体化”的允准程度,决定“供用特征”的潜在语义是否被触发。虚拟性明显则个体化允准程度高,倾向于显示易于辨识的个人风格。现实性明显则个体化允准程度低,话语组织受现实身份的制约,更倾向遵守现实语境的交际语用规则。本章结合系统功能语言学、当代话语分析理论尝试提出群域系统功能分析框架,揭示依托于技术媒介的群体话语交互情况,并提出其在语法、语用维度可探索的空间。第三章“群域话语的话轮及序列”,本章主要讨论了群域话语的基本单位“话轮”以及话语组织单位“序列”的概念界定及类型特点,并将群域话轮、序列与传统口语交际进行差异对比。本章将“群域话轮”定义为:包括多模态符号和媒介功能形式的上传一次所显示的内容。将“群域话轮”分为文本话轮、多模态话轮和界面功能话轮。结合群域交际中存在的一些独立的、可描述的普遍话语行为惯例作重点观察,将依照惯例进行组构的话语行为过程视为“序列”,并对“问答”“追补”“修补”“重复”四种主要话语行为序列进行语料观察和论述,从而探究群域话轮和序列特点。群域话轮特点体现在四个方面:模态种类及模态组合的复杂表义情况;话轮呈现出不完整的会话结构;话轮很多情景中为非自然序列;在句法选择上,有明显的场景适应性。口语交际与群域交际中的话轮在性质、范畴和句法特征方面存在明显的不同。传统交际和群域交际中序列的差异主要则体现在序列的“邻接性”关系方面。第四章“群域话语的语篇型式及特征”,本章吸收功能语篇分析的理论与方法,探究群域话语分析系统“表达层”的语篇型式,对三种主要群域话语类型的篇章进行考察和描写,并进一步概括其篇章结构的影响因素。我们立足于描写和解释篇章的生成过程,借鉴社会网络分析的理论及方法,将话语文本的考察与主体的社会行为结合起来,探索群域交际中的网络结构特征,观察话语如何参与和改变社会行为、活动,在此基础上进一步探究群域话语模式的语篇规律。基于议程设置蕴含媒介预设的元功能的认识,本章吸收“Ge M模型”对三种群域的议程设置进行建模。这种“元认知”提供了一种语义上的衔接结构,这一“衔接结构”在群体交际中是公众在篇章层面理解、认同的基础,是语篇内部元素之间建立语义关系的参考和连贯的规则。研究表明:即时通信类群是“关系衔接”篇章,以人际为基础展开语篇的互动。信息交互类群为“话题衔接”篇章,呈现子话题分层现象。视频直播类群为“内容衔接”篇章,随着内容的推进,相应的评价话语产生,在语义层面发生篇章衔接。第五章“群域话语的立场建构与人际互动”,着眼于不同类型群域话语系统内部,考察具体语篇中立场构建和交际互动的若干语义、语用现象。重点对新闻事件涉及的群域评价中各方立场建构、意见协商所采用的语言手段进行探讨。重点吸收互动语言学范式的相关理论对群域立场建构和人际互动问题进行探究。我们结合典型个案从动态视角对群域中互动语篇中的立场表达情况进行观察研讨,主要着眼于典型的微博新闻“评论区域”、微信朋友圈、群体互动的留言区三个重点交互场景开展研究。本章概括了群域信息发布话语立场表达的主要句法、语用策略,总结了微信朋友圈的信息发布的语用规则及人际语用功能。具体来看,朋友圈中的“认同”是在复杂的线上交互中通过建构增加或强化“自我属性”的动态过程,网络平台为个人自我构建社会认同提供重要语境条件。本章由观察“否定”和“肯定”的情感立场表达策略,进一步探究留言区群体交互的立场类型及语用效果。第六章“群域话语的修辞伦理和语用规约”,本章基于修辞学和语用学的关联,探讨修辞伦理和语用原则的关系如何。本章就群域话语交际中的修辞伦理问题进行类型概括,并探讨相应类型的生成动因与监管的伦理对策,进一步提出与群域交际相适应的“伦理规范”,为下一步网络群域话语语情研究提供新的视角。第七章“群域话语研究的理论意义及现实应用”,本章从理论意义和现实应用两个方面具体探讨群域话语研究的价值。理论意义方面,主要从新媒体话语的系统构建、多模态修辞学及网络语用学理论的系统构建、“网络民族志”的理论探索三大方面讨论研究的理论意义。现实应用方面,主要体现在三个方面:为舆情管控与语情引导提供预测和监督方法;有利于推进网络多模态语料库的构建;有利于推进社会化网络服务的建设。第八章“结论”,总结了全文的主要结论并陈述研究的不足及未来研究展望。主要结论包括:群域话语功能分析框架的提出;“相熟度”与情景语境的共变关系;群域话轮的界定及与传统话轮的差异问题;群域语篇型式的概括;群域立场表达的句法、语用策略问题;修辞伦理和语用规约的协同标准;对比了群域话语与以往个人交谈、公众性交流不同的特征和话语篇章的组织规律。在后续研究中将进一步深化对相关理论的研究,扩展语料观察的规模。进一步关注新兴话语形式和范畴的对应规律、主要语篇型式在群域中的句法功能表现,深入探究“个体化”如何在群体中“汇流”“演化”等问题。

王文诗^[9]（2020）在《基于内容的视频信息智能搜索算法研究》文中提出为了在大量的视频数据中有效和准确的搜索到用户感兴趣的信息,对基于内容的视频信息智能搜索算法进行了研究。一方面,基于内容的视频搜索算法已经成为研究的热点。它可以通过基于关键帧的语义概念检测的方法进行视频索引,从而实现查询和搜索。该方法可以搭建视频高层语义和底层特征之间的联系。另一方面,随着计算机技术的进步、人工智能技术的发展和数据的大量增加,采用深度学习方法直接对视频进行处理已经越来越受到关注。它可以提取视频的空间特征,同时保留时间信息。对视频信息智能搜索算法的研究主要包括镜头边界检测、关键帧提取、语义概念检测以及基于深度学习的视频搜索等算法。（1）针对镜头边界检测存在的冗余问题,提出了一种基于图像熵和局部关键点特征的镜头边界检测算法。镜头边界检测是关键帧提取和视频搜索的第一步,对信息索引、摘要和其他基于内容的视频数据处理来说非常重要。该方法首先利用图像熵检测视频渐变镜头和候选的突变镜头,然后利用候选的突变边界帧和它们的相邻帧之间的局部关键点特征的匹配率等技术去除冗余的候选突变边界,从而得到最终的突变边界。有效的镜头边界检测有助于提高关键帧提取等算法的性能。（2）针对关键帧提取算法特征选取单一而受视频类型多样性限制等问题,提出了一种加权的多特征的关键帧提取算法。该算法在每个检测镜头内,采用基于凸混合模型的多特征聚类算法自动地计算每个特征描述子对应的权值。这些权值用于计算视频帧间综合帧差测度,用于形成一个累积的帧差曲线。然后采用帧间曲线曲率检测算法检测曲线的高曲率点,位于两个高曲率点之间的中心帧被选择为关键帧。提取的关键帧对视频原始数据的充分表示有助于有效的信息搜索和快速浏览整个视频内容。（3）针对用户语义和底层特征之间的“鸿沟”问题,提出一种基于关键帧语义概念检测的视频索引和搜索算法。该算法首先采用优化的基于局部关键点特征的词袋模型进行视频图像表示。然后在语义概念检测部分,利用支持向量机方法构建有监督的分类器对提取的关键帧进行分类和语义概念检测。最后将查询关键词与视频摘要数据库中的语义概念进行映射,排列和返回与用户查询相关的镜头序列,其中镜头内被搜索到的关键帧数目越多,这个镜头被排列的优先权越大。（4）针对深度学习网络训练的复杂性和行为视频类型的多样性问题,在视频分类和搜索中提出了一种基于三维卷积神经网络模型的细调整算法。基于深度学习的方法可以直接对视频的时空特征进行处理。该算法首先通过三维卷积神经网络模型在UCF101视频数据集上预训练得到初始模型。然后初始模型在实验数据集上进一步训练,对已获得的模型参数进行微调,从而获得最终的模型。接着,由最终模型提取测试视频的空间特征和时间特征。在视频特征提取后,采用欧氏距离计算查询视频和测试视频之间的相似度。距离测度值越小,排列优先级越高。最终返回并排列搜索得到的视频实现视频搜索。研究工作一方面基于视频图像底层特征建立了一套视频搜索算法流程。该算法针对不同的数据类型具有可扩展性和鲁棒性等特点。它主要包括三个部分:镜头边界检测、关键帧提取和语义概念检测。另一方面,针对多样化的视频类型,构建了一个基于深度学习方法的视频搜索算法,并通过理论分析和实验验证展示了算法的有效性。基于深度学习的视频搜索算法可以使用单个神经网络模型实现视频时空特征提取和分类,并在使用视频空间特征的同时保留时间信息。综上,经过理论分析和实验验证,提出的算法可以有效的进行视频信息智能搜索等。

徐流畅^[10]（2020）在《预训练深度学习架构下的语义地址匹配与语义空间融合模型研究》文中研究说明随着我国数字城市与智慧城市建设的不断开展,地址信息作为战略性的基础地理信息及空间数据资源,在人们日常生活中的作用愈发重要,而且在国家的经济建设、文化发展和社会管理等多方面也起到相当关键的作用。在各行各业的基于位置服务的大数据应用需求驱动下,我国各相关部门采集和积累了海量异构的地址数据。然而由于我国地址规范标准不统一以及人工采集与管理秩序的混乱,导致地址信息的解析和理解成为一大难题,也极大地限制了其在各个领域内的应用。因此,有必要从认知地址文本信息和理解地址语义知识的角度出发以形成地址语义模型,让其深入挖掘地址信息的语义特征内涵并适用于计算机的高性能运算。此外,地址特有的寻址属性使得理解和融合其语义与空间信息具有重要的理论价值和实践意义,也是当前的学术热点。针对现有的地址模型研究中所存在的语义信息表达不完善、信息智能化应用不充分以及相关任务场景泛化性弱的困境,本文利用了深度神经网络中的注意力机制及“预训练-微调”模式,将地址语义理解、语义地址匹配和空间语义融合等关联度较大的任务转为可计算的深度神经网络模型的搭建和优化问题。针对地址文本语料的特性,采用自监督学习构建深度学习架构以形成地址语义模型来支持各地址相关任务。在此基础上,通过生成有监督的匹配数据集对模型进行微调,让模型针对性地识别地址间的语义相似性并实现高精度的地址匹配任务。同时考虑到地址特有的空间属性,设计了一套遵循空间相似度规则的数据集并通过对地址语义模型的微调将空间距离与地址语义进行深度关联融合。本研究系统性地构建了语义认知理解-地址高效精确匹配-空间语义深度融合-下游应用任务验证评价的中文地址理论体系和方法架构,以百万量级的位于浙江省杭州市上城区的地址语料库为实验数据对设计的方法架构进行测试、验证和应用。本文的研究内容概况如下:（1）构建了一套以广义的自回归预训练方法为核心的深度神经网络结构下的地址语义模型来实现地址语义信息的自动获取,并将“预训练-微调”模式引入地址研究中。考虑到地址中每个字符间的相互影响和双向上下文语序关系,提出了一套以排列组合式未知字符预测为目标的地址语义模型,并利用目标位置感知的双轨自注意力结构解决建模中的目标位置信息缺失问题,最终设计了具有自学习能力并且能够提供各相关应用迁移学习能力的新型深度神经网络。实验结果表明其实现了海量多源异构地址数据集的语义信息理解和表征,为基于该模型的后续应用任务研究的优秀表现夯实了基础。（2）设计并实现了基于地址语义模型微调后的语义地址匹配建模方法。受文本蕴含及文本复述理论启发,以空间位置信息为推理条件构建带标签的有监督地址对数据集,建立了一种用于有效地址匹配任务的深度神经网络架构和训练框架。以构建的语义地址匹配数据集为对象开展实验,其结果证明了该工作能有效地解决地址匹配中存在的冗余,不完整或异常表达等情况,具有“高精度轻流程”的表现。证明了所设计模型可在弱监督训练数据下维持高水准表现。论证了“先自监督预训练-后有监督微调”的两阶段范式能极大地提高任务的准确率和有效性。（3）提出了新颖的地址语义-空间深度融合理论设计,对地址的语义-空间特征研究实现了从过去的“物理结合”到本研究中的“深度融合”的转变。构建了将空间位置信息与地址语义信息相融合的训练数据集,并在地址语义模型的基础上,通过对回归任务的微调训练搭建了语义-空间融合模型。实现了可被计算机理解的包含地址特有的寻址属性的地址表征,并设置了地址空间位置预测的下游任务以评价深度融合效果。该实验数据为地址语料及其对应的空间坐标,实验结果表明本研究设计的模型在该下游任务中相比前人的模型总有最佳表现,极大地提高了空间位置预测任务的精度。证明了所设计模型能够深度融合地址的语义和空间信息,并支持地址数据空间关联的应用任务。本研究在地址信息智能化、结构化和数值化方面,实现了其理论与建模方法上的创新及突破,解决了由大数据驱动下的地址数据质量低下及数量泛滥问题,提高了地址信息解析和挖掘的操作效率以及迁移学习能力,以推动关于城市地址模型的研究,促进智慧城市空间信息建设和大众化服务体系方法的研究与发展。

二、基于概念空间的文本语义索引（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于概念空间的文本语义索引（论文提纲范文）

（1）“普京政治话语”中政治文化观念的系统建构与演化研究（2000-2020）（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 研究背景与选题理论依据

1.1.1 研究背景

1.1.2 选题理论依据

1.2 研究目标

1.3 研究意义

1.3.1 研究的理论意义

1.3.2 研究的实用价值

1.3.3 研究发展趋势

1.4 论文结构

第二章文献综述

2.1 政治话语研究

2.1.1 政治话语界定

2.1.2 政治话语的研究及应用

2.2 普京政治话语研究

2.2.1 普京政治话语界定及其特征

2.2.2 普京政治话语的研究及应用

2.3 政治文化观念研究

2.3.1 政治文化观念界定

2.3.2 政治文化观念分类标准

2.3.3 政治文化观念的研究及应用

2.4 政治文化观念系统研究

2.4.1 政治文化观念系统界定

2.4.2 政治文化观念系统建构

2.5 本章小结

第三章理论基础

3.1 政治文化观念研究的理论基础

3.1.1 基于语言文化学的文化观念理论

3.1.2 基于政治语言学的政治文化观念理论

3.2 政治文化观念研究的具体路径

3.2.1 批评话语分析

3.2.2 历时观念分析

3.2.3 基于语料库分析的政治文化观念动态呈现

3.3 政治文化观念动态分析模式

3.3.1 主体间对话关系:阐释

3.3.2 言语化过程:建构

3.3.3 政治语言世界图景:解读

3.4 本章小结

第四章研究设计

4.1 研究问题

4.2 研究分析框架

4.3 研究方法

4.4 普京政治话语语料库

4.4.1 语料的描述

4.4.2 语料库分析工具

4.4.3 语料预处理方法

4.4.4 语料库的建立

4.5 本章小结

第五章普京政治话语中政治文化观念的文本分析

5.1 普京政治话语中政治文化观念主题分类

5.1.1 政治文化观念——政治类

5.1.2 政治文化观念——经济类

5.1.3 政治文化观念——社会类

5.1.4 政治文化观念——民族类

5.1.5 政治文化观念——军事类

5.1.6 政治文化观念——文化类

5.2 普京政治话语中政治文化观念载体

5.2.1 语言载体:不变性与可变性

5.2.2 言语载体:言语化分析

5.3 普京政治话语中政治文化观念语言表征类型

5.3.1 政治文化观念周期变化

5.3.2 政治文化观念文化因素

5.3.3 政治文化观念语义元素

5.4 本章小结

第六章普京政治话语中政治文化观念的话语实践分析

6.1 普京政治话语中政治文化观念话语实践特征

6.1.1 政治文化观念主题话语实践分析(2000-2004)

6.1.2 政治文化观念主题话语实践分析(2004-2008)

6.1.3 政治文化观念主题话语实践分析(2008-2012)

6.1.4 政治文化观念主题话语实践分析(2012-2018)

6.1.5 政治文化观念主题话语实践分析(2018-2020)

6.2 普京政治话语中政治文化观念深层释义

6.2.1 政治文化观念“爱国主义”(патриотизм)深层释义

6.2.2 政治文化观念“民族主义”(национализм)深层释义

6.2.3 政治文化观念“强国主义”(державничество)深层释义

6.3 普京政治话语中政治文化观念系统的意义建构

6.3.1 意义建构功能

6.3.2 对话关系实践的意义互动

6.4 本章小结

第七章普京政治话语中政治文化观念的社会实践分析

7.1 执政理念变迁

7.1.1 形成和崛起时期(2000-2004)

7.1.2 稳定发展时期(2004-2008)

7.1.3 普京思想延续时期(2008-2012)

7.1.4 缓慢发展时期(2012-2018)

7.1.5 保守回归时期(2018-2020)

7.2 权力与意识形态演化

7.2.1 执政理念对比

7.2.2 社会民意调查

7.2.3 内在文化因素

7.3 政治文化观念系统建构与演化研究的政策启示

7.4 本章小结

第八章结论

8.1 本研究的结论

8.2 本研究的启示

8.3 本研究的局限和展望

参考文献

致谢

在读期间学术成果

（2）中文电子病历文本检索关键技术研究（论文提纲范文）

摘要

Abstract

前言

第一章基于知识图谱和标准术语集的检索扩展词抽取和权重赋值算法

1.1 引言

1.2 语言模型训练

1.2.1 训练集构建

1.2.2 模型选择和训练

1.3 检索扩展词选择

1.3.1 扩展词来源选择

1.3.2 扩展词抽取

1.3.3 语义相似度计算

1.3.4 无关扩展词移除

1.4 扩展词权重赋值

1.4.1 扩展词类别权重赋值

1.4.2 共现频率计算

1.4.3 扩展词权重计算

1.5 结果与讨论

1.5.1 数据集和评价指标

1.5.2 基准算法

1.5.3 测试结果

1.5.4 讨论

1.6 小结

第二章基于检索分数调整和二次排序的检索扩展算法

2.1 引言

2.2 检索分数调整

2.2.1 调整方案设计

2.2.2 基于调整方案的检索扩展算法

2.3 二次排序

2.4 结果与讨论

2.4.1 测试结果

2.4.2 讨论

2.5 小结

第三章基于电子病历字段权重和否定关系检测的检索排序算法

3.1 引言

3.2 字段权重赋值

3.3 否定关系检测

3.4 检索排序算法设计

3.5 结果与讨论

3.5.1 测试结果

3.5.2 讨论

3.6 小结

第四章基于改进检索算法的中文电子病历文本检索系统实现

4.1 引言

4.2 功能需求分析

4.3 功能技术实现

4.3.1 数据索引模块设计

4.3.2 全文检索模块设计

4.3.3 高级检索模块设计

4.3.4 检索提示模块设计

4.3.5 错误纠正模块设计

4.4 模块展示

4.4.1 数据索引模块展示

4.4.2 全文检索模块展示

4.4.3 高级检索模块展示

4.4.4 检索提示模块展示

4.4.5 错误纠正模块展示

4.5 小结

第五章结论与展望

参考文献

附录 A 语言模型训练集中医学教科书清单

附录 B 语言模型相似度测试词语详细信息

附录 C 扩展词类别权重第一轮调查问卷

附录 D 扩展词类别权重第二轮调查问卷

附录 E 电子病历字段权重第一轮调查问卷

附录 F 电子病历字段权重第二轮调查问卷

附录 G 问卷调查及检索结果评价专家名单

作者在学期间取得的学术成果

主要简历

致谢

（3）基于否定关键词和语义处理的空间关键词查询研究（论文提纲范文）

摘要

ABSTRACT

第1章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 文章主要工作

1.4 文章组织结构

第2章空间关键词查询相关理论与技术

2.1 空间关键词查询概述

2.1.1 空间数据建模类型

2.1.2 SKQ问题定义

2.1.3 SKQ查询问题分类

2.2 空间索引关键技术

2.2.1 基于数据划分类型的索引R-Tree

2.2.2 基于R树与倒排文件结合的索引结构IR-Tree

2.2.3 基于R树与签名文件结合的索引结构IR2-Tree

2.3 文本索引关键技术

2.3.1 倒排索引

2.3.2 签名文件

2.4 二维经纬度坐标处理方式对比

2.4.1 空间填充曲线对比分析

2.4.2 Geohash算法原理分析

2.4.3 Geohash与传统索引对比分析

2.5 本章小结

第3章结合否定关键词的空间关键词查询

3.1 基于否定关键词的一维混合空间结构设计

3.1.1 问题及解决思路

3.1.2 问题的形式化描述

3.1.3 混合索引结构设计

3.2 前缀匹配查询算法

3.2.1 算法详述

3.2.2 算法分析

3.3 实验结果与分析

3.3.1 实验环境设置

3.3.2 实验结果与分析

3.4 本章小结

第4章基于语义聚类的空间关键词查询

4.1 问题及解决思路

4.2 BC-IDISTANCE

4.3 问题的相关定义

4.4 GB~2-TREE混合语义索引结构设计

4.5 基于GB~2-TREE的模糊语义查询算法

4.5.1 主题概率模型

4.5.2 结合语义的查询算法

4.6 实验结果与分析

4.6.1 实验相关设定

4.6.2 实验结果与分析

4.7 本章小结

第5章总结与展望

5.1 总结

5.2 展望

参考文献

攻读学位期间取得的研究成果

致谢

（4）多形态软件代码同源判定技术研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景与意义

1.2 研究现状

1.2.1 软件代码同源判定研究

1.2.2 软件代码相似度研究

1.2.3 软件代码抄袭及克隆研究

1.3 研究面临的挑战

1.4 研究内容及创新

1.4.1 论文研究内容

1.4.2 论文主要创新

1.5 论文组织结构

第2章软件代码同源理论模型

2.1 软件代码同源定义

2.2 软件代码同源模型

2.3 软件代码同源特征模型

2.4 软件代码相似度度量模型

2.5 软件代码同源判别模型

2.6 本章小结

第3章基于Motif结构的大规模软件代码同源快速判定方法

3.1 引言

3.2 方法框架描述

3.2.1 总体框架

3.2.2 软件Motif结构及频率分布

3.3 基于软件Motif结构的同源判定算法

3.3.1 函数调用图构建

3.3.2 Motif结构构建

3.3.3 软件代码同源判定

3.4 实验评估

3.4.1 实验数据集

3.4.2 源代码同源实验

3.4.3 可执行代码同源实验

3.4.4 混淆代码同源判定实验

3.4.5 方法对比实验

3.5 本章小结

第4章基于混合语义的二进制代码同源判定方法

4.1 引言

4.2 方法框架描述

4.2.1 总体框架

4.2.2 语义结构图表征

4.3 混合语义的同源判定算法

4.3.1 文本语义表征

4.3.2 结构语义表征

4.3.3 端到端孪生网络模型

4.4 实验评估

4.4.1 实验数据集

4.4.2 同源二进制代码实验

4.4.3 不同源二进制代码实验

4.4.4 恶意软件家族实验

4.4.5 方法对比实验

4.5 本章小结

第5章基于多维相似度的移动应用同源判定方法

5.1 引言

5.2 方法框架描述

5.2.1 总体框架

5.2.2 联合策略原理

5.3 多维相似度判定算法

5.3.1 基于LSH头部索引相似度

5.3.2 基于Minhash相似度

5.3.3 基于Motif结构相似度

5.3.4 多维度算法联合规则

5.4 实验评估

5.4.1 实验数据集

5.4.2 多维度算法有效性实验

5.4.3 多维度算法时间开销实验

5.4.4 方法对比实验

5.4.5 恶意软件家族及应用市场环境验证

5.5 本章小结

第6章软件代码同源判定原型系统

6.1 引言

6.2 原型系统架构

6.2.1 需求分析

6.2.2 系统架构选型

6.3 原型系统功能

6.3.1 原型系统框架

6.3.2 基于Motif结构的同源判定模块

6.3.3 基于混合语义的同源判定模块

6.3.4 基于多维相似度的同源判定模块

6.4 原型系统实现

6.5 本章小结

第7章总结和展望

7.1 论文的主要工作及贡献

7.2 下一步工作开展

参考文献

攻读学位期间取得的研究成果

致谢

（5）基于深度学习的社交网络跨媒体突发事件检测与搜索研究（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 课题来源

1.2 研究背景与意义

1.3 国内外研究现状

1.3.1 社交网络突发事件语义获取与表达

1.3.2 社交网络突发事件语义分析

1.3.3 社交网络突发事件检测与搜索

1.4 主要研究成果和创新点

1.5 论文组织

第二章基于社交网络多属性特征的突发事件语义获取与表达算法

2.1 引言

2.2 基于社交与概念化扩展的短文本语义获取与表达算法(SCSE)的提出

2.2.1 SCSE算法的研究动机

2.2.2 SCSE算法描述

2.2.3 短文本概念特征扩展

2.2.4 社交语义特征扩展

2.2.5 短文本语义扩展搜索

2.2.6 SCSE算法实验结果与分析

2.3 基于标签异构图模型的图像语义获取与表达算法(HHGM)的提出

2.3.1 HHGM算法的研究动机

2.3.2 HHGM算法描述

2.3.3 标签异构图构建

2.3.4 图像特征语义扩展

2.3.5 HHGM算法的实现步骤

2.3.6 HHGM算法实验结果与分析

2.4 本章小结

第三章基于深度语义哈希的社交网络突发事件检测与搜索

3.1 引言

3.2 基于双重语义扩展与深度哈希模型的短文本语义分析算法(SCSE-DH)的提出

3.2.1 SCSE-DH算法的研究动机

3.2.2 SCSE-DH算法描述

3.2.3 问题定义

3.2.4 短文本双重语义扩展

3.2.5 深度哈希网络模型

3.3 基于SCSE-DH算法的突发事件检测与搜索

3.4 基于SCSE-DH的突发事件检测与搜索算法实验结果与分析

3.4.1 实验数据集

3.4.2 实验设置

3.4.3 实验一: 对SCSE-DH算法中深度哈希模型的评估

3.4.4 实验二: 主要参数对SCSE-DH算法语义分析性能的影响

3.4.5 实验三: 基于SCSE-DH的突发事件检测算法的性能分析

3.4.6 实验四: 基于SCSE-DH的突发事件搜索算法的性能评价

3.5 本章小结

第四章基于多视角图注意力网络的社交网络跨媒体突发事件检测与搜索

4.1 引言

4.2 基于时间信息指导的多视角图注意力网络模型(T-MVGAN)的提出

4.2.1 T-MVGAN模型的研究动机

4.2.2 T-MVGAN模型描述

4.2.3 社交网络跨媒体突发事件异构图构建

4.2.4 社交网络跨媒体突发事件多视角表示

4.2.5 时间分布信息引导的多视角图注意力网络

4.3 基于T-MVGAN模型的跨媒体突发事件检测与搜索

4.4 T-MVGAN模型实验结果与分析

4.4.1 数据集描述

4.4.2 实验设置

4.4.3 T-MVGAN模型性能评估

4.5 本章小结

第五章基于深度学习的社交网络跨媒体突发事件检测与搜索系统

5.1 引言

5.2 系统设计

5.3 系统功能设计与实现

5.3.1 社交网络突发事件语义获取与表达模块

5.3.2 社交网络突发事件深度语义分析模块

5.3.3 社交网络跨媒体突发事件检测与搜索模块

5.4 本章小结

第六章总结与展望

6.1 论文工作总结

6.2 未来工作展望

参考文献

致谢

攻读博士学位期间的科研成果

（6）基于特征表示学习的文本检索研究（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 课题的研究背景

1.1.1 文本检索

1.1.2 文本检索的应用

1.2 课题的研究意义

1.3 课题的研究现状

1.3.1 经典统计的文本检索模型

1.3.2 深度文本匹配模型

1.3.3 文本检索的突出问题

1.4 本文的主要工作及研究成果

1.5 论文的组织结构

第二章文本检索的基本理论

2.1 文本表示

2.1.1 基于离散式向量的文本表示

2.1.2 基于分布式向量的文本表示

2.1.3 基于上下文向量的文本表示

2.2 基础检索模型

2.2.1 概率模型

2.2.2 深度文本匹配模型

2.3 文本检索常用的数据集与工具

2.3.1 文本检索常用数据集

2.3.2 文本检索常用工具

2.3.3 文本检索常用评估指标

2.4 本章小结

第三章基于显着上下文特征表示的文本检索

3.1 引言

3.2 相关工作

3.3 显着上下文特征表示

3.3.1 先导实验

3.3.2 显着上下文的定义

3.3.3 显着上下文的搜索

3.4 上下文显着性的计算

3.4.1 显着上下文

3.4.2 上下文显着性

3.4.3 聚合相关度

3.4.4 复杂度分析

3.5 实验

3.5.1 数据集与实验设置

3.5.2 实验结果与分析

3.5.3 参数分析

3.6 本章小结

第四章基于卷积图拓扑特征表示的文本检索

4.1 引言

4.2 相关工作

4.2.1 BERT模型

4.2.2 图卷积网络

4.3 基于卷积图拓扑特征表示的检索模型

4.3.1 检索模型的网络框架

4.3.2 图卷积拓扑特征表示

4.3.3 卷积图拓扑特征表示

4.3.4 联合排序

4.4 实验

4.4.1 评测数据集

4.4.2 实验设置

4.4.3 实验结果与分析

4.4.4 参数分析

4.5 本章小结

第五章基于交互图拓扑特征表示的文本检索

5.1 引言

5.2 相关工作

5.2.1 图注意力网络

5.2.2 注意力机制

5.3 基于交互图拓扑特征表示的检索模型

5.3.1 检索模型的网络框架

5.3.2 图注意力拓扑特征表示

5.3.3 交互图拓扑特征表示

5.3.4 联合排序

5.4 实验

5.4.1 实验设置

5.4.2 实验结果及分析

5.4.3 参数分析

5.5 本章小结

第六章总结与展望

6.1 工作总结

6.2 研究展望

参考文献

附录缩略语表

致谢

攻读学位期间发表的学术论文目录

（7）面向用户知识需求的微信公众平台知识资源聚合及服务研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 选题背景

1.1.1 微信公众平台成为用户获取知识的重要途径

1.1.2 微信公众平台知识资源海量庞杂且质量参差不齐

1.1.3 用户日趋追求精准和智能化的知识服务

1.2 研究意义

1.2.1 理论意义

1.2.2 实践意义

1.3 国内外研究现状

1.3.1 网络知识资源聚合的国内外研究现状

1.3.1.1 网络知识资源聚合的国内研究现状

1.3.1.2 网络知识资源聚合的国外研究现状

1.3.2 微信公众平台知识组织与服务的国内外研究现状

1.3.2.1 微信公众平台知识组织与服务的国内研究现状

1.3.2.2 微信公众平台知识组织与服务的国外研究现状

1.3.3 研究评述

1.4 研究方法及技术路线

1.4.1 主要研究方法

1.4.2 研究技术路线及思路

1.5 研究主要内容

1.6 研究的创新点

第2章相关概念及理论基础

2.1 微信公众平台

2.1.1 微信公众平台概念

2.1.2 微信公众号的类型

2.1.3 微信公众平台知识资源

2.2 知识聚合理论与方法

2.2.1 知识聚合概念

2.2.2 常用的知识聚合方法

2.3 文本挖掘与分析

2.3.1 文本挖掘概述

2.3.2 文本挖掘流程

2.4 知识服务

2.4.1 知识服务概述

2.4.2 常见的知识服务模式

2.4.2.1 知识检索服务

2.4.2.2 知识导航服务

2.4.2.3 知识推荐服务

2.4.2.4 知识集成服务

2.5 本章小结

第3章面向用户知识需求的微信公众平台知识聚合服务体系框架

3.1 微信公众平台知识聚合服务面向用户知识需求的必要性

3.2 微信公众平台知识聚合及服务概述

3.2.1 微信公众平台知识聚合概念

3.2.2 微信公众平台知识聚合服务要素分析

3.2.3 微信公众平台知识聚合服务目标与原则

3.2.3.1 微信公众平台知识聚合服务目标

3.2.3.2 微信公众平台知识聚合服务原则

3.3 基于知识聚合的微信公众平台知识服务动因分析

3.4 面向用户知识需求的微信公众平台知识聚合服务体系框架

3.4.1 面向用户知识需求的微信公众平台知识聚合服务过程

3.4.2 面向用户知识需求的微信公众平台知识聚合服务体系框架构建

3.5 本章小结

第4章微信公众平台用户画像构建及需求分析

4.1 微信公众平台用户画像概述

4.1.1 微信公众平台用户画像内涵

4.1.2 微信公众平台用户画像构建原则

4.2 微信公众平台用户画像构建

4.2.1 VALS2模型概述

4.2.2 基于VALS2的用户标签体系设计

4.2.3 用户画像标签权重设计

4.2.4 实证研究—以“学术类微信公众号用户”为例

4.2.4.1 样本特征统计分析

4.2.4.2 因子分析及分类标签抽取

4.2.4.3 用户画像聚类分析及可视化

4.3 基于用户画像的微信公众平台用户分类与知识需求分析

4.3.1 初期引入参与型用户

4.3.2 成长型用户

4.3.3 成熟型用户

4.4 微信公众平台用户知识需求层次分析

4.4.1 微信公众平台用户知识需求形成

4.4.2 微信公众平台用户知识需求层次划分

4.5 微信公众平台用户知识需求模型

4.6 本章小结

第5章基于标签聚类的微信公众平台知识聚合及推荐服务

5.1 微信公众平台文本标签聚类的内涵及作用

5.1.1 微信公众平台文本标签聚类内涵

5.1.2 微信公众平台文本标签聚类作用

5.2 基于标签聚类的微信公众平台知识聚合方法

5.2.1 微信公众平台文本标签抽取方法

5.2.1.1 基于TextRank算法的文本标签抽取方法

5.2.1.2 Word2vec词向量模型

5.2.1.3 融合Word2vec和TextRank的文本标签抽取方法

5.2.2 BIRCH聚类算法及优化

5.2.3 基于改进BIRCH算法的微信公众平台知识资源聚合过程

5.3 实证研究—以“认知计算”领域为例

5.3.1 文本知识资源标签抽取

5.3.2 基于标签聚类的微信公众号知识资源聚合

5.4 基于标签聚类的微信公众平台知识推荐服务模式

5.4.1 微信公众平台知识推荐服务概述

5.4.2 基于标签聚类的微信公众平台知识推荐服务要素分析

5.4.3 基于标签聚类的微信公众平台知识推荐服务模式构建

5.5 本章小结

第6章基于摘要生成的微信公众平台知识聚合及集成服务

6.1 微信公众平台文本知识摘要生成的内涵及作用

6.1.1 微信公众平台文本知识摘要内涵

6.1.2 微信公众平台文本知识摘要作用

6.2 基于TextRank算法的文本摘要生成过程及改进思路

6.2.1 基于TextRank算法的文本摘要生成方法及过程

6.2.2 基于TextRank算法的文本摘要生成方法改进思路

6.3 基于改进TextRank算法的微信公众平台知识摘要生成方法

6.3.1 基于TextTank算法的文本摘要生成方法改进

6.3.1.1 句子语义相似度计算

6.3.1.2 句子位置特征及标题相似度特征计算

6.3.1.3 基于MMR算法的句子冗余处理

6.3.2 融合用户需求与图模型的单文本知识摘要生成方法

6.3.3 融合主题与图模型的单领域多文本知识摘要生成方法

6.3.3.1 Doc2vec段落向量模型

6.3.3.2 微信公众平台单领域多文本知识摘要生成流程

6.4 实证研究—以“认知计算”领域为例

6.4.1 基于单文本知识摘要生成的微信公众平台知识聚合

6.4.2 基于单领域多文本摘要生成的微信公众平台知识聚合

6.5 基于摘要生成的微信公众平台知识集成服务模式

6.5.1 微信公众平台知识集成服务概述

6.5.2 基于摘要生成的微信公众平台知识集成服务要素分析

6.5.3 基于摘要生成的微信公众平台知识集成服务模式构建

6.6 本章小结

第7章微信公众平台知识资源聚合及服务能力提升策略

7.1 用户知识需求外化表达及挖掘

7.1.1 提升用户知识需求外化表达能力

7.1.2 深入挖掘用户多层次知识需求

7.1.3 培养用户知识服务评价和反馈意识

7.2 加大新技术应用和融合改进

7.2.1 引入新技术,优化和改进知识聚合方法

7.2.2 知识聚合服务系统搭建和开发设计

7.2.3 应用可视化技术加强用户服务体验

7.3 微信公众平台创新服务理念及加强运营管理

7.3.1 加强主动知识服务意识,创新知识服务理念

7.3.2 构建和开展多元化平台知识服务模式

7.3.3 加强专业知识服务人才队伍建设

7.4 本章小结

第8章研究结论与展望

8.1 研究结论

8.2 研究局限与展望

参考文献

附录

附录1 微信公众平台用户知识服务需求调查问卷

附录2 单领域多文本知识摘要生成示例

作者简介及在学期间所取得的科研成果

致谢

（8）互联网语境下的群域话语研究（论文提纲范文）

摘要

Abstract

第一章绪论

一、选题缘起及研究的主要问题

(一)选题缘起

(二)本文研究的主要问题

二、本文研究的价值

(一)理论价值

(二)应用价值

三、相关研究现状

(一)网络语言研究

(二)当代话语分析研究

(三)互动社会语言学研究

四、本文的理论背景及依据

(一)系统功能语言学的相关理论及主要观点

(二)功能语篇分析基本观点及理论主张

五、本文的理论取向和研究方法

(一)理论取向

(二)研究方法

六、语料来源及符号说明

第二章新媒体群域类型与群域话语的功能层次

一、“新媒体群域”的概念及类型特征

(一)“新媒体群域”释义

(二)以媒介划分的群域交际类型

二、新媒体群域话语系统功能分析

(一)群域话语系统的语境层

(二)群域话语系统的内容层

(三)群域话语系统的表达层

(四)群域话语分析的系统功能框架

三、本章小结

第三章群域话语的话轮及序列

一、“群域话轮”的界定及类型

(一)学界相关分析

(二)“群域话轮”的含义

(三)“群域话轮”的类型及特点

二、群域交际中的序列

(一)序列的类型

(二)序列的特征

三、与传统话轮、序列的异同

(一)话轮上的异同

(二)序列上的异同

四、本章小结

第四章群域话语的语篇型式及特征

一、什么是群域语篇型式

二、群域语篇的“议程设置”模型

(一)群域版式结构建模

(二)群域媒介“议程设置”与文本意义的关联

三、互动社会语言学视角下的群域语篇型式探究

(一)在线社会网络研究的基本观点与方法

(二)群域语篇型式的研究设计

四、群域语篇型式的主要特征

(一)“度值”与语篇结构序列

(二)个体选择与语篇集群行为的趋同和趋异

五、本章小结

第五章群域话语的立场建构与人际互动

一、“立场表达”的相关研究

二、群域立场表达的常用手段及功能

(一)人际隐喻

(二)即时转喻

(三)指称与互文

(四)元话语与话语标记

(五)语气与情态表达

三、群域立场表达的主要媒介场景及策略、语用取效

(一)群域新闻发布话语立场表达的句法、语用策略

(二)微信朋友圈的发布者身份与立场建构策略

(三)留言区群体交互的立场类型及语用效果

四、本章小结

第六章群域话语的修辞伦理及语用规约

一、修辞伦理研究的理论发展

二、群域话语违背修辞伦理的常见问题

三、修辞伦理问题的成因与伦理对策

(一)修辞问题的成因

(二)伦理对策

四、群域交际修辞的语用规约

五、本章小结

第七章群域话语研究理论的多领域发展及应用

一、理论的多领域发展

二、现实应用

(一)有利于网络多模态语料库研究的深入

(二)有利于社会化网络服务的系统构建,推进国家话语生态建设

(三)为舆情管控与语情引导提供理论支持和观察视角

三、本章小结

第八章结论

一、主要结论

(一)提出新媒体群域话语的系统功能框架

(二)探究了“相熟度”与情景语境的共变关系

(三)界定了“群域话轮”的概念

(四)概括了媒介议程设置的模式及功能

(五)归纳了群域立场表达常用的句法、语用策略

(六)探索了修辞伦理和语用规约的协同标准

(七)对比了群域话语与以往个人交谈、公众性交流不同的特征和话语篇章的组织规律

二、不足与期待

附录

附表1

附表2

附表3

注释

参考文献

攻读博士学位期间发表的学术论文

致谢

（9）基于内容的视频信息智能搜索算法研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 课题背景和意义

1.2 研究现状

1.2.1 视频搜索系统研究现状

1.2.2 基于内容的视频搜索技术研究现状

1.2.3 基于深度学习方法的视频搜索研究现状

1.3 论文主要研究内容

1.4 论文结构

第2章视频图像特征描述

2.1 引言

2.2 颜色特征

2.3 CENTRIST特征

2.4 SIFT特征

2.5 SURF特征

2.6 本章小结

第3章基于局部和全局特征的镜头边界检测算法研究

3.1 引言

3.2 镜头边界检测中存在的主要问题

3.3 基于局部和全局特征的镜头边界检测算法

3.3.1 渐变边界检测

3.3.2 突变边界检测

3.4 本章小结

第4章基于加权的多特征的关键帧提取方法研究

4.1 引言

4.2 特征提取与帧差测度

4.3 特征描述子权值估计

4.3.1 基于标本的混合模型(CMM)

4.3.2 加权的多特征描述子CMMs

4.4 基于谱聚类的关键帧提取

4.4.1 谱聚类

4.4.2 聚类数目估计

4.5 基于帧间相似度曲线曲率检测的关键帧提取

4.6 本章小结

第5章基于语义概念检测的视频索引和搜索

5.1 引言

5.2 BoW特征表示选择

5.3 支持向量机(SVM)概述

5.4 视频索引和搜索

5.5 实验结果与讨论

5.5.1 镜头边界检测评估

5.5.2 关键帧提取评估

5.5.3 视频索引和搜索评估

5.6 本章小结

第6章基于深度学习方法的视频信息搜索方法研究

6.1 引言

6.2 基于深度学习方法的常用模型

6.2.1 卷积神经网络

6.2.2 递归神经网络

6.2.3 无监督的自编码器

6.3 基于深度学习网络的行为视频分类和搜索

6.3.1 常用框架和数据集

6.3.2 基于卷积神经网络(CNNs)的行为视频搜索

6.3.3 实验结果与分析

6.4 本章小结

结论

参考文献

攻读博士学位期间所发表的学术论文

致谢

（10）预训练深度学习架构下的语义地址匹配与语义空间融合模型研究（论文提纲范文）

致谢

摘要

Abstract

术语缩写表

1 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 地名地址匹配方法研究

1.2.2 自然语言建模方法研究

1.2.3 自然语言模型方法下的位置语义融合研究

1.2.4 存在问题与不足

1.3 研究目的

1.4 研究内容

1.5 章节安排

2 自监督预训练式的地址语义建模研究

2.1 中文地址数据结构及预处理

2.1.1 中文地址数据现状及特点

2.1.2 自监督语义表征学习的优势

2.1.3 实验数据及地址清洗预处理

2.2 深度学习架构下的语义表征方法

2.2.1 深度学习架构相关理论

2.2.2 自然语言自注意力机制理论

2.2.3 神经网络语言模型通用结构

2.2.4 自监督预训练语言模型理论

2.3 地址语义模型设计

2.3.1 基于多头自注意力的语义特征提取

2.3.2 克服地址长距离依赖的循环机制

2.3.3 排列组合式未知字符预测的目标

2.3.4 目标位置感知的双轨自注意力结构

2.3.5 局部预测优化设计

2.3.6 整体模型结构

2.4 地址语义模型训练框架

2.4.1 模型输入与超参数

2.4.2 目标函数

2.4.3 神经网络优化器设计

2.5 实验设计与模型验证

2.5.1 实验设计

2.5.2 实验结果分析

2.6 本章小结

3 基于地址语义模型微调的地址匹配研究

3.1 地址匹配相关理论

3.1.1 地址匹配相关概念

3.1.2 地址匹配原理

3.1.3 语义地址匹配定义

3.2 基于空间推理的等价地址语义数据集构建

3.2.1 文本蕴含及文本复述理论

3.2.2 带标签的地址匹配数据集重构设计

3.2.3 语义地址匹配数据集增强

3.3 语义地址匹配任务建模

3.3.1 深度神经网络模型微调理论

3.3.2 基于地址匹配分类任务的模型微调与训练

3.4 实验设计与分析

3.4.1 实验设计

3.4.2 实验结果分析

3.5 本章小结

4 地址语义-空间信息融合研究

4.1 地址语义-空间信息融合设计

4.1.1 文本语义相似度理论

4.1.2 地址间空间相似度设计

4.1.3 地址文本空间相似融合数据集构建

4.2 地址语义-空间信息融合任务建模

4.2.1 基于地址语义空间相似融合回归任务的模型微调与训练

4.3 空间坐标预测的下游验证评价任务

4.4 实验设计与分析

4.4.1 实验设计

4.4.2 实验结果分析

4.5 本章小结

5 总结与展望

5.1 研究总结

5.2 研究特色与创新

5.3 研究展望

参考文献

作者简历

四、基于概念空间的文本语义索引（论文参考文献）

[1]“普京政治话语”中政治文化观念的系统建构与演化研究（2000-2020）[D]. 岳雪. 大连外国语大学, 2021(12)
[2]中文电子病历文本检索关键技术研究[D]. 杨淞淳. 军事科学院, 2021(02)
[3]基于否定关键词和语义处理的空间关键词查询研究[D]. 金海. 太原理工大学, 2021(01)
[4]多形态软件代码同源判定技术研究[D]. 吴鹏. 四川大学, 2021(01)
[5]基于深度学习的社交网络跨媒体突发事件检测与搜索研究[D]. 崔婉秋. 北京邮电大学, 2021(01)
[6]基于特征表示学习的文本检索研究[D]. 戚园园. 北京邮电大学, 2021(01)
[7]面向用户知识需求的微信公众平台知识资源聚合及服务研究[D]. 程子轩. 吉林大学, 2021(01)
[8]互联网语境下的群域话语研究[D]. 张佳奇. 哈尔滨师范大学, 2021(09)
[9]基于内容的视频信息智能搜索算法研究[D]. 王文诗. 北京工业大学, 2020(06)
[10]预训练深度学习架构下的语义地址匹配与语义空间融合模型研究[D]. 徐流畅. 浙江大学, 2020(01)

标签：政治文化论文; 语义分析论文; 网络模型论文; 空间分析论文; 文本分类论文;

基于概念空间的文本语义索引

一、基于概念空间的文本语义索引（论文文献综述）

二、基于概念空间的文本语义索引（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、基于概念空间的文本语义索引（论文提纲范文）

（1）“普京政治话语”中政治文化观念的系统建构与演化研究（2000-2020）（论文提纲范文）

（2）中文电子病历文本检索关键技术研究（论文提纲范文）

（3）基于否定关键词和语义处理的空间关键词查询研究（论文提纲范文）

（4）多形态软件代码同源判定技术研究（论文提纲范文）

（5）基于深度学习的社交网络跨媒体突发事件检测与搜索研究（论文提纲范文）

（6）基于特征表示学习的文本检索研究（论文提纲范文）

（7）面向用户知识需求的微信公众平台知识资源聚合及服务研究（论文提纲范文）

（8）互联网语境下的群域话语研究（论文提纲范文）

（9）基于内容的视频信息智能搜索算法研究（论文提纲范文）

（10）预训练深度学习架构下的语义地址匹配与语义空间融合模型研究（论文提纲范文）

四、基于概念空间的文本语义索引（论文参考文献）

猜你喜欢