一、机器翻译中的机器认知与人的认知(论文文献综述)
于昌利,罗艺[1](2021)在《《翻译、人脑与电脑——神经语言学对机器翻译中歧义和复杂性问题的解决方案》述评》文中研究说明1.引言Barreiroetal.(2011)指出"歧义"和"认知复杂性"(cognitive complexity)是自然语言加工过程中影响机器翻译产出的两大问题,要解决以上问题,除了技术的提升,更应改善机器翻译模型的运行机制。《翻译、人脑与电脑——神经语言学对机器翻译中歧义和复杂性问题的解决方案》一书是Springer出版社《机器翻译:技术与应用》系列丛书的第二部,于2018年6月出版。
赵旭[2](2021)在《基于ULR与元学习策略的蒙汉神经机器翻译的研究》文中指出近年来,随着不同区域沟通的需要,机器翻译得到了长远地发展,少数民族语言等低资源语言也得到了越来越多地重视。针对于内蒙古自治区发展的需要,蒙汉机器翻译的研究及发展必不可少。目前的蒙汉机器翻译研究中,由于模型架构影响、蒙汉平行语料的匮乏以及语义特征提取困难等问题,导致翻译过程中仍有诸多不足,包括训练时间过长、翻译不准确、语义信息表达不足以及词向量表征不准确等问题。对上述问题进行分析研究,具体研究工作如下:(1)对蒙汉平行语料匮乏的问题进行研究,提升蒙汉机器翻译的效果。借助通用词汇表征(ULR)用于蒙汉语料词嵌入,使蒙汉平行语料生成统一嵌入向量空间,使得相近语义的词语有类似的分布表征,为后续的蒙汉翻译提供相近的语义参考信息,改善翻译效果。(2)进行ULR处理的同时,对未登录词导致的翻译质量不高的问题进行研究,借助多层级上下文编码和元学习算法来提炼词向量,获得准确的语义表征,来解决未登录词问题。(3)针对自回归模型不能并行解码的问题,采用非自回归Transformer架构结合MAML算法作为基础的编码器-解码器模型。与传统Transformer相比,非自回归Transformer克服了当前生成翻译需要依赖前一时刻输出的缺陷,通过在编码器加入Fertility模块,实现解码器的并行输出,提高翻译的解码速度。(4)在模型优化阶段,为了提升非自回归翻译模型的翻译质量,将知识蒸馏方法应用其中,在提升生成速率的同时也能有效地提升蒙汉翻译效果。非自回归模型实验中,实现了解码器的并行输出,当前输出不再依赖上下文关系,但会造成上下文语义信息的丢失,影响最终的翻译效果。因此,采用神经网络图灵机的结构来对语义信息进行补充,借助其外部记忆体来实现语义的补充与完善,从而缓解上下文语义信息丢失所造成的翻译性能下降的问题。基于上述研究,对当前存在的问题进行分析研究,借助对比实验验证了上述方法在提升蒙汉机器翻译质量上的有效性。
刘朋伯[3](2021)在《基于视觉信息的多模态机器翻译方法研究》文中进行了进一步梳理基于视觉信息的多模态机器翻译是指在文本机器翻译的基础上,以图像或视频的信息作为辅助帮助模型理解上下文从而提高机器翻译系统性能。通常的方法是在编码端将两种不同模态的信息融合。本文针对基于视觉信息的多模态机器翻译的两个子任务文本-图像机器翻译和文本-视频机器翻译进行研究,分析了该领域存在的问题:一是缺乏统一的多模态机器翻译框架能通用地适用于两个子任务;二是在图像信息中存在着与文本无关的内容,冗余的图像信息会对翻译系统造成影响,在模型内部对图像中的噪声信息进行过滤选择真正与上下文有关的部分是一个非常值得研究的问题;三是在文本-视频机器翻译任务中,视频特征和文本特征都具有时序性,而现有的模型忽略了这一特点。针对上述问题,本文进行了以下三点研究:1.提出了通用的多模态机器翻译框架。目前在基于视觉信息的多模态机器翻译缺乏一种翻译框架可以同时处理两个子任务,本文提出的通用的多模态机器翻译模型以感知文本的视觉表示为基础,引入了多模态门控网络对视觉信息进行选择融合,可以通用地处理两个多模态机器翻译的子任务。其中文本-图像机器翻译任务在三个测试集上的BLEU指标和METEOR指标均达到了最优或接近最优的结果,文本-视频机器翻译任务在VATEX数据集上与VATEX提供的基线模型相比,BLEU值提高了4个点。本文中的其他方法均以本文提出的通用的多模态机器翻译框架作为基线模型。2.提出了选择性注意力机制。选择性注意力在模型训练过程中动态地选择图像特征中与当前词语义关联密切的区域,并通过Gumbel重参数的方法实现了选择过程可微分,进而模型能通过反向传播进行参数更新。作为对图像去噪的一种补充,本文同时引入了文本图像语义相似度损失函数进一步对两个模态的表示信息加以约束。实验结果和实例对比都表明了选择性注意力在文本-图像多模态翻译任务上有效的去除了图像特征中的噪声并提高了翻译效果。3.提出了多模态注意力中的相对距离。在基线模型中的多模态注意力中,为多模态特征对分配多模态距离向量,并将多模态距离向量融合到注意力得分矩阵计算和最终加权和输出中。实验结果表明基于相对距离的方法可以显着提高翻译结果,本文的方法在VATEX公开测评榜上取得了第四名的成绩。
李天昊[4](2021)在《多语言互译神经机器翻译系统的设计与实现》文中研究说明随着机器学习技术和神经网络的发展,基于深度学习的神经机器翻译逐渐兴起。自2014年开始,它在短短几年内已经在大部分任务上取得了明显的优势。在神经机器翻译中,词串被表示成实数向量,即分布式向量表示。这样,翻译过程并不是在离散化的单词和短语上进行,而是在实数向量空间上计算,因此它对词序列表示的方式产生了本质的改变。通常,机器翻译可以被看作一个序列到另一个序列的转化。在神经机器翻译中,序列到序列的转化过程可以由编码器-解码器(Encoder-Decoder)框架实现。在多语言神经机器翻译领域中,目前主流的模型均为多语种数据混合训练的单编码器-解码器模型,这种模型不仅降低了企业训练多个语向的训练成本,同时通过语言间的共性,多资源的语向会弥补低资源语向的劣势;由于只存在一个模型,企业的存储压力也大大减少。为了实现一个多语言互译神经机器翻译系统,并在准确性和实时性达到企业调用标准,本文首先调研了神经机器翻译系统所采用的前沿技术,通过开源方式获取高质量多语言数据,并设计了数据处理流程、模型搭建训练流程以及前端微服务展示流程;针对多语言模型在测试时生成的错误,本文在数据层面针对性优化了多语言数据切词算法,在模型层面优化了隐层空间中不同语种的区分度,使最终实现的多语言翻译系统在准确性方面比肩单语种翻译模型;针对模型在生成阶段延迟较高的问题,本文设计并实现了 cache缓存机制极大降低生成所需时间,使模型在实时性方面也达到毫秒级的生成速度,确保前端调用翻译接口低延迟。
头旦才让[5](2021)在《汉藏神经机器翻译关键技术研究》文中研究表明机器翻译是利用机器将一种自然语言转换为另一种自然语言的过程,它是计算语言学的一个分支,涉及计算机技术、数学、认知科学、语言学、信息论等多门学科的交叉和联系,是人工智能的终极目标之一。汉藏机器翻译相关技术的研究,对于继承和弘扬民族优秀文化,增进文化交流,寻求思想的沟通,服务国家一带一路倡议,推动我国藏族地区社会、经济、教育和文化事业发展等有着十分重要的现实意义;能够促进藏语计算语言学的实质性发展,具有非常重要的科学研究价值和实际应用价值。本文在通过构建高质量和内容丰富的汉藏双语平行语料库的基础上,对藏文长句分割技术、藏文地名识别技术、改进藏文字节对编码等关键技术进行了初步探索,力图通过优化汉藏神经机器翻译模型来提高翻译性能。具体而言,本文的研究内容主要包括以下几个方面:(1)语料库预处理方面:本文重点研究了藏文长句分割技术,归纳藏语句子边界识别规则,找出句子边界识别的难点,提出了融合藏语依存句法和基于Bi-LSTM(Bi-Long Short-Term Memory)+CRF(Conditional Random Fields)的藏语长句子分割方法,对藏语长句进行了分割,实验表明,该方法有效地分割了藏文长句,F值达到99.42%。(2)藏文命名实体识别方面:本文重点介绍了藏文地名识别技术,阐述了藏文地名的音节、触发词、地名后续词和格助词等特性适用基于CRF模型的地名识别。实验结果表明本文方法对藏文地名识别的准确率、召回率和F值分别达到了96.12%、81.92%和88.45%。为处理藏文地名词,本文在训练语料分词中融入了藏文地名识别技术,BLEU值达到30.46,提高了汉藏命名实体翻译的效果。(3)模型改进方面:本文通过改进字节对编码算法,提出了带字数阈值的藏文字节对编码算法,优化了基于注意力机制的汉藏神经机器翻译模型。收集整理了100万汉藏句对和20万汉藏人名地名词典,训练了汉藏神经机器翻译模型。通过测试和验证,模型的BLEU值达到36.84。本文构建的模型的命名实体翻译效果要优于已商用汉藏在线翻译系统。(4)系统改进方面:设计实现了基于注意力机制和改进字节对编码的汉藏神经机器翻译系统,优化了后端流程和程序,部署在阳光汉藏机器翻译网站,实现了阳光汉藏神经机器翻译系统V2的应用推广。
辛玥[6](2021)在《认知语境参数视角下《笨花》俄译本中的模糊语义阐释研究》文中研究说明文学翻译作为一种跨语言和跨文化的交际活动,始终存在于某种语境中,如果脱离语境,译者就不能充分理解语义,更无法再次加工。传统语境观只强调外部客观事物的作用,忽略了主观能动性。传统语境一般不将说话者和受话者的心理和动态话语纳入研究范畴,因此,传统语境被语言学家视为一个静态的、固定的先决条件。虽然传统语境理论在指导翻译研究方面取得了巨大的成就,但它仍有进一步发展的潜力,因此许多人对其进行了更加深入的研究。随着认知语言学的发展,一些语言学家开始从认知的角度重新审视和研究语境,尽可能考虑到交际双方的认知心理,并且试图解释交际中的动态认知过程。翻译文本特点决定了译者必须最大程度上结合原文的文本语境、作者的创作语境和原语的文化语境梳理出故事线条,理解作者真实意图,问题的关键聚焦在译者的知识结构和认知水平上,与认知语境关注的重点相吻合。本文在梳理语境理论从静态到动态再到认知层面上的递进发展过程的基础上,以认知语境参数理论为指导,以我国着名作家铁凝的长篇小说《笨花》及其俄译本为例,将原文的语境要素参数化,使得语境更具有描写性和可操作性,进而探讨认知语境参数对于译者处理模糊语义问题的重要作用。本文译例中所涉及的参数均属于常规类型参数,例如人物参数,地点参数,时间参数,文化参数等。本文分为四部分——绪论、正文、结论以及参考文献。本篇毕业论文的绪论部分阐述了的选题的理由和意义,对认知语境参数的国内外研究现状、《笨花》以及模糊语义的研究现状进行了概述,且对本文的创新点和研究方法进行了探讨。正文部分共分为三章。第一章以认知语境理论概述为切入点,阐明语境问题认知研究的起源,概括了认知语境的概念及重要理论观点,引出认知语境参数的概念及分类。第二章探究了认知语境下铁凝小说《笨花》原文当中出现的模糊语义及其俄译。首先对模糊语义的概念进行界定,然后以模糊语义的表现形式为着眼点,以中文小说《笨花》的原文及其俄译为例,分析《笨花》小说当中的各种模糊语义现象和其俄译。第三章运用认知语境参数理论,从消除歧义机制、辨别新奇语义、语义推理、填补意义空缺以及多义辨别五个方面,评析铁凝《笨花》俄译本的模糊语义阐释情况,对于《笨花》俄译本中不完整的模糊语义阐释的译例以及未完成的模糊语义阐释的译例,提供参考译文,并总结其本质原因。结论部分对小说中模糊语义的翻译情况做出总结并进行评价。小说《笨花》的俄译本当中大部分关于模糊语义的翻译都完成的较好。但是仍有少部分的独具汉语丰富文化内涵的模糊语义的俄译没有取得应有的效果,产生了错译、漏译等现象。本研究认为,对于《笨花》当中模糊语义的俄译,如果想要译文达到良好的可读性并且能够将原文内涵准确且完整地传递给读者,需要译者的认知语境达到与原文作者相似或相同的水平。而通过认知语境参数这一有力工具,可以高效地、有理有据地分析出原文模糊语义的真实内涵,从而形成较为成功的译文。本文采用文献研究方法:以认知语境参数为理论依据,通过细读小说《笨花》的原文和俄译本,比较分析中文小说和它的俄译本中模糊语义现象的表达和处理方式,具体运用归纳总结和演绎推理相结合的方法,研究认知语境参数在翻译过程中对模糊语义的阐释作用。
付临恩[7](2021)在《面向日汉机器翻译的现代日语动词「挂ける」的多角度研究》文中进行了进一步梳理在日汉机器翻译中,动词多义的处理是最难解决的问题之一。论文以配价语法、语义场理论为指导,面向日汉机器翻译,通过语料库、词典等工具对现代日语动词「挂ける」的语义进行了形式化描写,制定了机器翻译规则。通过测试,准确率达到93.75%,高于百度翻译(77.08%)、Google翻译(54.17%)及excite翻译(29.17%)。本论文由绪论、本论、结论三个部分组成。在绪论部分主要介绍研究背景、研究综述、研究目的、研究对象与方法、研究创新点及语料来源。本论部分,第一章主要介绍机器翻译相关的操作系统,包括分词系统、句法分析系统以及在线日汉机器翻译系统。第二章是对日汉机器翻译中「挂ける」的误译现象进行了分析,将错误类型分为三类,错译、漏译和惯用语翻译错误。并从日语语言学和日汉翻译两个角度作了分析。第三章对「挂ける」进行了语义形式化描写并制定了机器翻译规则,利用语料对规则进行了测试,并尝试搭建词义消歧系统。结论部分通过语义场理论,我们可以对日语名词进行语义分类,编码。动词还要填写配价数以及相应成分的语义。在规则约束的条件中,对动词的语义组合规定了一定的配价关系,如果这种关系不能被组合,则合一失败。这样就排除了相当一部分由于搭配不当造成的歧义。
祖森[8](2021)在《基于语料库现代汉语动结式“V穿/透/通”的俄译研究》文中研究指明动结式是现代汉语极为重要的一种句法结构,一直深受国内学界的重视,在词汇学、构词学、认知语言学、功能语法、生成语法、配价语法、翻译学、类型学、错误分析理论方面研究成果丰硕。但由于汉俄语言分属不同的语系,俄语中没有动结式,在线汉俄互译时常有误译发生。因此,研究动结式的汉俄互译规律极具研究价值。作为结果补语“穿、透、通”都有“穿透(过)”义,与前置动词构成述补结构,形成动结式。本文依据义素分析和构式理论对动结式“V穿/透/通”分别进行语义分析,得出:“V穿”可以分为具体穿透类、除阻畅通类、抽象穿透类、揭露类和透彻类五类,“V透”分为具体穿透类、除阻畅通类、渗透类、抽象穿过类、清楚类、掌握类、完全类和性状改变类八类,“V通”分为除阻畅通类、穿透类、连通类和清楚类四类,并根据其构式特征、语义特点总结出“V穿/透/通”的互换情况,并构建三种动结式的构式演变结构图,力求透析并直观展示其语义关系;依据经典文学双语文本及汉俄大词典等工具书,梳理动结式“V穿/透/通”的俄语表达式,总结出不同语义对应的情况下,“V穿/透/通”构式的俄译表达所运用的翻译方法,主要有前缀构词法、V+副词法、V的完成体三种方法;分析Google、Yandex在线翻译软件对动结式“V穿/透/通”的误译情况,指出误译原因,并通过俄语国家语料库对其进行验证。基于语料库研究现代汉语动结式“V穿/透/通”的俄语表达式,可以为实义汉语动结式的语义研究、汉俄词典编撰、在线翻译完善提供有益借鉴。
周柳丹,李学宁,胡熠[9](2021)在《机器翻译研究中统计方法的局限及翻译范式更迭规律》文中提出在翻译范式研究中,一个亟待加强的研究领域是机器翻译。本文结合机器翻译发展史,考察三种机器翻译研究范式——基于规则的机器翻译、基于语料库的机器翻译和神经机器翻译。研究发现:(1)基于语料库的机器翻译存在局限性,其译文质量已逊于神经机器翻译;(2)神经机器翻译范式并非用某种语言学理论可以完全涵括。这项研究对于辩证地认识译界盛行的"语料库+统计"研究范式以及探究未来翻译范式发展趋势具有一定价值和意义。
郭明阳,张晓玲,唐会玲,孟庆端,任龙波[10](2021)在《人工智能在机器翻译中的应用研究》文中提出针对人工智能在机器翻译中的应用现状和发展趋势,探讨了人工智能对于提高机器翻译效率、促进行业发展的新路径。首先,分析了人工智能在机器翻译行业中的发展趋势,并阐释了具体的应用方式;其次,立足国情,发掘中国在人工智能和机器翻译行业中的发展优势,并研究在大数据时代,提高机器翻译效率的方法。研究结果期望为中国基于人工智能的机器翻译产业发展提供参考,为制定人工智能和机器翻译产业政策提供决策依据,并为人工智能在自然语言处理和机器翻译的研究提供帮助。
二、机器翻译中的机器认知与人的认知(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、机器翻译中的机器认知与人的认知(论文提纲范文)
(1)《翻译、人脑与电脑——神经语言学对机器翻译中歧义和复杂性问题的解决方案》述评(论文提纲范文)
1. 引言 |
2. 内容简介 |
3. 简评 |
(2)基于ULR与元学习策略的蒙汉神经机器翻译的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的及意义 |
1.3 国内外研究现状 |
1.4 论文的研究内容 |
1.5 论文的组织结构 |
第二章 机器翻译相关理论与技术 |
2.1 神经机器翻译 |
2.2 自回归机器翻译模型 |
2.2.1 注意力机制 |
2.2.2 Transformer模型架构 |
2.2.3 自注意力机制 |
2.2.4 位置编码 |
2.3 非自回归机器翻译模型 |
2.3.1 非自回归Transformer模型 |
2.3.2 NAT架构优缺点 |
2.4 机器翻译评估方法 |
2.5 本章小结 |
第三章 数据预处理 |
3.1 语料编码格式及语料划分 |
3.1.1 语料编码格式 |
3.1.2 数据集筛选及划分 |
3.2 蒙汉双语语料处理 |
3.2.1 词切分 |
3.2.2 通用词汇表征 |
3.3 多层级上下文编码 |
3.4 本章小结 |
第四章 基于NAT和元学习策略的蒙汉神经机器翻译 |
4.1 知识蒸馏 |
4.2 融合元学习策略的机器翻译模型 |
4.2.1 元学习翻译模型 |
4.3 实验 |
4.3.1 模型搭建 |
4.3.2 参数设定 |
4.3.3 模型训练 |
4.4 实验结果分析 |
4.5 本章小结 |
第五章 融合语义信息的蒙汉神经机器翻译 |
5.1 神经图灵机 |
5.1.1 读单元与写单元 |
5.1.2 寻址机制 |
5.2 融合神经图灵机的蒙汉机器翻译 |
5.2.1 词级注意力 |
5.2.2 模型搭建与参数设定 |
5.2.3 模型训练 |
5.3 实验结果分析 |
5.4 本章小结 |
结论 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文及研究成果 |
(3)基于视觉信息的多模态机器翻译方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.2 多模态机器翻译的研究现状及分析 |
1.2.1 文本-图像多模态机器翻译的研究现状分析 |
1.2.2 文本-视频多模态机器翻译的研究现状分析 |
1.2.3 存在的问题与挑战 |
1.3 本文的主要研究内容 |
1.3.1 通用的基于视觉信息的多模态机器翻译模型 |
1.3.2 文本-图像机器翻译中的选择性注意力 |
1.3.3 文本-视频机器翻译中的多模态相对距离 |
1.4 本文的主要组织结构 |
第2章 通用的基于视觉信息的多模态机器翻译模型 |
2.1 引言 |
2.2 相关技术 |
2.2.1 基于Transformer的机器翻译模型 |
2.2.2 预训练的卷积神经网络 |
2.3 通用的基于视觉信息的多模态机器翻译模型的构建 |
2.3.1 感知文本的视觉表示 |
2.3.2 多模态门控网络 |
2.4 实验结果与分析 |
2.4.1 多模态机器翻译数据集 |
2.4.2 评测指标 |
2.4.3 实验设置 |
2.4.4 结果分析 |
2.5 本章小结 |
第3章 基于选择性注意力的多模态机器翻译方法 |
3.1 引言 |
3.2 可微分的采样方法 |
3.2.1 Gumbel-Max采样方法 |
3.2.2 Gumbel-Softmax方法与Gumbel-Sigmoid方法 |
3.3 选择性注意力 |
3.3.1 选择注意力在文本-图像多模态机器翻译中的应用 |
3.3.2 文本图像语义相似度损失函数 |
3.4 实验结果与分析 |
3.4.1 选择注意力与其他方法的对比实验 |
3.4.2 多模态编码器的单双流建模对比实验 |
3.4.3 实例对比与错误分析 |
3.5 本章小结 |
第4章 基于相对距离的多模态机器翻译方法 |
4.1 引言 |
4.2 自注意力机制中的相对距离 |
4.2.1 位置编码存在的问题 |
4.2.2 具有相对距离的自注意力 |
4.3 基于相对距离的多模态注意力 |
4.4 实验结果与分析 |
4.4.1 相对距离与其他方法的对比实验 |
4.4.2 多模态相对距离的窗口设置 |
4.4.3 实例分析 |
4.5 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间取得创新性成果 |
致谢 |
(4)多语言互译神经机器翻译系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 研究内容 |
1.4 论文结构 |
第二章 相关技术 |
2.1 神经网络 |
2.1.1 深度学习 |
2.1.2 端到端学习和表示学习 |
2.2 翻译数据预处理技术 |
2.2.1 基础分词技术 |
2.2.2 符号标准化以及数据过滤技术 |
2.2.3 子词切分技术 |
2.3 神经机器翻译训练 |
2.3.1 翻译数据来源 |
2.3.2 神经机器翻译建模技术 |
2.4 翻译模型推断技术 |
2.4.1 推断系统的架构 |
2.4.2 推理阶段加速 |
2.4.3 译文长度控制 |
2.5 本章小结 |
第三章 多语言互译神经机器翻译系统需求分析与设计 |
3.1 系统总体需求 |
3.2 系统功能需求 |
3.3 系统非功能需求 |
3.4 系统总体架构设计 |
3.5 数据预处理模块设计 |
3.5.1 数据预处理模块切分 |
3.5.2 数据处理模块 |
3.6 多语言神经机器翻译模型设计 |
3.6.1 编码器-解码器模块 |
3.6.2 模型训练设置 |
3.6.3 增大模型容量 |
3.6.4 增加训练批量 |
3.7 模型评测以及微服务模块设计 |
3.7.1 模型推断生成 |
3.7.2 机器翻译评测模块 |
3.7.3 机器翻译微服务模块 |
3.8 本章小结 |
第四章 多语言互译神经机器翻译系统详细设计 |
4.1 多语言互译神经机器翻译系统分层设计 |
4.2 数据处理模块详细设计 |
4.2.1 数据获取及清洗 |
4.2.2 数据处理 |
4.3 多语言神经机器翻译模型详细设计 |
4.3.1 词向量模块与位置向量模块构建 |
4.3.2 注意力计算模块构建 |
4.3.3 前馈神经网络模块构建 |
4.3.4 Cache缓存机制构建 |
4.4 模型评测以及微服务模块详细设计 |
4.5 本章小结 |
第五章 系统优化及测试 |
5.1 系统测试环境 |
5.2 系统部署与运行 |
5.2.1 系统测试 |
5.2.2 前端多语言翻译系统展示 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 本文工作总结 |
6.2 未来展望 |
参考文献 |
致谢 |
(5)汉藏神经机器翻译关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 机器翻译研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 机器翻译方法 |
1.3.1 统计机器翻译方法 |
1.3.2 神经机器翻译方法 |
1.4 主要研究内容 |
1.5 本文的创新点及贡献 |
1.6 本文组织结构 |
第2章 汉藏双语语料库构建 |
2.1 引言 |
2.2 藏文编码标准与语料库 |
2.2.1 藏文编码标准概述 |
2.2.2 语料库概述 |
2.2.3 藏文编码标准与语料库 |
2.3 汉藏双语平行语料加工规范 |
2.3.1 基本要求 |
2.3.2 数据格式 |
2.3.3 加工工具 |
2.3.4 加工流程 |
2.4 汉藏平行语料加工技术 |
2.4.1 汉藏双语语料库 |
2.4.2 汉藏双语语料获取 |
2.4.3 藏语语料预处理 |
2.5 小结 |
第3章 藏文句子边界识别 |
3.1 引言 |
3.2 藏文句子边界分析 |
3.3 藏语句子边界识别规则 |
3.4 藏语句子边界识别难点 |
3.5 藏语句子边界识别方法 |
3.5.1 Bi-LSTM+CRF架构 |
3.5.2 藏语依存句法概述 |
3.5.3 模型框架 |
3.6 实验结果与分析 |
3.7 小结 |
第4章 面向机器翻译的藏文地名识别 |
4.1 引言 |
4.2 条件随机场(CRF) |
4.3 基于CRF的藏文地名识别 |
4.3.1 CRF在藏文地名识别中的优越性 |
4.3.2 藏文地名特点及识别难点 |
4.3.3 基于CRF的藏文地名识别流程 |
4.3.4 特征选择 |
4.4 实验与结果分析 |
4.4.1 实验数据 |
4.4.2 评测指标 |
4.4.3 结果分析 |
4.4.4 系统对比 |
4.5 汉藏机器翻译中的应用 |
4.6 小结 |
第5章 基于改进字节对编码的汉藏神经机器翻译研究 |
5.1 注意力机制模型 |
5.1.1 模型概述 |
5.1.2 模型框架 |
5.2 汉藏神经机器翻译模型训练 |
5.2.1 算法概述 |
5.2.2 训练流程 |
5.3 汉藏神经机器翻译解码 |
5.3.1 贪心搜索算法 |
5.3.2 束搜索算法 |
5.4 神经机器翻译的词表处理 |
5.4.1 近似softmax函数 |
5.4.2 未登录词处理 |
5.4.3 基于词根分解的开放词汇表 |
5.5 改进的藏文字节对编码算法 |
5.5.1 字节对编码算法 |
5.5.2 改进的藏文字节对编码算法 |
5.6 实验设计与分析 |
5.6.1 实验数据 |
5.6.2 参数设置 |
5.6.3 评测方法 |
5.6.4 实验结果与分析 |
5.6.5 系统对比 |
5.7 系统架构及优化 |
5.7.1 系统化总体架构 |
5.7.2 封装改进 |
5.8 小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读博士学位期间发表的论文及科研成果 |
一、发表论文 |
二、发明专利 |
三、主持和参与科研项目 |
四、科技成果 |
致谢 |
(6)认知语境参数视角下《笨花》俄译本中的模糊语义阐释研究(论文提纲范文)
中文摘要 |
ABSTRACT |
绪论 |
(一)选题意义 |
(二)研究综述 |
1、认知语境参数的研究现状 |
2、模糊语义翻译的研究现状 |
(三)创新点及研究方法 |
一、认知语境理论概述 |
(一)认知语境的主要理论观点 |
1、认知语境研究的基础理论——关联理论 |
2、维索尔伦的语境认知观 |
3、范·戴伊克的认知语境理论 |
4、中国学者的认知语境理论 |
(二)认知语境的概念界定 |
1、认知语境的概念及特征 |
2、认知语境与传统语境的关系 |
(三)认知语境参数的概念 |
1、认知语境参数概念 |
2、认知语境参数分类 |
二、认知语境下《笨花》中的模糊语义及其俄译 |
(一)模糊语义的概念 |
(二)模糊语义的表现形式 |
1、内涵模糊与外延模糊 |
2、抽象模糊与具体模糊 |
3、量的模糊与质的模糊 |
4、上限模糊与下限模糊 |
三、认知语境参数对模糊语义的阐释作用 |
(一)选词搭配 |
(二)甄别新奇语义 |
(三)推理真实语义 |
(四)填补意义空缺 |
(五)多义选择 |
结论 |
致谢 |
参考文献 |
(7)面向日汉机器翻译的现代日语动词「挂ける」的多角度研究(论文提纲范文)
中文摘要 |
Abstract |
绪论 |
一、研究背景 |
二、研究综述 |
三、研究对象与方法 |
四、研究创新点 |
五、语料来源 |
第一章 机器翻译基础研究 |
第一节 分词系统 |
第二节 句法分析系统 |
第三节 机器翻译系统 |
本章小结 |
第二章 日汉机器翻译中「挂ける」的误译分析 |
第一节 错误类型 |
一、错译 |
二、漏译 |
三、惯用语错误 |
第二节 语言学角度的分析 |
一、日文书写的随意性 |
二、日语词汇的多义性 |
三、日语惯用语的模糊性 |
第三节 日汉翻译角度的分析 |
一、格成分对译词的影响 |
二、汉语译词的多样性 |
三、汉语句式的复杂性 |
本章小结 |
第三章 面向日汉机器翻译的现代日语动词「挂ける」的机器翻译规则构建 |
第一节 表层结构的确立 |
一、小泉保的观点 |
二、「挂ける」价的再界定 |
三、表层结构 |
第二节 机器翻译规则的构建 |
一、构建方法 |
二、机器翻译规则 |
第三节 机器翻译规则评测及词义消歧系统试建 |
一、评测方法 |
二、评测结果 |
三、消歧系统试建 |
本章小结 |
结论 |
参考文献 |
附录 |
附录一 分词结果(部分) |
附录二 句法分析结果(部分) |
附录三 在线机器翻译系统 |
附录四 机器翻译规则评测结果 |
致谢 |
攻读学位期间发表论文 |
(8)基于语料库现代汉语动结式“V穿/透/通”的俄译研究(论文提纲范文)
摘要 |
Abstract |
Аннотация |
第1章 绪论 |
1.1 课题研究背景和意义 |
1.2 课题研究对象 |
1.3 国内外研究现状与发展趋势 |
1.3.1 国内研究现状 |
1.3.2 国外研究现状 |
1.3.3 发展趋势 |
1.4 课题研究内容 |
1.5 课题研究方法 |
1.6 课题研究重点、难点 |
1.6.1 研究重点 |
1.6.2 研究难点 |
1.7 语料来源 |
1.7.1 汉语语料 |
1.7.2 俄语语料 |
第2章 动结式“V穿/透/通”的语义分析 |
2.1 动结式“V穿”构式的语义分析 |
2.1.1 “V穿”构式的语义分类 |
2.1.2 具体穿透类“V穿_1” |
2.1.3 除阻畅通类“V穿_2” |
2.1.4 抽象穿透类“V穿_3” |
2.1.5 揭露类“V穿_4” |
2.1.6 透彻类“V穿_5” |
2.2 动结式“V透”构式的语义分析 |
2.2.1 “V透”构式的语义分类 |
2.2.2 具体穿透类“V透_1” |
2.2.3 除阻畅通类“V透_2” |
2.2.4 渗透类“V透_3” |
2.2.5 抽象穿过类“V透4” |
2.2.6 清楚类“V透_5” |
2.2.7 掌握类“V透_6” |
2.2.8 完全类“V透_7” |
2.2.9 性状改变类“V透8” |
2.3 动结式“V通”构式的语义分析 |
2.3.1 “V通”构式的语义分类 |
2.3.2 除阻畅通类“V通_1” |
2.3.3 穿透类“V通_2” |
2.3.4 连通类“V通_3” |
2.3.5 清楚类“V通_4” |
2.4 动结式“V穿/透/通”构式特征及语义特点对比 |
2.5 本章小结 |
第3章 动结式“V穿/透/通”的俄译研究 |
3.1 “V穿”构式的俄译研究 |
3.1.1 “V穿_1”构式的翻译手段及俄译表达 |
3.1.2 “V 穿_2”构式的翻译手段及俄译表达 |
3.1.3 “V 穿_3”构式的翻译手段及俄译表达 |
3.1.4 “V 穿_4”构式的翻译手段及俄译表达 |
3.1.5 “V 穿_5”构式的翻译手段及俄译表达 |
3.2 “V透”构式的俄译研究 |
3.2.1 “V透_1”构式的翻译手段及俄译表达 |
3.2.2 “V透_2”构式的翻译手段及俄译表达 |
3.2.3 “V透_3”构式的翻译手段及俄译表达 |
3.2.4 “V透_4”构式的翻译手段及俄译表达 |
3.2.5 “V透_5”构式的翻译手段及俄译表达 |
3.2.6 “V透_6”构式的翻译手段及俄译表达 |
3.2.7 “V透_7”构式的翻译手段及俄译表达 |
3.2.8 “V透_8”构式的翻译手段及俄译表达 |
3.3 “V通”构式的俄译研究 |
3.3.1 “V通_1”构式的翻译手段及俄译表达 |
3.3.2 “V通_2”构式的翻译手段及俄译表达 |
3.3.3 “V通_3”构式的翻译手段及俄译表达 |
3.3.4 “V通_4”构式的翻译手段及俄译表达 |
3.4 本章小结 |
第4章 动结式“V穿/透/通”的机器翻译情况分析 |
4.1 “V穿”的机器翻译情况分析 |
4.1.1 “V 穿_1、V 穿_2、V 穿_3”构式的机器翻译情况分析 |
4.1.2 “V 穿_4、V 穿_5”构式的机器翻译情况分析 |
4.2 “V透”的机器翻译情况分析 |
4.2.1 “V 透_1、V 透_2、部分V 透_4”构式的机器翻译情况分析 |
4.2.2 “V 透_3、部分V 透_4”构式的机器翻译情况分析 |
4.2.3 “V 透_5、V 透_6”构式的机器翻译情况分析 |
4.2.4 “V 透_7、V 透_8”构式的机器翻译情况分析 |
4.3 “V通”的机器翻译情况分析 |
4.3.1 “V 通_1、V 通_2”构式的机器翻译情况分析 |
4.3.2 “V通_3”构式的机器翻译情况分析 |
4.3.3 “V通_4”构式的机器翻译情况分析 |
4.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的学术论文 |
致谢 |
(9)机器翻译研究中统计方法的局限及翻译范式更迭规律(论文提纲范文)
1 问题的提出 |
2 基于规则的机器翻译 |
3 基于语料库的机器翻译 |
3.1 统计方法在机器翻译中的应用始末 |
3.1.1 应用统计方法的设想 |
3.1.2 基于噪声信道理论的统计机器翻译模型(IBM模型) |
3.1.3 基于最大熵的统计机器翻译模型 |
3.2“语料库+统计”研究范式的局限性 |
3.2.1 文本选择 |
3.2.2 语料标注 |
3.2.3 翻译策略 |
3.2.4 相关软件发展 |
4 神经机器翻译 |
4.1 神经机器翻译主要模型 |
4.2 神经机器翻译优势 |
5 翻译范式更迭规律 |
6 结语 |
(10)人工智能在机器翻译中的应用研究(论文提纲范文)
1 人工智能在机器翻译中应用的研究意义 |
2 人工智能和机器翻译的研究进程 |
3 基于人工智能技术的机器翻译 |
3.1 人工智能技术在机器翻译中的应用 |
3.1.1 专家系统技术在机器翻译中的应用 |
3.1.2 人工神经网络在机器翻译中的应用 |
3.1.3 智能决策支持系统在机器翻译中的应用 |
3.1.4 人工智能技术在机器翻译中的应用场景及优缺点对比分析 |
3.2 人工智能在机器翻译中的具体实现模式 |
3.3 人工智能对于现有机器翻译技术的提升作用 |
3.4 人工智能对于机器语言分析和翻译技术的推动作用 |
3.5 人工智能与机器翻译技术系统构建 |
4 人工智能帮助机器翻译提升工作效率 |
四、机器翻译中的机器认知与人的认知(论文参考文献)
- [1]《翻译、人脑与电脑——神经语言学对机器翻译中歧义和复杂性问题的解决方案》述评[J]. 于昌利,罗艺. 外语教学与研究, 2021(05)
- [2]基于ULR与元学习策略的蒙汉神经机器翻译的研究[D]. 赵旭. 内蒙古工业大学, 2021(01)
- [3]基于视觉信息的多模态机器翻译方法研究[D]. 刘朋伯. 哈尔滨工业大学, 2021
- [4]多语言互译神经机器翻译系统的设计与实现[D]. 李天昊. 北京邮电大学, 2021(01)
- [5]汉藏神经机器翻译关键技术研究[D]. 头旦才让. 西藏大学, 2021(02)
- [6]认知语境参数视角下《笨花》俄译本中的模糊语义阐释研究[D]. 辛玥. 内蒙古师范大学, 2021(09)
- [7]面向日汉机器翻译的现代日语动词「挂ける」的多角度研究[D]. 付临恩. 黑龙江大学, 2021(09)
- [8]基于语料库现代汉语动结式“V穿/透/通”的俄译研究[D]. 祖森. 哈尔滨理工大学, 2021(09)
- [9]机器翻译研究中统计方法的局限及翻译范式更迭规律[J]. 周柳丹,李学宁,胡熠. 英语广场, 2021(04)
- [10]人工智能在机器翻译中的应用研究[J]. 郭明阳,张晓玲,唐会玲,孟庆端,任龙波. 河南科技大学学报(自然科学版), 2021(03)