一、自适应四叉树分形图像编码并行算法(论文文献综述)
包馨[1](2021)在《“分形视距”纹理压缩与彩色多边形纹理集成的三维模型可视化方法》文中提出纹理数据是构建城市真三维模型过程中的重要组成部分,通常会占用大量内存,导致三维模型难以实现流畅稳定的动态可视化,因此,对纹理数据进行有效组织与调度已成为目前国际地理信息科学领域的重要和热点研究内容之一。本文针对目前国内外三维模型可视化中纹理数据及其组织的研究现状,提出了“分形视距”(FVD)纹理压缩与彩色多边形纹理集成的三维模型可视化方法。该方法能够用较少纹理数据表示出建筑物的视觉特征,极大提高了大场景三维模型可视化的渲染效率和速率,具有较大的研究价值。本文提出的“分形视距”(FVD)纹理压缩与彩色多边形纹理集成的三维模型可视化方法主要工作有以下几个方面:首先,本文针对目前国内外纹理压缩和数据管理现状,对FVD模型理论及数学基础进行介绍,重点分析了现有基本分形编码算法及其优缺点,阐述本文根据三维模型可视化中视点位置和距离进行纹理压缩的必要性。其次,根据视距及目标立面的可见性情况提出了“分形视距”纹理压缩及彩色多边形纹理组织方法。当视距满足纹理调用条件且目标立面可见时,对纹理数据进行动态迭代解压,并确定纹理重采样次数以创建多分辨率纹理数据;当视距不满足纹理调用条件但目标立面可见时,利用纹理分割算法创建颜色纹理树,通过合并节点生成彩色多边形来表示建筑立面纹理。基于三维模型数据的构成,以及对比总结现有空间数据存储结构的优缺点,本文利用关系数据库实现对建筑物纹理数据的高效存储和快速调用。然后,介绍了三维模型的纹理映射算法,并基于AABB包围盒的视锥裁剪方法,提出了FVD纹理动态调度方案。该方法根据最初视点位置和视线方向加载场景数据,当视点不断变化时,进行条件判断并调用相应的纹理数据,若三维建筑模型在视椎体外部,则不需要渲染该模型数据;若目标建筑立面不可见,则需要剔除此建筑立面,再根据视角和距离调用相应分辨率纹理或者彩色多边形纹理,完成三维建筑模型的动态可视化。最后,针对本研究提出的方法,利用两个研究区建筑纹理数据进行了实验。并且分别使用3ds Max、Sketch Up和本文提出的方法对实验结果从内存占用和帧速率两方面进行对比分析。实验结果显示,本方法和3ds Max、Sketch Up Pro相比,在研究区1中分别减少了约33.1%和37.2%的内存占用,帧速率分别提高了约8.4%和11.1%;在研究区2中分别减少了约36.5%和30.9%的内存占用,帧速率分别提高了约7%和10.9%。
李毅[2](2020)在《基于多核处理平台的HEVC解码核心模块并行处理的算法设计与实现》文中指出新一代视频编码标准—H.265/HEVC中引入了很多新特性,这些特性在提升编码效率的同时,也使得相比之前的标准—H.264/AVC,HEVC的计算复杂度变得更高。另外,HEVC标准针对的是高清和超高清视频应用,而这些视频通常含有巨大的数据量,这些因素使得实时处理HEVC标准视频流成为传统单核处理器面临的一大挑战。所幸,HEVC标准在开发时就考虑到了这些问题,提供了很多并行工具,这些并行工具可以缓解计算复杂度高和数据量大带来的实时处理困难。同时,现代处理器从单一内核架构向多核架构发展,也为并行处理算法的实现提供便利。因此,关于HEVC标准的编解码的并行处理算法也成为众多研究者关注的研究对象。本文利用Tilera-GX36多核处理平台,研究基于多核处理平台的HEVC解码核心模块的并行处理算法。论文的研究内容主要包括以下几点:(1)提出并实现了一种基于多线程负载均衡的联合并行环路滤波算法,实现去方块滤波(DBF)和样本自适应补偿(SAO)的联合并行处理。通常,图像中不同区域因为纹理不同,进而对CTU产生不同的划分方式,使得其待滤波边界数目有较大差异。当以CTU为最小并行粒度进行多线程并行时,不同线程的计算负载会出现不均衡现象。针对这一问题,提出了一种区域划分方案,将图像划分为多个区域,每个区域中的待滤波边界数近似。再利用映射关系表,将这些区域分配给多个线程进行并行处理,从而实现各滤波线程间的负载均衡。最后利用缓存技术,将DBF和SAO进行联合,减少两者之间存在的延迟,提高环路滤波整体的并行性。(2)提出并实现了一种基于CTU的HEVC帧内/帧间融合并行解码算法。OWF是以CTU行做为解码并行粒度的算法,会存在由于不同CTU行计算复杂度不同,使得部分帧内解码线程阻塞而产生线程空闲的问题。基于CTU的细粒度波前并行解码方案,可以减少帧内解码线程阻塞的问题,但该方案未考虑帧间CTU解码的并行性。针对这两种并行解码方案尚存在的问题,可以在细化帧内并行粒度的同时,进一步利用了帧间CTU之间的依赖关系,实现以CTU为并行粒度的帧内/帧间融合的并行解码。若当前帧内无CTU待解码时或者存在空闲线程时,空闲的线程可以直接用于相邻帧中满足依赖关系的CTU的解码。从而,进一步减少了线程空闲,提高了多核资源的利用率。(3)提出并实现了基于核心模块融合的HEVC并行解码算法。当将所提出的联合并行环路滤波方案以及基于CTU的HEVC帧内/帧间融合并行解码算法,直接同帧级并行熵解码方案相结合时,并行粒度不同与资源调度会给系统内部带来整体上的延迟。针对这一问题,利用流水线并行技术和分级线程调度策略将三个模块进行融合,减少模块间延迟以及线程空闲时间,提升系统整体的数据吞吐量。之后,利用Tilera多核平台特性,实现HEVC解码的平台优化。实验在Tilera-GX36多核处理器上进行,以libde265作为参考软件,对多种未使用任何并行工具编码形成的高清超高清视频流进行测试。根据实验结果,所提并行环路滤波方案,相比于前人提出的快速融合环路滤波算法,并行性能平均提升了约9.1%;基于CTU的HEVC帧内/帧间融合并行解码算法,相比于OWF和基于CTU的细粒度波前并行方案,并行性能平均分别提升了约18.3%和8.5%;实现的基于核心模块融合的HEVC并行解码算法,相比于细粒度多层次并行解码算法最大并行加速比平均提升了约8.15%。
杜洋,范医鲁,曲新亮[3](2020)在《基于计盒维数的小波分形四叉树医学图像编码研究》文中认为目的为解决传统方法匹配时间长、编码时间长的问题,提出一种改进的医学图像编码算法。方法将计盒维数引入到小波分形四叉树医学图像编码算法中,首先构造小波分形四叉树与匹配树,并分别计算盒维数值,按匹配树盒维数与小波分形四叉树盒维数的差值绝对值由小到大的顺序选取匹配树进行匹配计算。通过仿真实验对本文方法进行有效性评价。结果相比传统小波分形四叉树方法,本文算法明显减少了四叉树的匹配时间和编码时间(P<0.05),仿真实验证明了本文方法的有效性。结论本文算法是一种有损的图像压缩方法,在某些对图像质量不苛求的情况下,本文算法是一种比较好的方法。
段堃[4](2020)在《基于H.265/HEVC的高压缩率与低复杂度编码技术研究》文中提出随着视频应用不断向高清及超高清迈进,激增的视频数据不断挑战着有限信道带宽和存储容量的下的视频传输与存储能力,使得目前广泛应用的H.264/AVC视频编码标准逐渐难以应对视频的高效存储与传输需求。基于此,视频编码联合专家组于2013年正式发布了新一代国际视频编码标准H.265/HEVC。虽然H.265/HEVC凭借其先进的编码工具实现了视频压缩效率的又一次飞跃,但H.265/HEVC标准在实现大规模普及的道路上,编码性能与编码复杂度之间的矛盾依旧存在。本文立足于第三代高效视频编码标准H.265/HEVC,力求在高压缩率编码与低复杂度编码的理论研究取得新的进展。本文主要开展的研究内容如下:1.提出了一种基于局部亮度直方图的场景切换检测算法。以局部亮度直方图对于帧间内容变化的优秀表征能力为依据,以视频中场景切换的高效检测为目标,设计了帧间内容变化测度与基于场景切换检测窗的场景切换检测策略。所提出的基于局部亮度直方图的场景切换检测算法可以实现超低计算成本下的高效场景切换检测,实现场景切换检测准确度与视频压缩效率提升。2.提出了一种基于局部亮度直方图的自适应帧类型决策算法。以局部亮度直方图对于视频时序特性的良好表征能力为依据,以视频中帧类型的高效自适应决策为出发点,设计了一种兼容性更好的固定帧类型决策算法与基于相邻帧间整体差异的自适应帧类型决策流程。所提出的基于局部亮度直方图的自适应帧类型决策算法可以实现在几乎不引入额外计算开销前提下的高效自适应帧类型决策,有效提升视频压缩效率。3.提出了一种自适应四叉树深度预测机制。以编码单元划分深度间的时空相关性为依据,以H.265/HEVC标准中的四叉树划分方式作为入手点,设计了相似编码区域标志位、相似编码区域深度范围预测算法与非相似编码区域深度范围预测算法。所提出的自适应四叉树深度预测机制可以在有效保证编码质量的前提下,显着加速编码过程。
贾兴伟[5](2020)在《基于视觉的机器人SLAM与物体检测一体化研究》文中研究说明随着科技的不断发展,智能机器人开始在各个领域得到广泛应用。在未知环境中,智能机器人代替人类完成复杂的工作任务时,需要一套稳定高效的控制技术即同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)去完成机器人的智能化、自主化操作。而且随着传感器技术的不断发展,基于视觉的移动机器人SLAM逐渐成为了研究热点。物体检测又是机器人非常重要的一项作业任务,通过将机器人SLAM和物体检测结合起来可以完成一些复杂、危险的任务,保证工人人身安全。所以本文对基于视觉的机器人SLAM和物体检测一体化方法进行了研究。首先,针对线缆目标轮廓较难检测的问题,本文提出了基于H分量的直方图反向投影的轮廓检测方法。先进行图像增强以提高目标和背景对比度,然后进行颜色空间转换,采用基于H分量的直方图反向投影方法对轮廓进行提取,接着通过形态学处理去除轮廓的毛刺噪声。最后研究了三种直线检测算法,根据检测结果选取合适的线缆直线段检测算法。然后,针对相交轮廓以及背景粘连无法进行轮廓主体提取的问题,本文提出了基于轮廓拐点的相交轮廓边缘检测算法。先用ED边缘检测算法对线缆轮廓进行提取,然后采用DP算法对轮廓进行平滑。为了避免复杂的计算,通过Freeman链码对轮廓进行描述,构建累加差别值对轮廓拐点进行分类。最后通过设定线缆边缘提取标准,解决了相交轮廓以及背景粘连无法提取轮廓主体的问题。其次,针对ORB算法提取的特征点容易聚集在图像纹理丰富区域,不能均匀地分布在图像上问题,本文提出了基于信息熵的特征点均匀化算法。通过将图像金字塔分层,再将每层图像网格化,最后以每个网格信息熵所占比例权重系数进行特征点的均匀分配。通过实验对比,本文算法特征点分布均匀度比基于Open CV算法提高76.3%,比基于四叉树算法提高2.13%。最后,改进并且扩展了ORB-SLAM2系统。通过公开数据集验证本文提出的特征点均匀化算法对系统的稳定性和位姿准确性有所改善。最终实验表明,本文算法比基于四叉树算法整个系统的轨迹准确性至少提高2.11%,最多提高61.04%;相邻帧之间的平移误差减少至少1.90%,最多减少38.09%。然后对改进后的ORB-SLAM2系统进行扩展,增加了物体检测线程。针对Kinect V2.0视场过大引入过多背景问题,本文提出融合深度信息对复杂背景进行过滤,然后对感兴趣区域进行物体检测,并且通过帧与帧之间线段的匹配,提高检测结果的正确率和稳定性。与此同时,将线特征转为点特征,提高了系统的通用性和健壮性。最终实验表明达到了机器人SLAM与物体检测的一体化效果。
尹传伟[6](2019)在《基于TILE-Gx36多核处理器的HEVC多路视频并行编码技术的研究与应用》文中研究说明新一代视频编码标准HEVC的提出,在编码模块引入更多新特性,较H.264/AVC降低一倍码率的同时,带来了计算复杂度的大幅度增加。基于现代多核处理器平台的并行计算成为高复杂度视频编码的有力解决方案,具有重要的研究意义和应用前景。本文针对HEVC视频编码复杂度高的问题,设计主要编码模块并行处理方案,提升编码运算效率;通过核调度策略将方案融合后应用到多路编码系统中,实现对多路视频的目标场景并行处理。论文工作基于TILE-Gx36多核平台展开,具体工作分为以下三部分:(1)设计并实现了CTU粒度并行算法方案。通过分析视频编码过程中的帧内帧间模块CTU之间的的依赖性以及负载均衡关系,发现CTU之间的负载均衡关系与依赖关系影响CTU编码效率的机制,通过设计邻接矩阵、入度矩阵等数据结构,结合线程池核资源调度策略,设计并实现了CTU粒度的并行算法和熵编码改进方案,充分提高多核利用率,有效地提高了并行加速比。(2)设计并实现了一种CTU预测过程的并行算法。通过DAG分析预测过程中不同尺度CU的PU间存在的依赖关系,发现不同尺度的PU可以并行处理的可能性,并据此提出了CTU在预测模块中并行方案。该并行算法使用优先级队列和四叉树扫描技术做任务的初始化与更新,设计CTU内的PU级并行编码方案,有效提高预测模块的编码速度。(3)设计并实现了一种多路视频的并行编码处理方案。首先将CTU粒度并行与CTU内PU间并行的两个并行方案通过核调度策略融合,获得更高的单路视频的并行加速比;在此基础上,针对指定帧率和实时编码两种应用场景,设计并实现了流内和流间的核动态分配方案,实现了多路视频的多粒度融合并行编码。本文在Tilera多核平台上实现上述三种编码方案,通过设置对比算法实验验证了本文研究的性能提升。其中CTU粒度并行编码方案的并行加速比可达到9,并且不会影响视频的客观质量参数;预测模块中设计CTU预测过程中的PU间并行算法有效的提高了并行度,相对帧内2X并行算法、帧间局部并行算法都有速度提升,帧内模块加速比可达到2.5,帧间模块加速比可以达到2.7;多路编码系统中使用核动态分配方案针对多路中各目标场景,更合理的给多路分配核线程资源,达到了预期的设计目标。
王洋[7](2019)在《基于深度学习的视频编码技术研究》文中研究表明随着通信技术、互联网技术的发展和移动终端、智能设备的普及,数字广播电视、互联网视频、视频会议、远程医疗、远程教育等传统多媒体应用以及3D视频、虚拟现实视频、短视频等新兴多媒体应用丰富着人们的日常生活,但同时也使得视频数据呈爆炸式增长,给数据存储和网络传输带来巨大挑战,如何稳定高效的存储和传输海量的视频数据成为目前亟待解决的问题。数字视频压缩技术在视频数据压缩处理中扮演关键角色,数字视频压缩技术在通信、计算机、广播电视等领域的广泛应用促进了数字视频编码标准的产生和发展。目前,已经发布的最新的数字视频编码标准HEVC和AVS2虽然能够满足高清和超高清数字视频的压缩性能需求,但是,随着人工智能的发展和5G时代的到来,更加庞大的视频数据量对视频编码标准提出了更高的要求,因此,在现有数字视频编码标准的基础上进一步提升压缩性能十分必要。近年来,随着深度学习的发展,以卷积神经网络为代表的深度神经网络在计算机视觉、语音识别、自然语言处理等计算机领域都取得了令人瞩目的成果,利用深度学习提升视频编码的压缩性能不仅能够为未来的数字视频编码标准提供技术储备,而且是目前视频编码领域的前沿问题和研究热点。本文从利用深度学习提升视频编码技术的压缩性能角度展开深入研究,涵盖了数字视频编码标准框架中的帧内预测、帧间预测以及环路滤波三个主要模块。具体的研究内容分为以下三个部分:第一,本文提出了基于多尺度卷积神经网络的帧内预测算法,用来提高视频编码中帧内预测的准确性。基于方向插值的帧内预测方法广泛应用在现有的数字视频编码标准中,这种方法能够很好的预测具有主方向纹理的图像块,但是对于复杂纹理的图像块或者方向性较弱的图像块不能获得较好的预测效果。为了提高现有视频编码标准中的帧内预测的准确性和为下一代视频编码标准的制定做技术储备,本文提出了基于多尺度卷积神经网络的帧内预测方法。具体来讲,本文提出的算法由两个子网络组成:多尺度特征提取网络和复原网络。将基于方向插值的帧内预测生成的预测块与其相邻的L型重构像素组合为更大的图像块输入到多尺度特征提取网络,然后将输入图像块进行下采样并提取不同尺度的特征图,最后对特征图进行上采样恢复到原始尺度。复原网络用来聚合不同尺度的特征图,并利用卷积操作生成最终更准确的预测块。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧内预测算法能够获得3.4%的BD-rate节省。第二,本文提出了基于深度神经网络的帧间预测算法,用于提高数字视频编码中帧间预测的准确性。现有的数字视频编码标准中的帧间预测是通过运动估计和运动补偿技术从参考帧获取当前预测块,基于平移运动的运动估计技术不能处理自然视频中的更复杂的变化,如非线性亮度变化、模糊、缩放等。为了提高视频编码中帧间预测的准确性,本文提出了基于深度神经网络的视频编码帧间预测算法,旨在利用当前块邻近的L型重构像素、参考块邻近的L型重构像素提高帧间预测的准确性。具体来讲,本文提出的方法包括三个子网络:关系估计网络、组合网络、深度提纯网络。关系估计网络用于学习当前块与其参考块之间的关系。组合网络用于提取学习到的关系和参考块的特征图,然后将这些特征图连接在一起。深度提纯网络用于生成最终更准确的预测块。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧间预测算法能够获得4.4%的BD-rate节省。第三,本文提出了基于卷积神经网络的环路滤波算法以及基于GPU的环路滤波并行优化算法,前者旨在利用卷积神经网络提升环路滤波的编码性能;后者旨在降低环路滤波的编码复杂度。环路滤波在现有的数字视频编码标准中扮演十分重要的角色,不仅能够去除编码过程中产生的块效应、振铃效应,提高重构视频的主观质量,而且能够提高视频编码的压缩性能。本文从两个方面对环路滤波展开深入的研究。一方面,从提高环路滤波的编码性能入手,本文提出了基于卷积神经网络的环路滤波算法。具体来讲,本文提出了一个全新的卷积神经网络结构,利用编码过程中产生的边信息(如块划分、残差以及运动矢量)结合重构视频本身来提高环路滤波的性能。实验结果表明,与HEVC参考软件HM 16.9相比,本文提出的帧间预测算法能够获得4.6%的BD-rate节省。另一方面,环路滤波的较高复杂度是HEVC在实时编码应用场景中的瓶颈,为了降低环路滤波的编码复杂度以及考虑基于深度学习的视频编码架构使用CPU+GPU的多设备协同编码,本文提出了基于GPU的环路滤波并行优化算法。具体来讲,本文提出了使用CPU+GPU的多设备协同的并行编码方案,通过将HEVC编码端Deblocking和SAO联合在GPU端并行处理来降低环路滤波的编码复杂度。实验结果表明,与HEVC的开源编码器x265相比,本文提出的环路滤波并行算法能够获得47%的编码加速。
李祥鹏[8](2019)在《基于分形理论的快速图像压缩算法》文中进行了进一步梳理图像压缩是实现图像高效存储和传输的关键技术。基于分形理论的图像压缩算法因其压缩比高、重构图像质量好以及解码与图像分辨率无关的特性而受到广泛关注。然而,分形图像压缩算法在编码过程中为值域块搜索最优匹配块的过程会消耗大量时间,这阻碍了分形编码技术的现实应用。本论文基于分形理论,提出两个改进的分形图像压缩算法,有效提高分形图像压缩算法的速度。第一个分形编码算法是基于迭代控制搜索策略的分形图像编码算法。现有的分形编码算法存在因定义域块的特征空间分布不均匀而导致的低效搜索或无效搜索问题。此外,它们采用的固定质量允许误差控制搜索策略,会导致图像解码质量上限受限的问题。针对这些问题,本文提出控制分形编码搜索过程中迭代函数系统的更新次数,提前结束匹配过程中的低效搜索部分。同时结合了使用特征标准差对值域块进行平滑块与粗糙块的划分技术、对定义域块自适应扩张的码本缩减技术,并在计算图像块相似度时提出等距采样图像降维操作进一步降低计算复杂度,有效加快编码进程。从实践来看,本文所提出的基于迭代控制搜索策略的分形图像编码算法是在损失一定图像解码质量的情况下所能达到的较佳编码加速方案。第二个分形编码算法是基于自适应阈值四叉树分块的分形图像编码算法。针对基本分形编码中固定分块尺寸的设置以及传统四叉树分块中固定阈值的设置,没有考虑不同输入图像的自身特性不同以及同一图像的不同区域特性不同的客观差异,本文提出了自适应阈值的四叉树分块方法,根据图像子块的均值和标准差,动态计算出图像子块的特有阈值,根据特有阈值判断是否对当前图像块进行分割。从实践来看,本文所提的基于自适应阈值的四叉树分块的分形图像编码算法在稍微增加编码时间的前提下有效地提高了解码质量,实现了编码时间和解码质量间更好的平衡。为验证本文所提出的新方法,本文对8幅512*512的常用标准灰度图像进行测试,通过计算编码时间(ET)和图像解码质量(PSNR)进行算法的性能评估。结果表明,对比现有的分形图像编码算法,在解码图像质量损失一定的前提下,本文算法具有更高效的编码速度和获得良好的图像解码质量。
胡强[9](2019)在《面向实时视频压缩的HEVC编码算法研究及系统实现》文中认为随着网络多媒体技术的高速发展,高清及超高清视频的应用逐渐普及,大量视频数据的产生给视频存储及传输带来了巨大挑战。在此背景下,视频编码联合工作组(Joint Collaborative Team on Video Coding,JCT-VC)于2013年成功推出了新一代视频编码标准HEVC(High Efficiency Video Coding)。与上一代视频编码标准H.264/AVC相比,HEVC中采用了大量先进的编码技术和工具,将视频编码效率提高一倍的同时也使得编码复杂度大幅增加,严重阻碍了HEVC的推广和应用。因此,降低编码复杂度和优化编码质量是HEVC研究的两个关键问题。本文面向实时超高清视频编码的需求,围绕HEVC编码复杂度及率失真性能两大方面的核心问题开展了深入研究,提出了大幅降低HEVC编码复杂度和显着提升感知率失真性能的创新算法,并在此基础上设计与实现了基于HEVC的4K超高清实时软件编码系统。本文的主要研究内容及创新点如下:针对帧内编码单元(Coding Unit,CU)模式选择复杂度高的问题,提出了基于逻辑回归分类器的帧内CU划分模式判决算法。本文将帧内编码单元的划分建模为分类问题,通过直接分析输入数据的特征,采用简单高效的逻辑回归分类器对编码单元的划分进行提前判决,从而避免了帧内编码单元的遍历搜索。为了提取输入数据中与编码单元划分类别最为相关的特征,针对不同的量化参数和编码深度,以F-score的评价方法进行特征选择。实验结果表明,在全I帧的配置下,该方法使帧内编码计算复杂度平均下降了55.51%,且码率仅增加1.3%。为了降低帧间编码的复杂度,提出了基于聂曼-皮尔逊准则的帧间编码单元和预测单元模式判决算法。具体来说,本文将编码单元和预测单元的选择建模为分类问题,提出将错误分类分为“漏检”和“误检”两种情况,并采用聂曼-皮尔逊决策准则,在限制误检率的前提下,使漏检率最小。该算法同时采用非参数估计的方法来计算率失真代价的条件概率分布等参数,并针对不同量化参数及编码深度的率失真代价的条件概率分布进行周期性更新,以提高分类的精度。实验结果表明,该算法平均减少了65%的编码时间,且码率仅增加1.29%。此外,该算法可以设置不同的误检率,具有均衡率失真性能和编码复杂度的优点。由于HEVC率失真优化(Rate-Distortion Optimization,RDO)技术忽略了人眼的视觉特性,本文提出了一种基于运动注意力模型和视觉失真敏感度模型的率失真优化算法。与一般的感知模型不同,这两种感知模型充分利用了HEVC编码环路中的运动矢量、变换系数、残差等信息,采用这些信息不仅能反映出物体的运动特征和图像的纹理特征,还能很好地限制模型复杂度的增加。另外,由于编码中运动矢量是以最小率失真代价为准则而计算得到的,有时并不能反映真实运动矢量。因此,提出了一种基于最大后验概率估计的运动矢量场细化方法,以提高模型的精度。然后根据运动注意力模型和视觉失真敏感度模型提取到的感知特征,对拉格朗日乘子和量化参数进行自适应地调整,从而提高视频编码的感知质量。针对全景视频数据量过大的问题,提出了基于注视点引导的全景视频编码算法。由于头戴式显示器(Head-Mounted Displays,HMD)的限制,全景视频在任意时刻仅显示了视口(Viewport)内容,且人眼通常会关注注视点周围的区域。因此,本文首先提出了一种基于三维卷积神经网络的注视点预测模型来预测全景视频中注视点的位置。该模型同时考虑了视频内容相关的特征和人眼历史扫描路径这两大因素。然后,根据预测得到的注视点,提出了一种适用于全景视频的注视点自适应视频编码方法,以提高关注区域的编码质量。该编码方法结合人眼注视点的加权因子和矩形到单位球面的缩放因子,对比特分配和量化参数进行自适应地调整。在不影响视觉感知质量的情况下,有效地降低了全景视频编码的码率。本文对目前应用最为广泛的HEVC实用编码器x265的编码框架及计算复杂度进行了深入分析,提出了x265编码器的模式判决优化算法,包括减少率失真优化次数、SKIP模式提前检测和帧内模式快速选择等。同时,由于样点自适应补偿(Sample Adaptive Offset,SAO)计算复杂度过高,预测编码线程与SAO处理线程存在计算负载不均衡的问题,导致x265在多核处理器(12核以上)上编码超高清视频的并行效率较低。因此,提出了SAO模式快速选择方法以减少并行等待时间,从而实现了对超高清视频的实时编码。此外,基于优化后的编码器,实现了超高清实时编码系统,并提出了针对系统稳定性的优化策略,即根据输入及输出缓冲区的状态自适应地调整编码速度和码率。
伍子锴[10](2019)在《基于小波及分形码去噪算法的研究》文中提出图像在存储和传输过程中,通常会受到不同的噪声干扰,从而导致图像的失真模糊现象。为了从受噪声污染的图像中获得有价值的信息并且改善图像的质量,就必须对含噪图像进行去噪处理,而含噪图像的去噪效果将会直接影响到图像后续处理的结果。本文主要是对小波包、偏微分方程及分形码图像去噪入手进行深入研究,对多种方法进行改进和相互结合,提出了新的去噪方法。结果表明,新方法很好的保留完整细节和边缘信息,有效的去除噪声。主要工作内容包括以下几方面:1.详细分析图像去噪的国内外研究现状、研究背景和意义,对基于小波、偏微分方程和分形图像编码的图像去噪算法进行了分析和研究。2.深入研究小波包以及偏微分方程的原理,针对大部分偏微分方程去噪算法去噪后边缘纹理信息容易被磨光,尤其是图像的灰度渐变区和图像淡边缘,不能有效地鉴别而被破坏的问题,利用小波包更加精细的信号分解能力和偏微分方程控制梯度变化的优异性能,提出一种新的小波包与偏微分方程相结合的图像去噪算法,用以保护边缘纹理等细节信息,同时兼顾去噪性能。3.深入研究基于分形码的图像去噪,并提出了一种有效的基于分形的图像去噪方法,分层分类用于提高编码速度,并避免大量无效的均方误差(Mean Square Error,MSE)计算。使用动态定义域块和值域块大小的基于四叉树的图像分区用于增加噪声消除的程度。使用非任意种子图像和附加的后处理来实现进一步的去噪。
二、自适应四叉树分形图像编码并行算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、自适应四叉树分形图像编码并行算法(论文提纲范文)
(1)“分形视距”纹理压缩与彩色多边形纹理集成的三维模型可视化方法(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究现状 |
1.2.1 纹理图像压缩方法研究现状 |
1.2.2 三维场景数据存储及组织研究现状 |
1.2.3 三维模型可视化研究现状 |
1.3 研究内容及论文结构 |
第2章“分形视距”(FVD)模型理论及数学表示 |
2.1 FVD纹理压缩理论基础 |
2.1.1 仿射变换 |
2.1.2 度量空间 |
2.1.3 压缩映射定理 |
2.1.4 迭代函数系统 |
2.1.5 拼贴定理 |
2.2 基本分形压缩原理与实现 |
2.2.1 编码阶段 |
2.2.2 解码阶段 |
2.3 本章小结 |
第3章 FVD纹理压缩与彩色多边形纹理的组织方法 |
3.1 FVD多分辨率纹理生成 |
3.1.1 基于四叉树的分形纹理压缩 |
3.1.2 FVD多分辨率纹理解码 |
3.2 彩色多边形纹理的生成 |
3.2.1 纹理多边形分割 |
3.2.2 颜色纹理树的创建 |
3.3 纹理数据存储方法 |
3.3.1 数据库设计 |
3.3.2 纹理存储方式 |
3.4 本章小结 |
第4章 三维场景数据的动态调度机制 |
4.1 纹理映射算法 |
4.2 数据动态调度方法 |
4.2.1 视椎体纹理剔除算法 |
4.2.2 包围盒构建方法 |
4.2.3 基于AABB包围盒的视锥裁剪方法 |
4.2.4 纹理动态调度 |
4.3 本章小结 |
第5章 实验结果与分析 |
5.1 测区概况与实验数据 |
5.2 纹理预处理 |
5.2.1 创建FVD多分辨率纹理 |
5.2.2 生成彩色多边形纹理 |
5.3 三维模型动态可视化 |
5.4 实验对比分析 |
5.5 本章小节 |
第6章 结论与展望 |
6.1 总结 |
6.2 创新点 |
6.3 展望 |
参考文献 |
申请学位期间的研究成果及获奖情况 |
致谢 |
(2)基于多核处理平台的HEVC解码核心模块并行处理的算法设计与实现(论文提纲范文)
摘要 |
abstract |
专用术语注释表 |
第一章 绪论 |
1.1 论文研究背景与意义 |
1.2 相关技术背景 |
1.2.1 视频压缩编码技术简介 |
1.2.2 国际视频编码标准的发展历程简介 |
1.2.3 多核技术发展简介 |
1.2.4 TILERA多核平台简介 |
1.3 国内外研究现状 |
1.4 论文研究内容及安排 |
1.4.1 论文研究内容 |
1.4.2 本文安排 |
第二章 H.265/HEVC视频编码标准及并行结构分析 |
2.1 H.265/HEVC视频编码标准概述 |
2.2 H.265/HEVC编码关键技术简介 |
2.2.1 四叉树结构 |
2.2.2 帧内预测 |
2.2.3 帧间预测 |
2.2.4 变换与量化 |
2.2.5 环路滤波 |
2.2.6 熵编码 |
2.3 H.265/HEVC编解码并行处理 |
2.3.1 概述 |
2.3.2 图像组(GOP)并行 |
2.3.3 帧(Frame)级并行 |
2.3.4 Slice级并行 |
2.3.5 Tile级并行 |
2.3.6 CTU级并行 |
2.4 H.265/HEVC解码模块分析 |
2.4.1 H.265/HEVC解码基本流程 |
2.4.2 H.265/HEVC各解码模块分析 |
2.5 本章小结 |
第三章 基于多线程负载均衡的DBF+SAO联合并行环路滤波 |
3.1 H.265/HEVC标准中的环路滤波概述 |
3.2 H.265/HEVC标准中的去方块滤波 |
3.2.1 去方块滤波的数据处理特点 |
3.2.2 去方块滤波的可并行性 |
3.3 像素样本自适应补偿SAO |
3.4 现有并行滤波方案分析 |
3.5 DBF+SAO联合并行环路滤波 |
3.5.1 并行环路滤波的设计 |
3.5.2 并行环路滤波的实现 |
3.6 本章小结 |
第四章 基于CTU的 HEVC帧内/帧间融合并行解码算法 |
4.1 概述 |
4.2 CTU级 HEVC并行解码算法 |
4.2.1 现有方案分析 |
4.2.2 方案可优化分析 |
4.3 基于CTU的 HEVC帧内/帧间融合并行解码算法 |
4.3.1 算法理论设计 |
4.3.2 帧间CTU并行解码条件限制分析 |
4.3.3 算法具体实现 |
4.3.4 理论并行性能分析 |
4.4 本章小结 |
第五章 基于核心模块融合的HEVC并行解码算法 |
5.1 概述 |
5.2 HEVC解码器核心模块的融合并行处理 |
5.2.1 算法描述 |
5.2.2 算法时序分析 |
5.3 基于Tilera多核处理平台的HEVC解码平台优化 |
5.3.1 结合存储器优化的CABAC熵解码 |
5.3.2 结合单指令多数据SIMD的核心模块指令集优化 |
5.4 本章小结 |
第六章 实验与结果分析 |
6.1 实验环境与并行算法评估指标 |
6.1.1 实验多核硬件平台与开发环境MDE |
6.1.2 实验测试视频序列 |
6.1.3 实验评估指标 |
6.2 联合并行环路滤波实验与分析 |
6.3 基于CTU的帧内/帧间融合并行解码算法实验与分析 |
6.4 基于核心模块融合的HEVC并行解码算法实验与分析 |
6.5 基于Tilera多核处理平台的HEVC解码平台优化实验 |
6.6 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
附录1 攻读硕士学位期间撰写的论文 |
附录2 攻读硕士学位期间撰写的发明专利 |
致谢 |
(4)基于H.265/HEVC的高压缩率与低复杂度编码技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 研究现状 |
1.2.1 视频编码标准研究现状 |
1.2.2 高压缩率与低复杂度算法研究现状 |
1.3 本文的研究内容及主要贡献 |
1.4 论文的章节安排 |
第2章 高效视频编码标准H.265/HEVC简介 |
2.1 H.265/HEVC标准的发展历程 |
2.1.1 H.265/HEVC标准的提出 |
2.1.2 H.265/HEVC扩展标准 |
2.2 H.265/HEVC标准编码架构与关键技术 |
2.2.1 H.265/HEVC标准编码架构 |
2.2.2 H.265/HEVC关键技术 |
2.2.3 H.265/HEVC标准的编码结构 |
2.3 基于H.265/HEVC标准的编码器 |
2.3.1 x265简介 |
2.3.2 HM简介 |
2.4 本章小结 |
第3章 基于局部亮度直方图的场景切换检测算法 |
3.1 I Slice分析与视频的场景切换 |
3.1.1 I Slice对视频编码效率的影响 |
3.1.2 视频中的场景切换 |
3.2 算法提出动机 |
3.2.1 动机一:计算复杂度过高 |
3.2.2 动机二:全局亮度直方图性能较差 |
3.3 基于局部亮度直方图的场景切换检测算法 |
3.3.1 局部亮度直方图的获取 |
3.3.2 帧间内容变化测度 |
3.3.3 场景切换检测策略 |
3.3.4 算法流程图 |
3.4 实验结果及分析 |
3.4.1 测试条件与测试序列 |
3.4.2 算法性能评估 |
3.5 本章小结 |
第4章 基于局部亮度直方图的自适应帧类型决策算法 |
4.1 固定帧类型决策算法 |
4.1.1 Mini-GOP与标准兼容性拓展 |
4.1.2 基于Mini-GOP的帧类型决策流程 |
4.2 视频时序特性与帧类型 |
4.3 基于局部亮度直方图的自适应帧类型决策算法 |
4.4 实验结果及分析 |
4.4.1 测试条件与测试序列 |
4.4.2 算法性能评估 |
4.5 本章小结 |
第5章 面向H.265/HEVC的自适应四叉树深度预测机制 |
5.1 基于四叉树结构的CTU划分过程复杂度分析 |
5.1.1 最优CTU划分方式决策 |
5.1.2 编码复杂度分析 |
5.2 算法提出动机:CTU间时空相关性分析 |
5.3 自适应四叉树深度预测机制 |
5.3.1 相似区域标志 |
5.3.2 相似区域深度范围预测算法 |
5.3.3 非相似区域深度范围预测算法 |
5.3.4 算法流程图 |
5.4 实验结果及分析 |
5.4.1 测试条件与测试序列 |
5.4.2 算法性能评估 |
5.5 本章小结 |
总结与展望 |
参考文献 |
攻读硕士期间科研成果及科研工作 |
致谢 |
(5)基于视觉的机器人SLAM与物体检测一体化研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 视觉SLAM研究现状 |
1.2.2 物体检测研究现状 |
1.3 本文主要研究内容及章节安排 |
第二章 基于直方图反向投影的物体轮廓直线段检测 |
2.1 基于直方图反向投影的物体轮廓提取 |
2.1.1 图像增强 |
2.1.2 颜色空间选择 |
2.1.3 直方图反向投影方法研究 |
2.2 形态学处理 |
2.2.1 基本形态学处理 |
2.2.2 结构元素 |
2.2.3 处理结果 |
2.3 直线检测 |
2.3.1 霍夫直线检测 |
2.3.2 LSD直线检测 |
2.3.3 EDLines直线检测 |
2.3.4 直线检测结果 |
2.4 本章小结 |
第三章 基于轮廓拐点的相交轮廓边缘检测 |
3.1 图像边缘检测方法 |
3.1.1 边缘的定义和分类 |
3.1.2 边缘检测方法 |
3.1.3 检测结果 |
3.2 基于道格拉斯-普客算法的轮廓去噪、拟合处理 |
3.2.1 道格拉斯-普客算法 |
3.2.2 处理结果 |
3.3 基于Freeman链码描述的拐点检测算法 |
3.3.1 链码描述 |
3.3.2 拐点、非拐点和可疑拐点分类 |
3.3.3 可疑拐点判断 |
3.3.4 实验结果 |
3.4 轮廓的分离和提取 |
3.4.1 轮廓的分离 |
3.4.2 轮廓的提取 |
3.4.3 实验结果 |
3.5 本章小结 |
第四章 基于信息熵的特征点均匀化提取算法 |
4.1 基于信息熵的特征点均匀化算法 |
4.1.1 ORB特征点提取 |
4.1.2 信息熵 |
4.1.3 基于四叉树的特征点均匀化算法 |
4.1.4 基于信息熵的ORB特征点均匀化算法 |
4.2 实验结果 |
4.2.1 特征分布评价 |
4.2.2 特征点提取结果对比 |
4.3 本章小结 |
第五章 视觉SLAM与物体检测一体化实验与分析 |
5.1 改进的ORB-SLAM2 系统实验分析 |
5.1.1 评价标准 |
5.1.2 实验对比和分析 |
5.2 融合深度信息的复杂背景过滤 |
5.2.1 深度相机标定与配准实验 |
5.2.2 融合深度信息的复杂背景过滤 |
5.3 线段特征的使用 |
5.3.1 线段特征匹配 |
5.3.2 线段匹配对筛选 |
5.3.3 线段特征转点特征处理 |
5.4 机器人SLAM与物体检测一体化实验结果 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 研究内容总结 |
6.2 展望 |
参考文献 |
致谢 |
在学期间的研究成果及发表的学术论文 |
(6)基于TILE-Gx36多核处理器的HEVC多路视频并行编码技术的研究与应用(论文提纲范文)
摘要 |
abstract |
专用术语注释表 |
第一章 绪论 |
1.1 课题背景与研究意义 |
1.2 标准的演进与多核平台介绍 |
1.3 国内外研究现状 |
1.4 本文研究内容与结构安排 |
第二章 HEVC框架与关键技术 |
2.1 HEVC标准概述 |
2.2 HEVC编码框架 |
2.3 HEVC编码的数据结构 |
2.4 HEVC编码的关键技术 |
2.4.1 帧内预测 |
2.4.2 帧间预测 |
2.4.3 变换与量化 |
2.4.4 环路滤波 |
2.4.5 熵编码 |
2.5 HEVC并行单元 |
2.5.1 GOP级并行 |
2.5.2 帧级并行 |
2.5.3 Slice级并行 |
2.5.4 Tile级并行 |
2.6 参考软件x265 |
2.6.1 HM与 x265 比较 |
2.6.2 x265 编码流程 |
2.7 本章小结 |
第三章 基于CTU粒度并行算法的熵编码改进 |
3.1 概述 |
3.2 并行编码方案 |
3.2.1 WPP编码方案 |
3.2.2 帧内帧间联合WPP编码方案 |
3.3 CTU依赖性与负载均衡分析 |
3.3.1 CTU依赖性分析 |
3.3.2 CTU负载均衡性分析 |
3.4 CTU粒度并行编码方案 |
3.4.1 CTU节点关系的数学模型 |
3.4.2 CTU粒度并行算法设计 |
3.4.3 降码率的熵编码优化方案 |
3.4.4 方案流程 |
3.5 本章小结 |
第四章 CTU预测过程中的并行方案研究 |
4.1 概述 |
4.2 HEVC预测过程 |
4.2.1 帧内预测最佳模式判决 |
4.2.2 帧间预测最佳模式判决 |
4.3 CTU预测过程中并行依赖关系和并行度分析 |
4.3.1 基于块的并行预测算法 |
4.3.2 DAG分析CTU预测过程中的理论并行度 |
4.3.3 优先级队列和四叉树扫描方式 |
4.4 改进的CTU预测过程中的并行方案 |
4.4.1 预测过程中的PU并行设计 |
4.4.2 算法流程及框图 |
4.5 本章小结 |
第五章 多路编码系统的多层次并行设计 |
5.1 概述 |
5.2 多粒度融合并行方案 |
5.2.1 算法的技术原理 |
5.2.2 核调度策略 |
5.3 多路编码系统的多层次并行设计 |
5.3.1 多路编码系统的目标场景 |
5.3.2 多路流间核分配策略 |
5.4 算法框图与流程分析 |
5.4.1 算法框图 |
5.4.2 算法流程分析 |
5.5 本章小结 |
第六章 实验结果与分析 |
6.1 实验环境与算法评估指标 |
6.1.1 实验平台与实验操作介绍 |
6.1.2 并行评估标准 |
6.2 CTU粒度并行编码方案实验结果 |
6.2.1 实验设计 |
6.2.2 实验结果 |
6.2.3 实验结果分析 |
6.3 CTU预测过程中的并行方案实验结果 |
6.3.1 实验设计 |
6.3.2 实验结果 |
6.3.3 实验结果分析 |
6.4 多路编码系统的多层次并行实验结果 |
6.4.1 实验设计 |
6.4.2 实验结果 |
6.4.3 实验结果分析 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
附录1 攻读硕士学位期间撰写的论文 |
致谢 |
(7)基于深度学习的视频编码技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景 |
1.2 数字视频压缩基础 |
1.2.1 视频压缩的基本原理 |
1.2.2 视频编码标准的基本框架 |
1.2.3 数字视频编码标准的发展历程 |
1.3 HEVC标准的关键技术 |
1.3.1 块划分方式 |
1.3.2 帧内预测 |
1.3.3 帧间预测 |
1.3.4 环路滤波 |
1.4 基于深度学习的视频编码 |
1.5 本文课题的提出及其主要贡献 |
第2章 基于深度学习的视频编码技术的研究现状 |
2.1 帧内预测技术的研究现状 |
2.2 帧间预测技术的研究现状 |
2.3 环路滤波技术的研究现状 |
2.3.1 基于深度学习的环路滤波技术的研究现状 |
2.3.2 环路滤波并行优化的研究现状 |
2.4 本章小结 |
第3章 基于多尺度卷积神经网络的帧内预测 |
3.1 问题的提出 |
3.2 模式依赖的帧内平滑滤波 |
3.2.1 MDISF原理及分析 |
3.2.2 MDISF的滤波器设计 |
3.2.3 MDISF集成到HEVC |
3.2.4 MDISF的实验结果 |
3.3 基于多尺度卷积神经网络的帧内预测 |
3.3.1 MSCNN的网络结构 |
3.3.2 MSCNN的训练策略 |
3.3.3 MSCNN集成到HEVC |
3.4 实验结果与分析 |
3.4.1 实验配置 |
3.4.2 与HEVC的性能比较 |
3.4.3 与其他方法的性能比较 |
3.4.4 网络深度分析 |
3.4.5 编解码时间分析 |
3.5 本章小结 |
第4章 基于深度神经网络的帧间预测 |
4.1 问题的提出 |
4.2 NNIP的网络结构 |
4.2.1 关系估计网络 |
4.2.2 组合网络 |
4.2.3 深度提纯网络 |
4.3 NNIP的训练策略 |
4.4 NNIP集成到HEVC |
4.5 实验结果与分析 |
4.5.1 实验配置 |
4.5.2 与HEVC的性能比较 |
4.5.3 与其他方法的性能比较 |
4.5.4 编解码时间分析 |
4.6 本章小结 |
第5章 基于卷积神经网络的环路滤波及其并行优化 |
5.1 基于卷积神经网络的环路滤波 |
5.1.1 CNNF的网络结构 |
5.1.2 CNNF的训练策略 |
5.1.3 CNNF集成到HEVC |
5.1.4 实验结果与分析 |
5.2 基于GPU的环路滤波并行优化 |
5.2.1 问题的提出以及算法的整体框架 |
5.2.2 GPU端 Deblocking的并行结构 |
5.2.3 GPU端 SAO的并行结构 |
5.2.4 内存优化管理 |
5.2.5 实验结果与分析 |
5.3 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的学术论文及研究成果 |
致谢 |
个人简历 |
(8)基于分形理论的快速图像压缩算法(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 图像压缩算法本质与分类 |
1.3 分形产生和定义 |
1.4 基于分形理论的图像编码的发展现状 |
1.5 图像压缩算法性能评估 |
1.6 内容安排 |
第二章 分形图像编码理论相关介绍 |
2.1 基于分形理论编码的基本概念 |
2.1.1 仿射变换 |
2.1.2 度量空间 |
2.1.3 压缩映射定理 |
2.1.4 迭代函数系统,不动点定理,拼贴定理 |
2.2 基本分形算法的实现 |
2.2.1 引言 |
2.2.2 局部迭代函数系统 |
2.2.3 基本分形编码 |
2.2.4 实验分析 |
2.3 本章小结 |
第三章 基于迭代控制搜索策略的分形图像编码 |
3.1 引言 |
3.2 缩减值域池规模 |
3.3 更换相似度衡量方式 |
3.3.1 相关系数理论基础 |
3.3.2 等距采样图像降维 |
3.4 更换搜索策略 |
3.4.1 缩减码本空间 |
3.4.2 迭代控制搜索策略 |
3.5 算法编码/解码具体步骤 |
3.6 实验分析 |
3.7 本章小结 |
第四章 基于自适应阈值四叉树分块的分形图像编码 |
4.1 引言 |
4.2 固定阈值四叉树分块方法 |
4.3 自适应阈值四叉树分块方法 |
4.4 具体编码/解码步骤 |
4.5 实验分析 |
4.6 本章小结 |
总结与展望 |
总结 |
展望 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
附件 |
(9)面向实时视频压缩的HEVC编码算法研究及系统实现(论文提纲范文)
摘要 |
abstract |
缩略语 |
第一章 绪论 |
1.1 课题研究背景及意义 |
1.2 HEVC关键技术和特点 |
1.2.1 HEVC基本框架 |
1.2.2 HEVC四叉树划分结构 |
1.2.3 精确的帧内预测技术 |
1.2.4 高效的帧间预测技术 |
1.2.5 样点自适应补偿技术 |
1.2.6 并行编码技术 |
1.3 国内外研究现状 |
1.3.1 HEVC的快速算法 |
1.3.2 感知视频编码算法 |
1.3.3 全景视频编码算法 |
1.4 论文主要工作及结构安排 |
1.4.1 论文主要研究工作 |
1.4.2 论文结构安排 |
第二章 基于逻辑回归分类器的帧内CU划分模式判决算法 |
2.1 引言 |
2.2 研究背景 |
2.3 HEVC帧内CU划分大小的统计及分析 |
2.4 基于逻辑回归分类器的帧内CU划分模式判决算法 |
2.4.1 算法介绍 |
2.4.2 特征选择 |
2.4.3 算法流程 |
2.5 实验结果及分析 |
2.5.1 实验条件 |
2.5.2 本章方法性能分析 |
2.6 本章小结 |
第三章 基于聂曼-皮尔逊准则的帧间编码模式判决算法 |
3.1 引言 |
3.2 问题描述及研究背景 |
3.3 HEVC帧间模式选择的统计及分析 |
3.3.1 PU预测模式的分布 |
3.3.2 CU划分深度的分布 |
3.4 基于聂曼-皮尔逊准则的帧间编码模式判决算法 |
3.4.1 基于聂曼-皮尔逊准则的帧间PU模式判决算法 |
3.4.2 基于聂曼-皮尔逊准则的帧间CU划分模式判决算法 |
3.4.3 基于聂曼-皮尔逊准则帧间编码模式判决算法的非参数估计 |
3.4.4 算法流程 |
3.5 实验结果及分析 |
3.5.1 实验条件 |
3.5.2 SKIP模式快速选择算法和CU划分快速选择算法独立性能测试 |
3.5.3 基于聂曼-皮尔逊准则的帧间编码模式判决算法整体性能测试 |
3.5.4 基于聂曼-皮尔逊准则的帧间编码模式判决算法与其他方法的性能对比 |
3.6 本章小结 |
第四章 基于闭环感知模型的HEVC自适应率失真优化算法 |
4.1 引言 |
4.2 研究现状 |
4.3 基于感知模型的RDO算法的总体架构 |
4.4 基于视频编码运动矢量的运动注意力模型 |
4.4.1 视频编码中基于块匹配运动估计方法 |
4.4.2 基于最大后验概率估计的运动矢量场优化 |
4.4.3 基于运动矢量场的运动注意力模型 |
4.5 基于视频编码交流能量的失真敏感度模型 |
4.6 内容自适应感知率失真优化方法 |
4.7 实验结果与分析 |
4.7.1 实验条件 |
4.7.2 本章方法的客观性能评估 |
4.7.3 本章方法的主观性能评估 |
4.7.4 本章方法与其他方法性能对比 |
4.8 本章小结 |
第五章 基于注视点引导的全景视频编码算法 |
5.1 引言 |
5.2 视觉注视点预测及全景视频编码研究现状 |
5.3 基于三维卷积神经网络的全景视频注视点预测 |
5.3.1 全景视频注视点训练数据库及其分析 |
5.3.2 全景视频注视点预测的网络结构概述 |
5.3.3 视觉注视点特征提取 |
5.3.4 注视点位移预测 |
5.4 全景视频注视点引导的自适应率失真优化算法 |
5.5 实验结果与分析 |
5.5.1 实验测试条件 |
5.5.2 全景视频注视点预测方法的性能评估 |
5.5.3 注视点引导的全景视频编码性能评估 |
5.6 本章小结 |
第六章 HEVC超高清实时编码算法优化与设计实现 |
6.1 引言 |
6.2 x265 编码器模式判决流程 |
6.2.1 x265 编码器复杂度分析 |
6.2.2 x265 编码器模式判决流程分析 |
6.3 x265 编码器模式判决优化 |
6.3.1 基于SATD代价的RDO计算次数减少算法 |
6.3.2 SKIP模式提前选择算法 |
6.3.3 帧内模式快速选择算法 |
6.3.4 算法流程 |
6.4 多核处理器上超高清视频编码的并行优化 |
6.5 HEVC超高清实时编码系统的设计与实现 |
6.5.1 HEVC超高清实时编码系统的整体架构 |
6.5.2 基于输入缓冲区的视频编码速度自适应调整策略 |
6.5.3 基于输出缓冲区的码率自适应调整策略 |
6.6 实验结果与分析 |
6.6.1 高清视频编码测试 |
6.6.2 超高清视频编码测试 |
6.6.3 超高清视频实时编码系统测试 |
6.7 本章小节 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
攻读博士学位期间的科研成果及参与的项目 |
(10)基于小波及分形码去噪算法的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究的背景与意义 |
1.2 图像去噪技术的研究现状 |
1.3 本文的主要安排 |
第二章 图像去噪技术的相关理论 |
2.1 小波变换 |
2.1.1 理论概述 |
2.1.2 阈值去噪 |
2.2 偏微分方程 |
2.2.1 基于PM模型的图像去噪 |
2.2.2 基于MCD模型的图像去噪 |
2.3 分形码理论 |
2.3.1 分形编码 |
2.3.2 分形解码 |
2.4 本章小结 |
第三章 小波包与偏微分方程相结合的图像去噪算法 |
3.1 PM模型与MCD模型相结合的去噪模型 |
3.2 新去噪模型的提出 |
3.3 实验结果与分析 |
3.4 本章小结 |
第四章 基于分形码的图像去噪算法 |
4.1 算法实现 |
4.1.1 层次化分类 |
4.1.2 四叉树分块 |
4.2 合理性分析 |
4.3 实验结果与分析 |
4.4 本章小结 |
第五章 结论与展望 |
5.1 研究总结 |
5.2 工作展望 |
参考文献 |
硕士学位期间发表论文 |
四、自适应四叉树分形图像编码并行算法(论文参考文献)
- [1]“分形视距”纹理压缩与彩色多边形纹理集成的三维模型可视化方法[D]. 包馨. 桂林理工大学, 2021(01)
- [2]基于多核处理平台的HEVC解码核心模块并行处理的算法设计与实现[D]. 李毅. 南京邮电大学, 2020(03)
- [3]基于计盒维数的小波分形四叉树医学图像编码研究[J]. 杜洋,范医鲁,曲新亮. 中国医疗设备, 2020(10)
- [4]基于H.265/HEVC的高压缩率与低复杂度编码技术研究[D]. 段堃. 北京工业大学, 2020
- [5]基于视觉的机器人SLAM与物体检测一体化研究[D]. 贾兴伟. 南京航空航天大学, 2020(07)
- [6]基于TILE-Gx36多核处理器的HEVC多路视频并行编码技术的研究与应用[D]. 尹传伟. 南京邮电大学, 2019(02)
- [7]基于深度学习的视频编码技术研究[D]. 王洋. 哈尔滨工业大学, 2019(01)
- [8]基于分形理论的快速图像压缩算法[D]. 李祥鹏. 华南理工大学, 2019(06)
- [9]面向实时视频压缩的HEVC编码算法研究及系统实现[D]. 胡强. 上海交通大学, 2019(06)
- [10]基于小波及分形码去噪算法的研究[D]. 伍子锴. 南京信息工程大学, 2019(04)