计算机论文哪里有?本文提出了一种剪纸图像自动生成算法,不仅实现了高质量的剪纸图像自动生成,还成功地将图像放大到更高的分辨率,为剪纸艺术的数字化和传承开辟了新的途径。
第1章 绪论
1.2.1 计算机生成剪纸图像的研究
在过去的十至二十年中,计算机领域关于剪纸图像的研究取得了显著的发展,其研究重点也随着时间的推移而变化。 起初,研究主要集中在使用数学方法来表达图形元素,用于图案制作或设计更多剪纸纹样。图案制作的重点通常是常见的剪纸花纹[24]或者与自然界相关的图案[25,26],研究侧重于如何精确地用数学语言来描述这些复杂的图形和模式,从而能够由计算机精确地重现。与此同时,研究也在逐渐扩展到分类检索[27]、特性分析[28]等数字化研究。
当前,最受关注的研究领域是将照片转换成剪纸风格的技术。这涉及到多个关键技术,包括边缘检测、图像分块、特征点检测,风格迁移、图像翻译等。这些技术能够在保留原始图像重要特征的基础上,将其转换为具有剪纸风格的艺术作品。
基于边缘检测的剪纸图像生成方法[10]首先使用图像分割的方法去除图像背景,然后使用canny算子[29]对图像进行边缘检测,经过腐蚀、膨胀处理得到边缘平滑的剪纸效果图像。
第3章 基于GAN的剪纸图像生成方法
3.1 问题概述
我们将人脸照片域和人脸剪纸域分别表示为X和Y。给定一个人脸照片图像 x∈X和它对应的人脸剪纸图像y∈Y,本文提出了CutGAN,希望通过模型的对抗训练,学习到一种将x映射到Y中的方法G:xy。具体来说,我们希望提供一张人脸照片后,该模型能够生成一张剪纸风格的图像,该图像能够反映照片中的一些重要特征,例如发型、性别、是否戴眼镜、脸型、五官形状及其相对位置等。
手工剪纸制作过程中,手艺人注重对重要特征的刻画,并对不同目标群体应用不同的形变夸张。例如,小孩的额头占比比大人更大,女性的脸型比男性的更柔和。由此可见,剪纸中的形变夸张不是完全随机的,而是有据可循的。为了近似手工剪纸的特征刻画过程,我们设计了一个迁移学习模型,其中一部分参数被固定。该模型将个人特征,如性别和是否戴眼镜,显式地融入到生成过程中。该模型的生成器采用编码器-解码器结构,其中编码器包括两个分支,一个是固定编码器Efi,另一个是灵活编码器Efl。这两个分支通过一个融合模块连接到解码器F。鉴别器D的输入为 (x, y) 或 (x, G(x)),其用于计算对抗损失。该模型的损失函数还包括 L1损失和平均脸损失。该模型的具体设计细节详见图3-1。
第5章 实验设计与结果分析
5.1 实验环境
本章采用以下实验环境进行训练:使用一台Intel Core I7-12700主机,具有8核,主频为4.9 GHZ,主机内存为128G,一块GeForce RTX 3050显卡。操作系统为Ubuntu,深度学习框架为PyTorch 1.7。
5.2 实验数据集
5.2.1 照片-剪纸数据集
我们使用了人脸照片图像和剪纸图像一一对应的数据集进行模型的训练,该数据集包括891对人脸照片和剪纸艺术家根据照片创作的剪纸(本文中,这些剪纸图像被称为艺术家剪纸)。其中,艺术家剪纸都是完全正面的,但人脸照片不能保证人物视线平视,可能是斜侧面拍摄。我们将照片和剪纸图像进行预处理,构成了人脸-剪纸数据集,然后,将数据集随机分为822对训练数据和69对测试数据。
对每幅人脸照片图像、剪纸图像进行预处理步骤如下:首先,我们使用Dlib[89]库提供的人脸提取器检测人脸正面图像和剪纸图像中的68个人脸特征点,并计算第1个和第17个特征点的横坐标之差,得到脸宽W。接着,我们计算第1个和第17个特征点横坐标的均值以及纵坐标的均值,得到中心点C的横坐标和纵坐标。最后,在人脸正面图像和剪纸图像上,我们以点C为中心裁剪出边长为2.5W的正方形,并将其大小调整为512×512,得到大小均为512×512的人脸正面图像和剪纸图像。
为了增强模型的泛化能力,本文使用了数据增强技术,创建一个更加复杂和多变的数据环境,通过多样化的训练样本来模拟潜在的变化和扰动,从而提升模型对于未见数据的识别和处理能力。所采用的数据增强操作包括:水平翻转、 随机旋转、随机视角变换、随机调整对比度、饱和度和亮度。部分人物发型不对称,如斜刘海、偏分披肩发等,为了生成信息准确的剪纸,在数据增强时同时翻转照片和它对应的剪纸图像。照片图像被随机旋转一个角度,该角度的范围预先设定,以引入旋转不变性。图像的随机视角变换。这些变换模仿了图像捕捉过程中由于摄影角度差异所产生的几何扭曲,从而使模型能够适应实际应用中的各种拍摄条件。通过在一定范围内随机改变图像的颜色属性,模仿不同光照和色彩条件下的真实场景。
第6章 总结与展望
6.2 展望
我们认识到,为了进一步提升生成剪纸图像的质量与细节丰富度,仍需持续的努力与创新。未来的工作计划中,我们将着手扩展现有的剪纸数据集,增加样本的多样性和数量,以丰富模型的学习素材,从而提升模型对剪纸艺术风格的把握能力。特别地,针对剪纸图像中的服饰部分,我们预计通过细化模型结构和算法,使之能够更精准地捕捉并再现人物服饰的细节,如衣领的形状和饰品的佩戴情况。通过这些改进,我们期望模型不仅能复制剪纸艺术的整体风格,更能在细节上呈现出传统手工剪纸的精细与独特性。
目前,扩散模型在图像生成领域展现出了巨大潜力,其稳定性和可预测性在训练过程中表现优异,它提供了一个更稳定和可预测的训练过程,有可能缓解模式崩溃等问题。在未来的工作中,我们计划深入探索扩散模型在剪纸图像生成任务中的应用,探索扩散模型作为剪纸生成任务的替代方法的可行性。
参考文献(略)