泽兴芝士网

一站式 IT 编程学习资源平台

科普:神经网络中的GAN技术如何识别美女角色特征并生成新图?

AI在提取图片的关键信息并用于新图片的生成方面主要使用了图像语义分割技术和生成对抗网络(GAN)技术,包括两部分:

一、图像语义分割

图像语义分割是一种将图像中的像素划分为不同语义类别的技术,通常将图像中的像素标记为前景或背景,或者标记为具有特定语义的对象或场景。通过图像语义分割,AI可以识别出图像中不同区域的语义含义,并对其进行分割和分类。这样,AI就可以提取图片的关键信息并用于新图片的生成。

二、生成对抗网络(GAN)

生成对抗网络是一种基于深度学习的生成模型,其可以用于生成逼真的图像和其他类型的数据。GAN包括两个主要的组件:生成器和判别器。生成器可以生成与真实图像相似的图像,而判别器可以区分真实图像和生成的图像。通过反复训练生成器和判别器,生成器可以逐渐提高生成的图像质量,从而生成更加逼真的图像。

通过将图像语义分割技术和GAN技术结合起来,AI可以提取图片的关键信息,并将其用于新图片的生成。例如,在图像生成中,AI可以先利用图像语义分割技术对原始图像进行分割和分类,然后使用GAN技术生成新的图像。生成器可以基于原始图像的语义信息来生成新的图像,从而保持新图像与原图像的一致性和相关性。

但是在stable diffusion中,第一步可以省略。读者朋友们可以想象下为什么。

没错,因为我们生成图片的时候已经输入过信息了,例如:

我们输入了:

(8k,原始照片:1.2),最佳画质,超高分辨率,高度详细,精细复杂,杰作,超级详细,插画,高分辨率,柔和光线,一个女孩,(短发,棕色头发:1),详细的脸庞,看着观众,连衣裙,时尚裙装,美丽的女孩,可爱的,电影般的,夜店,DJ,舞池,闪光灯,VIP区,鸡尾酒,派对人士,音乐,鲜明的颜色,超高细节,hdr,锐利的对焦

以及负面提示:NG_DeepNegative_V1_75T,绘画,草图,(最差画质:2),(低画质:2),(普通画质:2),手势错误,低分辨率,普通画质,(单色),(灰度),皮肤斑点,青春痘,皮肤瑕疵,老年斑,错误的脚,

步数:30,采样器:Euler a,CFG比例:6.5,种子:1105298239,尺寸:512x768,模型哈希:fc2511737a,模型:
chilloutmix_NiPrunedFp32Fix,剪辑跳过:2,ENSD:31337

生成以下图片:


然后我们在stable diffusion利用图片生成文本工具,可以解析出上述信息,然后继续用于同类图片的生成:

未来,这种技术会进一步改良,加入新的推断模型,例如GPT,在更多应用场景广泛应用。

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言