text prompt 场景5：头像-凯发体育app

2023年6月29日下午7:27 • 工具软件

注意事项

在介绍 img2img 的应用前，我想强调一下：

不要在 discord midjourney 公开群上传自己的照片！这样你的照片会被公开群里的所有人看见。建议使用 midjourney bot。
另外，非 pro 付费会员，生成的图片都会被其他会员看见。但你可以在生成完后，删掉生成的图片。如果还不知道如何使用 bot ，及删除照片，请看基本操作篇。
img2img 的操作我就不过多赘述了。如果你还不太清楚，可以看基本操作篇，以及 stock photo 那篇。

3d 卡通头像

第一个要分享的是卡通头像。首先跟大家强调下：

我基本上把国内国外的生成头像教程都看过，并试过一遍，还跟 midjourney 社群的人也交流过。我的理解是，以目前 v5 的能力，不管你如何调整 prompt ，想用 img2img 方法生成一张非常像原图的图片，基本靠运气，即使用了前面介绍的技巧七方法，也只是提高概率。如果你有令头像非常像的方法，不妨通过 issue 分享给我，我会署下你的名字，并分享给大家。
各位在学习的过程中，如果发现生成的图片不像原图，也不需要气馁。这是正常的。
你可以通过我分享的方法，生成一张有原图神韵的卡通头像。注意肯定不会非常像原图。

在 prompt 里加上原图链接（建议使用证件照，或者背景比较单一的照片，这样成功率会高一些），然后用我前面提到的框架设计一个 prompt：

	prompt	解释
类型是什么？	portraits / avatar	如果你的原图是证件照，可以在 prompt 里加入「肖像」一词，或者「avatar 头像」。
主体是什么？	smiling cute boy, undercut hairstyle	这里可以是选填，你可以先不加这个描述，只填其余 prompt，然后如果生成的图片不像你。那你就在这里加点描述下你的头像的词，一般就是性别、样貌、发型、配饰（比如眼镜、耳环等）、表情等。注意，尽量挑特征比较强的部分输入，特征对了，生成的图片基本会有几份像。
背景是什么？	white background	我这里保留了证件照的白底，你可以加一些实际场景的背景，比如餐厅之类的。
构图是怎样的？	null	因为我们预先传了图片，图片是张证件照，所以不填
用什么镜头？	soft focus	柔焦是指摄影中，使用柔焦镜头，使得拍摄的影像既清晰又柔和的效果。一般多在拍摄人像的时候使用，我在 prompt 里加上这个，可以使照片更柔和。你也可以不加。
是什么风格？	3d render,pixar style	因为目标是生成 3d 照片，所以这里加了 3d render（3d 渲染），以及我喜欢的皮克斯风格
参数	—iw 2	iw 是一个文字和 img 权重参数。数值越大，就越像原图，关于这个值的介绍，可以看高级参数篇。

最后，还有三个技巧：

如果你生成的照片并不像预设的照片，可以在四张图里，挑一张比较像的，然后点 v（variation），让模型继续生成，再继续挑一张像一点的照片，然后继续生成新照片，直到出现一张比较像的。
第二个，我觉得很神奇，如果前两个方法你都试过了，你生成的图片还是跟原图不像，那就在 prompt 里加上「wear glasses（戴眼镜）」，真的很神奇，我只要加上戴眼镜就像非常多，如果你原图戴眼镜了，你试试在参数里加个 —no glasses，你会得到一张更不像你的图。
最后，就是多用一个参数，这个方法会在技巧八中展开说下。

本章最后，有我的证件照的案例。

技巧七：多参数同时使用

在使用 img2img 的方法生成头像时，我发现问题是「文字权重比图片权重高」，导致其生成的图片不像原图，iw 参数在 v5 里最多提升图片权重到 2，所以我就在想有没有可能进一步降低文字的权重。

然后我就试了下 s 参数，发现的确好了很多。

如果生成的图片还是不像，你可以在 —iw 2 基础上，再加一个参数 —s 200 ，注意同时用两个参数时，中间不要有逗号。我发现加了 s 参数之后的确像了很多，我个人猜测是 s 和 iw 连用会进步一削弱 text 的权重。

s 是控制生成图片的风格化程度。简单理解，这个值越低会更符合 text prompt 的描述，数值越高艺术性就会越强，但跟 text prompt 关联性就会比较弱。所以如果你生成的图还是不像，就加大这个值，比如调到 500。

我想通过这个案例告诉大家，多个参数一起使用，有可能会形成合力，进一步放大模型的能力。未来有新的参数能力，不妨也想想有没有可能一起用？

动漫风头像

与 3d 卡通头像一样，主要的修改是在图片风格上：

	prompt	解释
类型是什么？	portraits / avatar	继续使用相同描述
主体是什么？	smiling cute boy, undercut hairstyle	继续使用相同描述
背景是什么？	white background	继续使用相同描述
构图是怎样的？	null	继续使用相同描述
用什么镜头？	null	因为是漫画风，就不加柔光镜头了
是什么风格？	anime, studio ghibli	目标是制作动漫风的头像，所以这里加了 anime（动漫），然后加了吉卜力风格
参数	—iw 2 —s 500	注意同时用两个参数时，中间不要有逗号。

赛博朋克头像

这是我最喜欢的风格之一，也是只需要改一下风格和背景即可：

	prompt	解释
主体是什么？	cyberpunk robot face, holographic vr glasses, holographic cyberpunk clothing	加了脸的修饰，还有戴上 vr 眼镜，穿上赛博朋克风衣服
背景是什么？	neon-lit cityscape background	为了让图片更像是赛博朋克，就加了个霓虹灯城市背景，让其看起来更有赛博那味
是什么风格？	cyberpunk, by josan gonzalez	加了赛博朋克风格，以及我非常喜欢的赛博朋克画家 josan gonzalez

上面这几个头像 prompt 最后生成的头像是这样的，坦率地说，我已经尽力了，我的个人特征太少了，人也不帅，生成的图片，都有种东南亚人那味，感觉 midjourney 对亚洲人的理解还不是很行 😂

mj039

技巧八：使用 seed 参数对图进行二次修改

注意：这个技巧，我个人觉得未来潜力比较大，但目前 midjourney 的实现效果还比较一般，效果得不到保证。官方的社区的帮助文档也提到这个功能在 v5 非常不稳定。详细可以看看我整理的 midjourney 官方 faq 一章。

你可能遇到类似这样的场景：

你输入一段 prompt，机器生成了 4 张图片
你看了下4张照片，发现其中有一张还行，但其余不是很满意，然后改了下 prompt，机器又生成了一些
但这次生成的照片你都不满意，你就很烦恼为何会这样
然后你就像为啥不能在第一次生成图上做修改呢？

基于某一次生成的结果进行二次 prompt 修改，理论上我认为是可以的，以赛博朋克头像为例，我先用上述 prompt 生成了四张图片，然后在消息的右上角点击 emoji 按钮（下图1），然后再输入框里（下图2）输入 envelope，然后点击信封 emoji（下图3），接着 bot 就会将 seed 号码发给你。

mj040

然后我修改上面的赛博朋克头像的 prompt，将其背景改为 china town，此时需要注意：

新的 prompt 并不是只改 background，你需要将之前的 prompt 都带上。
prompt 仅修改 background 的部分。
最后带上 seed 参数。

以下是我的案例：

原 prompt：

{img url}  avatar, cyberpunk robot face, holographic vr glasses,holographic cyberpunk clothing, neon-lit cityscape background, cyberpunk, by josan gonzalez --s 500 --iw 1

新 prompt（seed 码只是示例，你要填写自己的 seed）：

{img url}  avatar, cyberpunk robot face, holographic vr glasses,holographic cyberpunk clothing, china town background, cyberpunk, by josan gonzalez --s 500 --iw 1 --seed 758242567

以下是生成的效果（左图为原图，右图是用了 seed 后生成的图），可以看到，背景的确换了，但人的外观也有点变化 😂

效果不是很好，但我觉得值得探索，这样能提高渐进优化的成功率：

mj041

技巧九：神秘的 blend 功能

这个技巧，说实话，我感觉不能称其为技巧，但这又是一个 midjourney 非常重要的 feature，所以在这里着重介绍一下。

这个功能使用起来非常简单，在 discord 输入框里 /blend，然后点击这个菜单：

mj057

之后你的输入框就会变成这样：

mj058

然后你就可以点击这两个框，然后选择你电脑上的照片，添加完成后，大喊一声「使用融合卡」（不是），然后点击回车：

mj059

然后 midjourney 就会生成这样牛逼的结果，左边是融合钢铁侠，右边是融合巴斯光年：

mj061

这个功能我第一次看到时，我是非常震惊的，以为是小时候看游戏王里主角们使用「融合卡」的那种效果。可惜并不是，这个功能非常不稳定，仅有在满足多个未知条件才能达到上述的效果。

我本来打算用这个方法用于生成头像，但我发现只要用自己的照片，融合其他风格的照片，效果都不太好，目前实验下来效果最好的是名人头像，我的感觉是因为 midjourney 喂了不少名人的头像给模型，所以这种融合的效果都很好。

但我觉得它真的很适合做头像，将自己的头像跟另一张图片融合一下，就能生成一张不错的图，方便又快捷。可惜目前这个功能感觉还不太好用。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/yun238407.html

参数生成

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

上一篇 2023年6月29日

下一篇 2023年6月29日

meta 如何微调：关注有效数据集

meta 如何微调：关注有效数据集 meta ai 团队关于如何微调 llm 的第三篇文章，主要探讨如何通过精细化数据集来提高大型语言模型（llms）的性能，包括全参数精细化（f…

工具软件 2024年9月20日
工具软件

polymet ：ai 生成前端界面

polymet ：ai 生成前端界面 yc 投了一个类似v0 的前端代码生成项目 polymet。这个比 v0 多了很多很实用的功能对设计的还原也很好。自定义主题色、字体、圆角…

2024年9月20日
工具软件

clapper app：ai 剪辑工具

clapper app：ai 剪辑工具非常强的网页端 ai 生成和视频剪辑工具。接入了 ai 视频需要的各种 api，包括图片生成、llm、语音生成、音乐生成、视频生成。时间轴直…

2024年8月31日
工具软件

the ai scientist：可以进行自主科学发现和论文撰写的 agents

the ai scientist：可以进行自主科学发现和论文撰写的 agents sakana ai 宣布开发了一个名为 “the ai scientist” 的系统，它能够自动化…

2024年8月31日
工具软件

ideogram 发布了 2.0 图像生成模型

ideogram 发布了 2.0 图像生成模型图像生成质量大幅提高，产品易用性改善，最强的文字生成能力。尝试了一下发现真的很离谱，不只是文字生成这么简单，可以实现复杂排版搭配色彩…

2024年8月31日
工具软件

user evaluation：ai 帮助进行用户研究

user evaluation：ai 帮助进行用户研究 user evaluation 是一个利用人工智能（ai）来提升用户研究和数据分析的工具。功能特点 ai驱动的转录：支持5…

2024年5月20日
工具软件

wegic：即时设计团队推出的 ai 网页生成工具

wegic：即时设计团队推出的 ai 网页生成工具尝试了一下，wegic 这个 ai 网页生成工具也太好了。通过对话来生成和修改页面门槛确实低了很多。整体网站设计和 ip 都太…

2024年5月20日
工具软件

viva：首个可供使用的 dit 架构视频生成工具

viva：首个可供使用的 dit 架构视频生成工具海外产品 viva 发布了首个开放给全部用户使用的 sora 同架构视频生成模型，而且现阶段免费。支持文本生成视频、图片生成视频…

2024年5月20日
工具软件

ai音乐生成工具udio发布

ai音乐生成工具udio发布音乐生成应用udio正式发布比suno有更多的自定义能力。同时整个软件的设计也更偏向内容消费，不只是单纯的当工具在做。前谷歌deepmind的顶尖a…

2024年5月10日
midreal：ai小说生成

midreal：ai小说生成最近发现之前推荐过的 midreal ai 互动小说游戏更新了网页版本，不需要在 discord 里面使用了。这次升级非常强大，midreal已经不…

工具软件 2024年5月10日
工具软件

databricks 发布了新的可能是现在最强的开源模型 dbrx

databricks 发布了新的可能是现在最强的开源模型 dbrx 模型架构： 132b参数的moe模型，一共拥有16个专家，每个token激活4个专家，意味着有36b的活跃参数，…

2024年5月10日
mora：借助多智能体系统实现通用视频生成

mora：借助多智能体系统实现通用视频生成微软的一个视频生成项目 mora，利用 agents 来复原 sora 的能力，基本还原了 sora 所有的能力，目前支持生成 1024…

工具软件 2024年3月26日
omg: 在扩散模型中友好处理遮挡的个性化多概念生成

omg: 在扩散模型中友好处理遮挡的个性化多概念生成腾讯这个新研究，支持多角色多概念在一张图片中生成。以前的 id 或者概念保持项目只能将一个人还原在图片里面，有了这个项目以后就…

工具软件 2024年3月26日
工具软件

如何使用 haiper 免费制作 ai 视频

如何使用 haiper 免费制作 ai 视频 haiper ai 是一款突破性的 ai 视频生成器，最近进入市场，为用户提供了完全免费创建令人惊叹的逼真视频的能力。haiper a…

2024年3月17日
工具软件

assistive：视频生成工具

assistive：视频生成工具新的视频生成软件assistive，支持从文本和图像生成视频，从演示视频的流体内容和表现来看，我嗅到了svd的熟悉味道。同时推出的还有data-一…

2024年1月2日
工具软件

twitterbio：使用 ai 帮你生成推特简介

twitterbio：使用 ai 帮你生成推特简介使用 mixtral 和 gpt-3.5生成你的twitter 简介。项目已经开源，可以改一改生搞成国内的。

2023年12月26日
工具软件

tripo3d：ai生成3d模型

tripo3d：ai生成3d模型可以说是现在最强大的3d模型生成工具，一经发布就把几个老牌产品打趴了，支持从文字直接生成3d模型，也支持图片生成。

2023年12月26日
工具软件

creatify：从一条链接生成视频广告

creatify：从一条链接生成视频广告 creatify 这个产品，可以直接从你的产品页面获取内容，可以是凯发体育app官网可以是电商商品页，然后直接生成广告视频。优质广告的广告语口播和内容其…

2023年12月26日
工具软件

chatgpt 内容创建者手册：生成博客文章、脚本等

chatgpt 是 openai 打造的尖端语言模型，是内容创作领域的变革力量。这种先进的人工智能的实力在于它以令人印象深刻的速度无缝生成反映人类质量的文本。这种能力使其成为各种内…

2023年12月21日
midjoourney v6 beta 版本更新后缀加 –v 6就可以

midjoourney v6 beta 版本更新后缀加 –v 6就可以midjourney v6 特色亮点： 1、超高图像分辨率：v6 呈现 2048×2048 …

工具软件 2023年12月21日
谷歌发布了一个用于视频生成的大语言模型videopoet

谷歌发布了一个用于视频生成的大语言模型videopoet，这个有点意思。这个是一个专注于视频生成的多模态 llm 。支持各种视频生成功能以及音频生成，让 llm 来指导完整的视频生…

工具软件 2023年12月21日
w.a.l.t：谷歌视频生成模型

w.a.l.t：谷歌视频生成模型刚注意到李飞飞团队的这个视频生成模型w.a.l.t，这效果也太好了，感觉比 pika 1.0 还要好的多。清晰度和动作都非常好，特别是光剑打斗的那…

工具软件 2023年12月19日
工具软件

coffee：ai 生成前端组件

coffee：ai 生成前端组件这个ai生成前端代码的项目“coffee”有意思，可以生成干净可维护的前端组件代码。交互也很有意思，你只需要在代码对应位置加一个标签在里面写上对组…

2023年12月19日
工具软件

runway ：上线文字生成语音功能

runway ：上线文字生成语音功能尝试了一下英文的效果真的很好，感情很丰富自然。中文还是老问题，有外国人口音，这块可能不能指望外国公司了。这个功能可以选的语音模型非常多，可以都…

2023年12月19日
工具软件

midreal ai：ai生成小说

midreal ai：ai生成小说 midreal ai小说生成工具，与其他llm直接生成的所谓根本没有逻辑和情节的“小说”不同。这个产品可以生成真正的小说，逻辑性和创造力都在线，…

2023年12月19日