Skip to content

使用智谱AI的在线 CogView4 模型,想让它生成一幅图片,结果倒是符合期望,可惜图片上的文字并没有生成指定的中文,而是全英文的。

未测试开源版本,但在线版本应该比开源的理论上更强大。

目测似乎是提示词过于复杂了,无法理解或遵循,还是内部仍是英文优先?

智谱AI 入口 https://bigmodel.cn/trialcenter/modeltrial

以下是提示词

请画一张图片:
### 整体布局
- 简洁卡通风格
- 图像分为两部分,左边为“OpenAI之前”,右边为“OpenAI之后”,中间用一个箭头(→)连接。
- 每部分包含两个场景(上:编码,下:修bug)

### 左边:OpenAI之前
1. **上半部分:开发者编码**
   - 背景:一个简单的办公桌,上面有一台老式电脑显示器。
   - 角色:一个卡通开发者(圆头),坐在电脑前,表情专注且有点困惑。
   - 文字:在开发者头上方的气泡或画面顶部写:“开发编码 - 2小时”。

2. **下半部分:开发者调试**
   - 背景:同样是办公桌和电脑,但开发者看起来疲惫、沮丧,双手抱着头,盯着电脑屏幕。
   - 角色:同样的卡通开发者,表情痛苦。
   - 文字:在开发者头上方的气泡或画面顶部写:“开发者修bug - 6小时”。

### 右边:OpenAI之后
1. **上半部分:ChatGPT生成代码**
   - 背景:同样是办公桌和电脑,但电脑屏幕旁可能有一个提示ChatGPT的图标。
   - 角色:开发者坐在电脑前,表情轻松或惊讶,表示代码已经由ChatGPT生成。
   - 文字:在开发者头上方的气泡或画面顶部写:“ChatGPT生成代码 - 5分钟”。

2. **下半部分:开发者调试**
   - 背景:办公桌和电脑,开发者看起来更加疲惫、绝望,双手抱着头。
   - 角色:同样的卡通开发者,表情更加痛苦。
   - 文字:在开发者头上方的气泡或画面顶部写:“开发者修bug - 24小时”。

实际生成的图片

测试个简单提示词效果不错

看来对于复杂多场景的目前至少文字嵌入支持还不到位,不过对应简单场景,尤其海边、广告之类的特别合适,效果很不错。