pyVideoTrans 官网-开源免费的视频翻译配音软件-pyvideotrans github

使用智谱AI的在线 CogView4 模型，想让它生成一幅图片，结果倒是符合期望，可惜图片上的文字并没有生成指定的中文，而是全英文的。

未测试开源版本，但在线版本应该比开源的理论上更强大。

目测似乎是提示词过于复杂了，无法理解或遵循，还是内部仍是英文优先？

智谱AI 入口 https://bigmodel.cn/trialcenter/modeltrial

以下是提示词

请画一张图片：
### 整体布局
- 简洁卡通风格
- 图像分为两部分，左边为“OpenAI之前”，右边为“OpenAI之后”，中间用一个箭头（→）连接。
- 每部分包含两个场景（上：编码，下：修bug）

### 左边：OpenAI之前
1. **上半部分：开发者编码**
   - 背景：一个简单的办公桌，上面有一台老式电脑显示器。
   - 角色：一个卡通开发者（圆头），坐在电脑前，表情专注且有点困惑。
   - 文字：在开发者头上方的气泡或画面顶部写：“开发编码 - 2小时”。

2. **下半部分：开发者调试**
   - 背景：同样是办公桌和电脑，但开发者看起来疲惫、沮丧，双手抱着头，盯着电脑屏幕。
   - 角色：同样的卡通开发者，表情痛苦。
   - 文字：在开发者头上方的气泡或画面顶部写：“开发者修bug - 6小时”。

### 右边：OpenAI之后
1. **上半部分：ChatGPT生成代码**
   - 背景：同样是办公桌和电脑，但电脑屏幕旁可能有一个提示ChatGPT的图标。
   - 角色：开发者坐在电脑前，表情轻松或惊讶，表示代码已经由ChatGPT生成。
   - 文字：在开发者头上方的气泡或画面顶部写：“ChatGPT生成代码 - 5分钟”。

2. **下半部分：开发者调试**
   - 背景：办公桌和电脑，开发者看起来更加疲惫、绝望，双手抱着头。
   - 角色：同样的卡通开发者，表情更加痛苦。
   - 文字：在开发者头上方的气泡或画面顶部写：“开发者修bug - 24小时”。

实际生成的图片

测试个简单提示词效果不错

看来对于复杂多场景的目前至少文字嵌入支持还不到位,不过对应简单场景，尤其海边、广告之类的特别合适，效果很不错。

以下是提示词 ​

测试个简单提示词效果不错 ​

以下是提示词

测试个简单提示词效果不错