设计AI短剧的分镜,本质上是在“用文字生成视频”和“可控的视觉叙事”之间架一座桥,传统的分镜需要画出来,但AI短剧的分镜核心是视觉化提示词序列和镜头切换逻辑。
以下是专为AI短剧(如使用Runway Gen-2, Pika, Sora, Kling, 即梦等工具)设计的实操分镜设计教程,共分四步。
第一步:剧本的“AI化转译” (基础)
这是关键前提,AI理解不了“很感人”,但能理解“特写镜头,眼眶含泪,嘴角微微抽动”。
操作:
- 拆解剧本:把剧本拆成一个个3-8秒的独立镜头。
- 标注情绪:明确每个镜头的情绪关键词(如:悬疑、温馨、紧张、迷茫)。
- 确定主体:镜头里核心要展示什么?(是人、是物、还是环境空镜?)
第二步:设计“三要素分镜表” (核心实操)
大部分失败的AI短片,问题出在镜头与镜头之间缺乏逻辑,你需要制作一个表格,包含以下三个核心维度:
| 镜头编号 | 画面描述 (主提示词) | 运镜/景别 (风格提示词) | 镜头时长 | 关键道具/动作 (细节) | 生成工具备注 |
|---|---|---|---|---|---|
| 001 | 女主角在雨夜推开生锈的铁门 | 低角度,广角镜头,由前向后缓慢推进 | 4s | 铁门上的裂纹,雨滴砸在肩头 | 适合用Kling |
| 002 | 女主角看到房间中央的旧钢琴 | 人物背部中景(过肩视角),定机位 | 3s | 光线从窗外打进来,灰尘漂浮 | 适合用Runway |
| 003 | 女主角的手指按下第一个琴键 | 超特写,微距,平移 | 3s | 琴键上扬起的灰尘,指纹 | 适合用Pika |
| 004 | 琴键发出声音,彩色光波扩散 | 全景,围绕着角色旋转180度 | 5s | 场景从破旧变为辉煌 | 适合用Sora |
设计技巧:
- 镜头 001 必须是“定场镜头”:让AI清晰认识故事发生的世界,不要一开始就特写。
- 镜头 002-003 遵循“视线引导”:人物看什么,下一个镜头就给什么。
- 镜头 004 需要“语义跳跃”:AI很难处理复杂的连续动作,用“剪切”代替“动作过度”,人物抬手 -> 画面切 -> 手已经在某个位置了。
第三步:为分镜编写“AI可理解的指令”
不要写长句子,写关键词块,使用逗号隔开,保持语义清晰。
错误分镜描述:
女主角很难过,她走在街上,想起以前的事。
正确分镜描述 (Prompt结构):
镜头 005 (特写):
- 主体:年轻女性,眼眶微红,眼神哀伤。
- 环境:繁华都市的霓虹灯下,面部光影闪烁。
- 动作:低头看手机,但屏幕是黑的。
- 画风/运镜:cinematic, close-up, shallow depth of field, soft focus on background, slow push in. (电影感,特写,浅景深,背景虚化,缓慢推进)
第四步:节奏控制与“起承转合”
AI短剧每个人物的镜头时长建议在 3-6秒 之间,过长AI容易生成“漂移”或“变形”,分镜的节奏设计如下:
- 开场 (1-3个镜头):建立环境与人物常态。
空镜 (城市清晨) -> 中景 (闹钟响了) -> 特写 (手按掉闹钟)。
- 发展 (4-10个镜头):展示冲突与反应。
- 交替使用“动作镜头”和“反应镜头”。
- A:中景 (主角发现手机不见了) —— B:特写 (主角紧锁眉头,四处张望) —— C:全景 (主角在慌乱的人群中奔跑)。
- 高潮 (2-4个镜头):放大情绪与形式感。
- 可以使用升格镜头 (Slow Motion) 来放大情绪。
- 使用极端景别 (大特写或大远景)。
- 结局 (1-2个镜头):留白或反转。
使用固定机位,留出至少4秒给观众回味。
实战案例:一个15秒的AI短剧分镜
故事梗概:一个宇航员在水底发现了一把椅子。
| 编号 | 景别 | 画面描述 (给AI的Prompt) | 运镜 | 用途 |
|---|---|---|---|---|
| 1 | 全景 (天地) | 荒凉的红色星球表面,远处是巨大的地球在升起 | 固定机位,风沙特效 | 建立世界观 |
| 2 | 中景 (人) | 身穿白色宇航服,面罩反光,慢步走向镜头 | 从背后向前横移 (Dolly) | 引出角色 |
| 3 | 近景 | 宇航员脚下,踩到了一片水洼,水波震动 | 俯拍,微距 | 细节铺垫 |
| 4 | 全景 (反转) | 世界突然转场为水底,阳光透过水面,有气泡 | 非连贯转场,磁吸效果 | 惊喜点 (高潮) |
| 5 | 中景 (物) | 一把老旧的红色木椅子,安静地沉在水底 | 围绕椅子慢速环绕 | 结局 (留白) |
3个必须避免的坑
- 不要写“他走到桌子前”:AI会生成扭曲的移动,改为“前1秒:他站着,后1秒:他坐在桌前”(通过两个分镜解决)。
- 不要写太多“中文对话”:AI视频生成工具目前对中文字幕或物体上的汉字支持很差,对话部分后期配音,不要生成在画面中。
- 景别要极简且明确:AI很难理解“中近景”,直接用“Close-up (特写)”或“Wide shot (远景)”会更容易控制。

