用 DeepSeek 写小说：直接写 vs 多角色扮演，差在哪

1860 字

9 分钟

用 DeepSeek 写小说：直接写 vs 多角色扮演，差在哪

2026-05-23

技术

LLM

/

DeepSeek

/

创作

/

多智能体

/

AI-写作

一直觉得用 LLM 写小说有个问题：所有角色的”声音”都是同一个模型发出来的，很难有真正的个性差异。

一个自然的想法是：把每个角色拆开，给每个角色单独的 system prompt，让他们各自扮演，然后轮流发言，把对话拼成一个场景。这跟直接给一个 prompt 让模型写完有什么本质区别？

我做了一个实验来对比两者。

实验设计#

场景选了一个悬疑问询场景——暴风雪夜晚，废弃别墅里发现尸体，侦探问询四个嫌疑人/证人。角色设定如下：

旁白：只负责场景描写和动作描述，不写台词，电影感短句风格
林浩（侦探）：40 岁刑警，说话简洁有力，每次输出动作+一两句台词
张薇（嫌疑人）：死者秘书，表面配合，实则惊恐，有隐瞒
陈默（嫌疑人）：死者合伙人，西装笔挺，冷静得反常，擅长反问
王老（证人）：老管家，说话迂回，用暗示方式透露线索

方式一（直接写作）：把背景和角色信息塞进一个 prompt，叫模型直接写 600-800 字的完整场景。

方式二（多角色扮演）：每个角色有独立的 system prompt。所有角色共享一个 story_log（对话历史），按 旁白 → 侦探 → 张薇 → 陈默 → 王老 的顺序轮流调用，每次调用前把已有的 story_log 作为 context 传入，跑 3 轮（共 15 次 API 调用）。

实现#

项目结构很简单：

1
novel-roleplay/
2
├── config.py          # 故事背景 + 角色 system prompt
3
├── direct_writer.py   # 方式一
4
├── roleplay_writer.py # 方式二
5
└── compare.py         # 主程序，rich 输出对比

多角色扮演的核心逻辑是维护一个共享的 story_log，每个角色轮到时看到完整的故事进展：

1
story_log: list[dict] = [
2
    {"role": "user", "content": f"【故事背景】\n{STORY_PREMISE.strip()}\n\n现在开始按顺序写作，你是其中一个参与者。"},
3
]
4

5
for round_num in range(1, ROLEPLAY_ROUNDS + 1):
6
    for role_name in role_order:
7
        role_cfg = ROLES[role_name]
8
        context_msgs = list(story_log)
9
        context_msgs.append({"role": "user", "content": f"现在轮到【{role_name}】发言。请继续推进故事，紧接上文内容。"})
10

11
        text, usage = _call(client, role_cfg["system"], context_msgs)
12
        # 把这段发言追加进共享 story_log，下一个角色能读到
13
        story_log.append({"role": "assistant", "content": f"【{role_name}】{text}"})

每次调用用 deepseek-chat 模型，temperature=0.92，单次最多 300 tokens。

DeepSeek API 完全兼容 OpenAI Python SDK，只需要换 base_url：

1
from openai import OpenAI
2

3
client = OpenAI(
4
    api_key=os.environ["DEEPSEEK_API_KEY"],
5
    base_url="https://api.deepseek.com",
6
)

结果#

跑一次的数据：

指标	直接写作	多角色扮演
字数（含标点）	1128	1673
API 调用次数	1	15
耗时	11.1s	26.4s
输入 tokens	162	10836
输出 tokens	698	1062
总 tokens	860	11898

token 消耗差了将近 14 倍。输出 tokens 只差了 50%，大头在输入 tokens——差了 67 倍。

每次调用都携带完整的 story_log。第 1 轮第 1 个角色调用时 story_log 只有背景信息，没什么压力。但到第 3 轮第 5 个角色时，story_log 里已经有 14 段角色发言，加上背景和本轮提示，每次调用的 prompt 就有几千 token。15 次调用累计下来，输入 token 急剧膨胀。每个角色想”读懂当前进展”，就必须看到前面所有的输出，结构决定的。