长篇小说创作,尤其是在百万字级别,是人类智力与耐力的双重挑战。当我们将目光投向AI辅助创作时,普遍的困境是:AI擅长短篇内容的生成,但在长线叙事的一致性、复杂度的管理和风格的稳定上,往往力不从心。它更像一个“随机生成器”,而非一个可控的“创作伙伴”。

本文将揭示一种全新的方法论——“上下文工程”。我们不再满足于简单的“提示词工程”,而是通过自定义概念工程,构建一套属于我们自己的“语言”和“世界模拟系统”,从而将AI的“混沌”转化为“秩序”,使其能够严格遵循我们的逻辑框架进行思考和生成,最终实现对百万字长篇小说的驾驭。

我们将这个过程比作“炼金术”,因为我们正在将原始的AI能力,通过精密的“配方”和“工作台”,提炼成连贯、宏大的叙事金砖。

阶段一:炼金术士的工作台 – 基于VS Code的快速原型

可以使用VS Code Copilot快速实现简单原型。通过精心设计的自定义指令和提示文件,我们将AI的能力模块化、流程化。

核心工作流与模块化目录结构 (v2.1)

我们设计了一个分层、模块化的目录结构,将长篇小说的各个维度映射为可管理的文件和文件夹。这不仅仅是文件组织,更是信息架构的体现。

MyNovel_World/
├── 0_world_state/          # 世界状态定义:小说的“初始条件”和“常量”
│   ├── entities/           # 实体定义 (e.g., ent_alex.md, ent_marcus.md)
│   └── relations.md        # 关系定义
├── 1_narrative_volumes/    # 叙事卷册管理:宏观架构层
│   ├── vol_001_setup.md    # 第一卷:世界建立 (15-25万字规划)
│   ├── vol_002_conflict.md # 第二卷:冲突展开
│   └── vol_003_resolution.md # 第三卷:冲突解决
├── 2_event_chains/         # 事件链规划:中观叙事骨架
│   ├── vol_001/            # 第一卷事件链
│   │   ├── main_chain.md   # 主线事件链
│   │   └── sub_chain_01.md # 支线事件链
│   ├── vol_002/
│   └── vol_003/
├── 3_detailed_outlines/    # 详细细纲:微观执行蓝图与人工检查点
│   ├── vol_001/
│   │   ├── ms_001_outline.md  # 里程碑细纲
│   │   └── ms_002_outline.md
│   ├── vol_002/
│   └── vol_003/
├── 4_text_renders/         # 文本渲染结果:最终产出
│   ├── vol_001/
│   │   ├── ms_001_render.md
│   │   └── ms_002_render.md
│   ├── vol_002/
│   └── vol_003/
├── 5_tavern_sims/          # 酒馆模拟记录:角色互动与世界动态验证
└── .protocols/             # 叙事协议库:我们的“语言”核心
    ├── texture_protocol.md
    ├── info_flow_protocol.md
    └── volume_management_protocol.md # 新增卷册管理协议

核心功能实现与工作流:

  1. 叙事卷册规划 (1_narrative_volumes/): 用户在vol_xxx_name.md中定义每卷的核心冲突、主要角色弧线和世界状态变化。AI根据volume_management_protocol.md协助规划15-25万字的卷册结构,确保宏观逻辑连贯性。
  2. 实体定义 (0_world_state/entities/): 在ent_alex.md等文件中创建基础实体,AI根据预设指令和当前world_state上下文,扩写其attributes(如性格、历史、能力),并将其与其他实体的relations.md进行关联。
  3. 事件链规划 (2_event_chains/vol_xxx/): 按卷组织事件链,在main_chain.md中定义核心milestones。AI能根据卷册目标和实体状态,帮助细化每个里程碑的起因、过程和结果。
  4. 详细细纲生成 (3_detailed_outlines/): 这是关键的人工检查层。AI在文本渲染前,生成每个里程碑的详细执行细纲,包含场景设置、对话要点、状态变化等。这允许我们在低成本阶段发现和修正结构性问题,确保AI输出的质量和方向。
  5. 文本渲染 (4_text_renders/): 用户打开ms_xxx_render.md,基于已审核的细纲,调用AI进行最终文本渲染。AI此时拥有完整的上下文:世界状态、卷册目标、事件链和详细细纲,确保生成文本的准确性和风格一致性。
  6. 酒馆模拟 (5_tavern_sims/): 核心逻辑不变,但提示词会智能引用entity(作为角色的“记忆”和“性格”)和milestone(作为当前故事阶段的“背景”)数据,使模拟对话更符合世界和人物设定。

第二部分:创造我们自己的“语言” – 概念工程与提示词深化

为了真正驾驭AI,我们必须创造我们自己的“语言”。通过定义一套全新的、精确的、专属于我们系统的术语,我们可以迫使AI跳出它模糊的、被平均化的“先验知识”,严格按照我们的逻辑框架进行思考和生成。这本质上是一种**“概念工程” (Concept Engineering)**,是高级AI应用开发中的核心技巧。

我们将传统文学概念替换为更具计算机科学和信息论色彩的精确术语,并将其深度整合到提示词工程中。

1. 提示词:文风与叙事提取 (v2.0) - “叙事协议规范”

我们将小说的“风格”和“叙事”抽象为可量化、可配置的“协议”,就像网络通信协议一样,规定了数据(文字)如何被编码和传输(呈现给读者)。

目标: 提取小说的“风格与叙事协议 (Style & Narrative Protocol)”,用于后续的few-shot学习,确保AI生成文本的风格一致性。

你是一位顶级的文学数据科学家。你的任务是分析给定的【源文本样本】,并将其特征编码为一份结构化的【叙事协议规范 (Narrative Protocol Specification)】,该规范将用于指导一个AI生成引擎。

**# 核心指令**
1.  **协议化输出**: 你的最终输出必须是严格的YAML格式。
2.  **量化分析**: 尽可能使用量化或可分类的指标来描述特征。
3.  **聚焦可复制性**: 所有分析点都应是可被AI引擎精确复制的指令。

**# 协议规范维度**

## 1. 文本肌理协议 (Texture Protocol)
   - **句法模式 (Syntax Pattern)**: 文本的“DNA结构”。
     - `token_per_sentence_avg`: 平均每句的Token数量(数值)。
     - `clause_complexity_ratio`: 复合从句与简单句的比例(数值,0.0-1.0)。
   - **词汇熵 (Lexical Entropy)**: 语言的“丰富度与专业度”。
     - `vocabulary_diversity_score`: 词汇多样性得分(数值,0.0-1.0,TTR等算法)。
     - `domain_specific_lexicon`: 识别出的领域专属词汇列表(如“曲速引擎”、“灵根”)。
   - **感官信道权重 (Sensory Channel Weight)**: 读者通过何种感官“体验”文本。
     - `channel_weights`: 一个包含视觉、听觉、触觉、嗅觉、味觉信道权重的对象(e.g., `{visual: 0.6, auditory: 0.2, tactile: 0.1, ...}`)。
   - **对话包络 (Dialogue Envelope)**: 对话的“声学特征”。
     - `dialogue_to_narration_ratio`: 对话Token与叙事Token的比例(数值)。
     - `dialogue_formality_index`: 对话的正式度指数(数值,0.0-1.0,从口语到书面语)。

## 2. 信息流协议 (Information Flow Protocol)
   - **观察者模式 (Observer Pattern)**: 信息的“视角传输”方式。
     - `observer_type`: 观察者类型(`first_person_singular`, `third_person_limited`, `third_person_omniscient`)。
     - `observer_hopping_frequency`: 观察者切换频率(`static`, `low`, `high`)。
   - **时间流速 (Temporal Velocity)**: 叙事的“节奏控制”。
     - `velocity_mode`: 节奏模式(`constant`, `accelerating`, `variable`)。
     - `event_vs_exposition_ratio`: “事件序列”与“背景阐述”的比例。
   - **信息熵控制 (Entropy Control)**: 悬念与伏笔的“注入机制”。
     - `entropy_injection_method`: 熵注入方式(`foreshadowing`, `misdirection`, `delayed_reveal`, `unreliable_narrator`)。
     - `entropy_injection_rate`: 每千Token的熵注入事件平均次数。
   - **情感状态向量 (Emotional State Vector)**: 文本的“情感光谱”。
     - `dominant_emotion_vector`: 文本营造的核心情感向量(e.g., `{tension: 0.8, sorrow: 0.1, hope: 0.3, ...}`)。
     - `implication_vs_statement_ratio`: “暗示”与“明示”情感的比例。

**# 协议样本生成 (Protocol Sample Generation)**
- 从源文本中提取1-3个【协议基准片段 (Protocol Benchmark Snippets)】。
- 对每个片段进行简短的【协议实现要点 (Protocol Implementation Notes)】分析。

---
**# 任务开始**

请为以下【源文本样本】编码【叙事协议规范】:
【在这里粘贴小说的文本片段】

2. 提示词:设定与情节提取 (v2.0) - “世界状态与事件链”

我们将传统“设定”和“情节”的概念,转化为数据库和模拟中的“数据对象”和“有序序列”,使AI能理解世界是如何构成的,以及故事是如何推进的。

目标: 将小说的“世界状态”和“事件链”编码为结构化的数据对象,为AI提供可操作的“世界模型”。

你是一位专业的信息架构师。你的任务是解析给定的【故事信息摘要】,并将其转换为结构化的【世界状态与事件链 (World State & Event Chain)】JSON对象。

**# 核心指令**
1.  **对象化**: 将所有叙事元素识别为定义清晰的数据对象。
2.  **链接化**: 明确对象之间的关系链接。
3.  **序列化**: 将动态事件表示为一个有序的序列。

**# 输出格式 (JSON)**
{
  "world_state": {
    "entities": [
      {"entity_id": "ent_char_01", "entity_type": "character", "attributes": {"name": "主角名", "description": "...", "goal": "..."}},
      {"entity_id": "ent_loc_01", "entity_type": "location", "attributes": {"name": "地点名", "description": "...", "environment_tags": ["forest", "ancient_ruins"]}},
      {"entity_id": "ent_obj_01", "entity_type": "artifact", "attributes": {"name": "神器名", "description": "...", "properties": ["magical", "cursed"]}},
      ...
    ],
    "relations": [
      {"source_id": "ent_char_01", "target_id": "ent_char_02", "relation_type": "hostile_to/allied_with/kin_of/master_of", "strength": 0.7},
      {"source_id": "ent_char_01", "target_id": "ent_loc_01", "relation_type": "resides_at/explores"},
      ...
    ],
    "global_metrics": { # 世界的全局参数,如时间线、魔力水平等
        "current_era": "Age of Arcana",
        "magic_potency_index": 0.8
    }
  },
  "event_chain": {
    "logline": "单句核心事件流描述,概括整卷或整个故事的核心冲突。",
    "narrative_template_id": "template_three_phase_conflict/template_hero_departure_return/template_discovery_catastrophe", # 引用预定义的故事模板
    "milestones": [
      {"milestone_id": "ms_01_equilibrium_break", "phase": 1, "description": "初始平衡被打破:实体'ent_char_01'遭遇了突袭,世界状态由平衡转为紧张。", "focus_entities": ["ent_char_01", "ent_loc_01"]},
      {"milestone_id": "ms_02_conflict_escalation", "phase": 2, "description": "冲突升级:实体'ent_char_01'在'ent_loc_02'与'ent_char_03'发生激烈对抗,揭示了核心矛盾。", "focus_entities": ["ent_char_01", "ent_char_03", "ent_loc_02"]},
      {"milestone_id": "ms_03_resolution_shift", "phase": 3, "description": "危机解决与新常态:'ent_char_01'成功达成目标,但世界状态进入了一个新的平衡,实体'ent_char_04'获得新属性。", "focus_entities": ["ent_char_01", "ent_char_04"]},
      ...
    ]
  }
}

---
**# 任务开始**

请为以下【故事信息摘要】编码【世界状态与事件链】:
【在这里粘贴小说简介或梗概】

核心变化与上下文工程的实践

  • “章节/三幕式” -> “事件链/里程碑 (Event Chain/Milestone)”: 我们将故事看作一个由关键“里程碑”组成的有序“事件链”。每个里程碑都是一个具体的状态改变和事件发生点,为AI提供精确的叙事推进指令。
  • “设定/人物” -> “世界状态/实体 (World State/Entity)”: 引入了数据库和模拟的概念。世界由一系列具有明确attributesrelations的“实体”构成,整个故事就是这个“世界状态”在“事件链”驱动下的演变过程。这使得AI能够“理解”人物关系、地点特征和物品属性,并据此进行合理推演。
  • “文风/叙事” -> “文本肌理/信息流协议 (Texture/Information Flow Protocol)”: 将写作风格和叙事技巧分解为可量化、可配置的“协议”。这些协议指导AI在词汇选择、句式结构、情感渲染和信息揭示节奏上,严格遵循预设的风格,极大提升了长篇小说在多段落、多章节间风格的一致性。
  • “详细细纲层级”作为人工检查点: 这是从“提示词工程”到“上下文工程”的关键一步。它在AI生成“原子文本”之前,提供了一个“宏观蓝图”的确认机会。我们不再依赖AI直接生成长篇内容,而是让AI生成“执行计划”,我们审核计划,再让AI根据计划执行。这极大地提高了创作过程的可控性和可预测性。

结语

通过这种“上下文工程”的方法,我们不再只是向AI“提问”,而是与AI共同构建一个可编程、可模拟的叙事世界。我们定义的每一项协议、每一个实体、每一个里程碑,都成为AI思考和创作的“语境”和“参数”。这使得AI能够:

  • 理解并维持长篇叙事的一致性:通过World StateEvent Chain,AI始终清楚故事的整体走向和每个元素的当前状态。
  • 复制并稳定特定文风Narrative Protocol Specification确保了文本肌理和信息流的稳定,解决了AI生成文本的风格漂移问题。
  • 提供精细化控制与人工介入点Detailed Outlines层级赋予了创作者在关键节点进行微调和纠偏的能力,避免了“垃圾进,垃圾出”的困境。

这不仅仅是关于AI辅助写作,更是关于如何将AI转化为一个强大的**“世界模拟器”“叙事控制器”**。对于有志于驾驭AI进行长篇创作的作者而言,这套“炼金术”工作台,无疑将是您通往百万字宏大叙事殿堂的必经之路。

未来展望: 随着AI能力的进一步提升,我们可以将更多复杂的叙事规则、角色心理模型甚至读者反馈机制融入到协议中,真正实现“智能协同创作”的愿景。