整理原则
0. 尽最大努力保留原文(最核心原则)
-
这是处理文档最核心的关键点
-
除非用户明确要求"简化"、"摘要"、"提炼",否则必须完整保留原文
-
只删除明显的口语词重复、结巴词
-
不删减任何实质性内容
-
长段落可以拆分,但不能删除内容
-
如果原文很长,分多次处理即可,不要因为怕麻烦而跳过内容
-
如果某段内容不确定是否应该保留,保留它
-
禁止自作主张地过度删减或提炼总结
1. 先理解,后整理(重要)
在开始整理之前,必须先完整阅读原文:
-
通读全文:理解会议/对话的整体结构和主题
-
划分大段:识别主要讨论议题,作为一级/二级标题的基础
-
理解逻辑:把握内容之间的逻辑关系,再进行转述
-
保留观点:转述时保留原文核心观点和具体举例,不过度提炼
2. 保留原文内容
-
尽可能保留原文所有内容
-
不删减实质性内容
3. 书面化处理
-
删除所有对话人名称(如有特殊要求可保留)
-
对于口语词、重复的内容进行整理(删除明显重复、结巴词)
-
将口语对话转化为连贯的书面语言
-
保持语义不变,只改善表达
-
删除口语词:如"好的"、"等一下"、"那个"、"就是"、"然后"等连接词使用过多时适当精简
-
自然段落合并:每段围绕一个观点,不宜过短。每个段落至少包含2-3个完整句子后再分段。
4. 第三人称视角
-
以第三人称视角转述内容
-
避免使用"他说"、"然后"、"就是"等口语化表达
-
重要:如需保留说话人信息,可明确使用"xxx表示"、"xxx指出"等表达
5. 对话合并原则
-
对于较短的来回对话(每人说话只有1-2句),可以合并成一段连贯的叙述
-
合并时保留说话人信息,但使表述更简洁
-
例如:将"A问为什么。B说因为...。A说...。B说..."简化为"A表示...,B表示..."
-
合并的目的是让文章更流畅,避免过于碎片化
6. 减少说话人提及
-
一个人说话期间,直到下一个人说话前提及说话人姓名,不需要反复
-
例如:"李欣妍表示...。她说...。她认为..." 改为 "李欣妍表示...。...。..."
-
只在说话人发生变化时提及新的说话人
-
这样可以让文章更简洁流畅
6. 删除重复表达
-
仔细检查对话内容,删除语义重复的表达
-
例如:"让大家有一些精神的寄托,不然到时候没有工作,大家都怎么办"可以简化为"让大家有精神寄托,避免失业恐慌"
-
判断标准:删除后不影响原文核心观点和信息的表达
-
谨慎使用:只有当两处表达确实是同一意思时才删除
7. 层级结构(四级以上)
-
一级标题(#):主要主题
-
二级标题(##):子主题
-
三级标题(###):更细分的内容
-
四级标题(####):更具体的细节
-
标题要贴切原文内容
-
二级标题后面需要附上总结概括的内容(用 > 块格式),其他级别标题不需要
-
层级结构清晰,便于阅读
8. 文档元数据(重要)
在文档开头添加 YAML 元数据:
---
title: 文档标题
date: 2026-03-02
duration: 约60分钟
source: 桌面录音文件
tags: [标签1, 标签2, 标签3]
---
9. 文档概要
-
概要需概括全文核心思想
-
是全文的精华整理
-
放在 YAML 元数据之后、正文之前
-
使用 > 块格式