Markdown formatting(Markdown 格式化)
OpenClaw 透過在渲染頻道特定輸出之前,將其轉換為共享的中間表示 (Intermediate Representation, IR) 來格式化出站 Markdown。IR 保持源文字完整,同時攜帶樣式/連結範圍,以便分塊(chunking)和渲染在所有頻道中保持一致。目標
- 一致性:一次解析步驟,多個渲染器。
- 安全分塊:在渲染之前拆分文字,確保行內格式(inline formatting)絕不會跨分塊斷裂。
- 頻道適配:在不重新解析 Markdown 的情況下,將同一個 IR 映射到 Slack mrkdwn、Telegram HTML 和 Signal 樣式範圍。
管線 (Pipeline)
- 解析 Markdown -> IR
- IR 是純文字加上樣式範圍(粗體/斜體/刪除線/程式碼/雷擊隱藏)和連結範圍。
- 偏移量 (Offsets) 使用 UTF-16 代碼單元,以便 Signal 樣式範圍與其 API 對齊。
- 僅當頻道選擇進行表格轉換時,才會解析表格。
- 對 IR 進行分塊(格式優先)
- 分塊發生在渲染前的 IR 文字上。
- 行內格式不會跨分塊拆分;範圍按分塊進行切片。
- 按頻道渲染
- Slack:mrkdwn 權杖(粗體/斜體/刪除線/程式碼),連結格式為
<url|label>。 - Telegram:HTML 標籤 (
<b>,<i>,<s>,<code>,<pre><code>,<a href>)。 - Signal:純文字 +
text-style範圍;當標籤不同時,連結變為label (url)。
- Slack:mrkdwn 權杖(粗體/斜體/刪除線/程式碼),連結格式為
IR 範例
輸入 Markdown:使用場景
- Slack、Telegram 和 Signal 出站適配器從 IR 進行渲染。
- 其他頻道(WhatsApp、iMessage、MS Teams、Discord)仍使用純文字或其自身的格式化規則,且在啟用時於分塊前套用 Markdown 表格轉換。
表格處理
並非所有聊天客戶端都一致支援 Markdown 表格。使用markdown.tables 控制每個頻道(及帳戶)的轉換:
code:將表格渲染為程式碼區塊(大多數頻道的預設值)。bullets:將每一行轉換為項目符號(Signal + WhatsApp 的預設值)。off:停用表格解析和轉換;原始表格文字直接通過。
分塊規則 (Chunking rules)
- 分塊限制來自頻道適配器/設定,並套用於 IR 文字。
- 程式碼圍欄(Code fences)被保留為單個區塊,並帶有尾隨換行符,以便頻道正確渲染。
- 列表前綴和引用區塊前綴是 IR 文字的一部分,因此分塊不會從前綴中間拆分。
- 行內樣式(粗體/斜體/刪除線/行內程式碼/雷擊隱藏)絕不會跨分塊拆分;渲染器會在每個分塊內重新開啟樣式。
連結策略
- Slack:
[label](url)-><url|label>;原始 URL 保持不變。解析期間停用自動連結以避免重複連結。 - Telegram:
[label](url)-><a href="url">label</a>(HTML 解析模式)。 - Signal:
[label](url)->label (url),除非標籤與 URL 匹配。
雷擊隱藏 (Spoilers)
雷擊隱藏標記 (||spoiler||) 僅針對 Signal 進行解析,並映射到 SPOILER 樣式範圍。其他頻道將其視為純文字。
如何新增或更新頻道格式化程式
- 一次解析:使用共享的
markdownToIR(...)輔助函數,並帶有適合頻道的選項(自動連結、標題樣式、引用區塊前綴)。 - 渲染:實作一個帶有
renderMarkdownWithMarkers(...)和樣式標記映射(或 Signal 樣式範圍)的渲染器。 - 分塊:在渲染前呼叫
chunkMarkdownIR(...);渲染每個分塊。 - 接入適配器:更新頻道的出站適配器以使用新的分塊器和渲染器。
- 測試:如果頻道使用分塊,請新增或更新格式測試和出站傳遞測試。
常見問題
- Slack 的角括號權杖(
<@U123>,<#C123>,<https://...>)必須保留;請安全地轉義原始 HTML。 - Telegram HTML 要求轉義標籤以外的文字,以避免 markup 損壞。
- Signal 樣式範圍依賴於 UTF-16 偏移量;不要使用代碼點 (code point) 偏移量。
- 為程式碼圍欄保留尾隨換行符,以便結束標記落在自己的一行上。