Firecrawl
OpenClaw 可以使用 Firecrawl 作為web_fetch 的後備提取器。它是一個託管 content 擷取服務,支援機器人規避和快取,這對 JS 密集網站或封鎖純 HTTP 擷取的頁面有幫助。
取得 API 金鑰
- 建立 Firecrawl 帳戶並產生 API 金鑰。
- 在配置中儲存它或在 gateway environment 中設定
FIRECRAWL_API_KEY。
配置 Firecrawl
firecrawl.enabled預設為true,除非明確設定為false。- Firecrawl 後備嘗試僅在 API 金鑰可用時執行(
tools.web.fetch.firecrawl.apiKey或FIRECRAWL_API_KEY)。 maxAgeMs控制快取結果可以多舊(毫秒)。預設為 2 天。
隱身/機器人規避
Firecrawl 公開 proxy mode 參數用於機器人規避(basic、stealth 或 auto)。
OpenClaw 始終對 Firecrawl 請求使用 proxy: "auto" 加上 storeInCache: true。
如果 proxy 被省略,Firecrawl 預設為 auto。auto 在基本嘗試失敗時使用隱身代理重試,這可能比僅基本爬取使用更多信用。
web_fetch 如何使用 Firecrawl
web_fetch 擷取順序:
- Readability(本機)
- Firecrawl(如果配置)
- 基本 HTML 清理(最後後備)