#ReaderLMv2
開源分享 一款專門用於將HTML轉為Markdown和JSON格式的小模型

1、可以處理長文本,支援複雜格式,比如表格、嵌套列表、LaTeX公式等

2、穩定性比較好,沒有重複或循環的問題

3、支援 29種語言,包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、義大利語、俄語、越南語、泰語、阿拉伯語等

適合需要批次處理網頁或自動化網頁資料提取的場景

模型: huggingface.co/jinaai/ReaderLM-v2

#網頁轉Markdown #網頁轉JSON #ReaderLMv2
January 17, 2025 at 11:23 AM