1、可以處理長文本,支援複雜格式,比如表格、嵌套列表、LaTeX公式等
2、穩定性比較好,沒有重複或循環的問題
3、支援 29種語言,包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、義大利語、俄語、越南語、泰語、阿拉伯語等
適合需要批次處理網頁或自動化網頁資料提取的場景
模型: huggingface.co/jinaai/ReaderLM-v2
#網頁轉Markdown #網頁轉JSON #ReaderLMv2
1、可以處理長文本,支援複雜格式,比如表格、嵌套列表、LaTeX公式等
2、穩定性比較好,沒有重複或循環的問題
3、支援 29種語言,包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、義大利語、俄語、越南語、泰語、阿拉伯語等
適合需要批次處理網頁或自動化網頁資料提取的場景
模型: huggingface.co/jinaai/ReaderLM-v2
#網頁轉Markdown #網頁轉JSON #ReaderLMv2