智慧處理,可自動對掃描文件進行OCR,自動檢測文本文件的編碼
支持強制對包含嵌入圖像或掃描內容的PDF進行OCR
支持PDF、Word、PowerPoint、Excel、HTML、圖片等多種檔案格式
專案地址: github.com/Goldziher/kreuzberg
#文本提取 #文件處理 #Kreuzberg
智慧處理,可自動對掃描文件進行OCR,自動檢測文本文件的編碼
支持強制對包含嵌入圖像或掃描內容的PDF進行OCR
支持PDF、Word、PowerPoint、Excel、HTML、圖片等多種檔案格式
專案地址: github.com/Goldziher/kreuzberg
#文本提取 #文件處理 #Kreuzberg
基於使用搜尋引擎、代碼執行器、心智圖等工具,完成更複雜的任務
在GPQA數據集,特別是物理和生物部分上超過了一些閉源LLM
專案地址: github.com/theworldofagents/Agentic-Reasoning
#LLM #AgenticReasoning #LLM推理增強
基於使用搜尋引擎、代碼執行器、心智圖等工具,完成更複雜的任務
在GPQA數據集,特別是物理和生物部分上超過了一些閉源LLM
專案地址: github.com/theworldofagents/Agentic-Reasoning
#LLM #AgenticReasoning #LLM推理增強
支持數百小時的影片輸入,可以同時分析多個影片
高效率的知識索引,可將數百小時的影片提煉成結構化的知識圖譜,理解影片內容間的關聯,提供準確回復
多模態處理,可結合視覺內容和文本語義進行分析理解,支持基於影片內容的智慧問答
專案地址: github.com/HKUDS/VideoRAG
#RAG #影片RAG #VideoRAG
支持數百小時的影片輸入,可以同時分析多個影片
高效率的知識索引,可將數百小時的影片提煉成結構化的知識圖譜,理解影片內容間的關聯,提供準確回復
多模態處理,可結合視覺內容和文本語義進行分析理解,支持基於影片內容的智慧問答
專案地址: github.com/HKUDS/VideoRAG
#RAG #影片RAG #VideoRAG
生成品質比較高,各個角度一致性比較好,可處理細節和複雜結構
支持ControlNet進行精細控制
非常適合需要快速疊代或即時生成的場景
專案地址: github.com/chenguolin/DiffSplat
#3D生成 #DiffSplat
生成品質比較高,各個角度一致性比較好,可處理細節和複雜結構
支持ControlNet進行精細控制
非常適合需要快速疊代或即時生成的場景
專案地址: github.com/chenguolin/DiffSplat
#3D生成 #DiffSplat
包含了 2023-2025 年中國節假日、調休、補班日曆,提供 ICS 格式,可通過 API 獲取。
專案地址: github.com/lanceliao/china-holiday-calender
支持 iPhone、Google Calendar、Outlook 等用戶端訂閱。
節假日資訊來自官方,一手資訊、權威準確,沒有廣告。
#chinaholidaycalender #節假日 #日曆
包含了 2023-2025 年中國節假日、調休、補班日曆,提供 ICS 格式,可通過 API 獲取。
專案地址: github.com/lanceliao/china-holiday-calender
支持 iPhone、Google Calendar、Outlook 等用戶端訂閱。
節假日資訊來自官方,一手資訊、權威準確,沒有廣告。
#chinaholidaycalender #節假日 #日曆
內建了直播源,直接安裝即可使用,具有穩定、快速、免費和無廣告等特點。
專案地址: github.com/sakana164/mytv-android
注意:僅支持安卓 5.0 及以上作業系統。
#mytvandroid #電視直播
內建了直播源,直接安裝即可使用,具有穩定、快速、免費和無廣告等特點。
專案地址: github.com/sakana164/mytv-android
注意:僅支持安卓 5.0 及以上作業系統。
#mytvandroid #電視直播
整首歌都可以按照歌詞的要求生成,結構比較連貫,有旋律、有樂器伴奏
能生成多種音樂風格,搖滾、爵士、流行、說唱等
支持多語言,中文(普通話、粵語)、英文、日文、韓文等
專案地址: github.com/multimodal-art-projection/YuE
#LLM #lyrics2song #YuE
整首歌都可以按照歌詞的要求生成,結構比較連貫,有旋律、有樂器伴奏
能生成多種音樂風格,搖滾、爵士、流行、說唱等
支持多語言,中文(普通話、粵語)、英文、日文、韓文等
專案地址: github.com/multimodal-art-projection/YuE
#LLM #lyrics2song #YuE
基於 Go 語言開發,支持幾乎所有影片平台,如抖音、B 站、YouTube、Twitter、騰訊、愛奇藝等等。
專案地址: github.com/iawia002/lux
並提供了包括 macOS、Windows、Linux 等平台的命令行支持。
另外,還可透過參數來控制下載影片的格式、清晰度、字幕等。
#Lux #影片下載
基於 Go 語言開發,支持幾乎所有影片平台,如抖音、B 站、YouTube、Twitter、騰訊、愛奇藝等等。
專案地址: github.com/iawia002/lux
並提供了包括 macOS、Windows、Linux 等平台的命令行支持。
另外,還可透過參數來控制下載影片的格式、清晰度、字幕等。
#Lux #影片下載
支持影片、圖片、音訊、m3u8、直播流等網路資源,甚至還可以支持獲取特殊網路下的資源。
專案地址: github.com/putyy/res-downloader
而且支持了中國大部分主流平台,如影片號、小紅書、抖音、快手、酷狗、QQ 等等。
提供 Windows、macOS 和 Linux 安裝包使用。
#resdownloader #資源下載
支持影片、圖片、音訊、m3u8、直播流等網路資源,甚至還可以支持獲取特殊網路下的資源。
專案地址: github.com/putyy/res-downloader
而且支持了中國大部分主流平台,如影片號、小紅書、抖音、快手、酷狗、QQ 等等。
提供 Windows、macOS 和 Linux 安裝包使用。
#resdownloader #資源下載
支持自動錄播,可自訂錄製質量、路徑、格式、時間等等配置選項,以及還支持錄製彈幕。
專案地址: github.com/stream-rec/stream-rec
提供可視化界面操作,可持久化儲存錄播和上傳資訊,同步到雲端儲存。
支持抖音、虎牙、鬥魚、Twitch、微博等主流平台。
#Streamrec #直播
支持自動錄播,可自訂錄製質量、路徑、格式、時間等等配置選項,以及還支持錄製彈幕。
專案地址: github.com/stream-rec/stream-rec
提供可視化界面操作,可持久化儲存錄播和上傳資訊,同步到雲端儲存。
支持抖音、虎牙、鬥魚、Twitch、微博等主流平台。
#Streamrec #直播
它是一個分層多智慧體框架,一個管理器和四個下級代理,感知器、操作器、動作反射器和記錄器共五個智慧體,可以通過經驗自我進化
支持超長任務鏈,可以跨應用操作
具備錯誤處理機制,可以自我檢查錯誤,持續最佳化性能
專案地址: github.com/X-PLUG/MobileAgent/tree/main/Mobile-Agent-E
#AI移動助手 #MobileAgentE #MobileAgent
它是一個分層多智慧體框架,一個管理器和四個下級代理,感知器、操作器、動作反射器和記錄器共五個智慧體,可以通過經驗自我進化
支持超長任務鏈,可以跨應用操作
具備錯誤處理機制,可以自我檢查錯誤,持續最佳化性能
專案地址: github.com/X-PLUG/MobileAgent/tree/main/Mobile-Agent-E
#AI移動助手 #MobileAgentE #MobileAgent
具備疊代式自我提問機制,可以自己提問,自動找答案,按時間順序整理重要資訊
支持開放域新聞時間線生成,不限特定領域
處理速度快,可以處理大量新聞
專案地址: github.com/Alibaba-NLP/CHRONOS
#新聞助手 #新聞事件整理助手 #CHRONOS
具備疊代式自我提問機制,可以自己提問,自動找答案,按時間順序整理重要資訊
支持開放域新聞時間線生成,不限特定領域
處理速度快,可以處理大量新聞
專案地址: github.com/Alibaba-NLP/CHRONOS
#新聞助手 #新聞事件整理助手 #CHRONOS
LangChain構建,可以回答FAQ常見問題、處理密碼重設流程、匯率查詢諮詢
有完整的範例代碼和安裝說明,適合學習和二次開發
專案地址: github.com/multinear-demo/demo-bank-support-lc-py
#銀行客服機器人
LangChain構建,可以回答FAQ常見問題、處理密碼重設流程、匯率查詢諮詢
有完整的範例代碼和安裝說明,適合學習和二次開發
專案地址: github.com/multinear-demo/demo-bank-support-lc-py
#銀行客服機器人
寫作工具內建Markdown編輯器,支持列表大綱、數學公式、圖表、流程圖、甘特圖、時序圖、五線譜等
支持AI機器人對話,可以詢問它與記錄有關的問題,它輸出的內容也可以作為記錄保存下來
支持截圖、插圖以及文本多種記錄方式,截圖的話先OCR 識別圖片中的文字,再用ChatGPT進行總結
使用整理功能,自動可以把所有記錄整理成一篇可讀的筆記
專案地址: github.com/codexu/note-gen
#AI筆記 #NoteGen #文件自動整理總結工具
寫作工具內建Markdown編輯器,支持列表大綱、數學公式、圖表、流程圖、甘特圖、時序圖、五線譜等
支持AI機器人對話,可以詢問它與記錄有關的問題,它輸出的內容也可以作為記錄保存下來
支持截圖、插圖以及文本多種記錄方式,截圖的話先OCR 識別圖片中的文字,再用ChatGPT進行總結
使用整理功能,自動可以把所有記錄整理成一篇可讀的筆記
專案地址: github.com/codexu/note-gen
#AI筆記 #NoteGen #文件自動整理總結工具
教學地址: cckeh.hashnode.dev/building-chatbots-with-memory-capabilities-a-comprehensive-tutorial-with-langchain-langgraph-gemini-ai-and-mongodb
專案地址: github.com/CC-KEH/GenAI-Tutorials/blob/main/langchain_chatbot_with_memory.py
教學地址: cckeh.hashnode.dev/building-chatbots-with-memory-capabilities-a-comprehensive-tutorial-with-langchain-langgraph-gemini-ai-and-mongodb
專案地址: github.com/CC-KEH/GenAI-Tutorials/blob/main/langchain_chatbot_with_memory.py
它可以基於提問自動尋找相關的論文,並把論文內容消化後用通俗易懂的方式回,且會標註資訊來源,解決每年新發表的論文太多看不過來的問題
專業工具,專門理解和處理專業學術內容
支持標準RAG流程,包含檢索器+重排序器管道,具備自反思生成能力
專案地址: github.com/AkariAsai/OpenScholar
#RAG #論文閱讀工具 #OpenScholar
它可以基於提問自動尋找相關的論文,並把論文內容消化後用通俗易懂的方式回,且會標註資訊來源,解決每年新發表的論文太多看不過來的問題
專業工具,專門理解和處理專業學術內容
支持標準RAG流程,包含檢索器+重排序器管道,具備自反思生成能力
專案地址: github.com/AkariAsai/OpenScholar
#RAG #論文閱讀工具 #OpenScholar
1、可以處理長文本,支援複雜格式,比如表格、嵌套列表、LaTeX公式等
2、穩定性比較好,沒有重複或循環的問題
3、支援 29種語言,包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、義大利語、俄語、越南語、泰語、阿拉伯語等
適合需要批次處理網頁或自動化網頁資料提取的場景
模型: huggingface.co/jinaai/ReaderLM-v2
#網頁轉Markdown #網頁轉JSON #ReaderLMv2
1、可以處理長文本,支援複雜格式,比如表格、嵌套列表、LaTeX公式等
2、穩定性比較好,沒有重複或循環的問題
3、支援 29種語言,包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、義大利語、俄語、越南語、泰語、阿拉伯語等
適合需要批次處理網頁或自動化網頁資料提取的場景
模型: huggingface.co/jinaai/ReaderLM-v2
#網頁轉Markdown #網頁轉JSON #ReaderLMv2
準確性和錯誤率上超過了現有的輕量級系統
在複雜查詢任務上表現相對較好
夠用省資源,適合在設備上使用
MiniRAG的兩個關鍵,讓小模型取得良好的RAG效果
(1)語義感知的異構圖索引機制,將文本塊和命名實體結合在一個統一結構中,減少了對複雜語義理解的依賴
(2)輕量級的拓撲增強檢索方法,利用圖結構實現高效的知識發現,無需高級語言能力
專案地址: github.com/HKUDS/MiniRAG
#RAG #小模型RAG #MiniRAG
準確性和錯誤率上超過了現有的輕量級系統
在複雜查詢任務上表現相對較好
夠用省資源,適合在設備上使用
MiniRAG的兩個關鍵,讓小模型取得良好的RAG效果
(1)語義感知的異構圖索引機制,將文本塊和命名實體結合在一個統一結構中,減少了對複雜語義理解的依賴
(2)輕量級的拓撲增強檢索方法,利用圖結構實現高效的知識發現,無需高級語言能力
專案地址: github.com/HKUDS/MiniRAG
#RAG #小模型RAG #MiniRAG
支持輻射場、3D高斯分布、網格等多種輸出,比較靈活
支持文本或圖像提示生成,一致性比較好
可以對已生成的模型進行局部編輯或生成變體
專案地址: github.com/microsoft/TRELLIS
模型: huggingface.co/spaces/JeffreyXiang/TRELLIS
#3D生成 #TRELLIS
支持輻射場、3D高斯分布、網格等多種輸出,比較靈活
支持文本或圖像提示生成,一致性比較好
可以對已生成的模型進行局部編輯或生成變體
專案地址: github.com/microsoft/TRELLIS
模型: huggingface.co/spaces/JeffreyXiang/TRELLIS
#3D生成 #TRELLIS
專案地址: github.com/Bistutu/FluentRead
#翻譯
專案地址: github.com/Bistutu/FluentRead
#翻譯
用來檢測論文、稿件原創性就非常輕鬆,它僅使用1000個樣本和5分鐘的SPO訓練就超過了商業的GPT-Zero
檢測開源LLM修改文本上提高了13%,檢測GPT-3.5和GPT-4o修改的文本上,性能提高了5%和19%
支持像改寫、擴寫、潤色都可以,純AI生成的檢測率能到99.96%,改寫87.39%,擴寫97.58%,潤色97.07%
專案地址: github.com/Jiaqi-Chen-00/ImBD
#AI文章檢測 #論文檢測工具 #ImBD
用來檢測論文、稿件原創性就非常輕鬆,它僅使用1000個樣本和5分鐘的SPO訓練就超過了商業的GPT-Zero
檢測開源LLM修改文本上提高了13%,檢測GPT-3.5和GPT-4o修改的文本上,性能提高了5%和19%
支持像改寫、擴寫、潤色都可以,純AI生成的檢測率能到99.96%,改寫87.39%,擴寫97.58%,潤色97.07%
專案地址: github.com/Jiaqi-Chen-00/ImBD
#AI文章檢測 #論文檢測工具 #ImBD
該系統採用多個專門的代理協同工作,完成從初始提示創建連貫結構化的敘述
專案地址: github.com/adamwlarson/ai-book-writer
#agent #aibookwriter
該系統採用多個專門的代理協同工作,完成從初始提示創建連貫結構化的敘述
專案地址: github.com/adamwlarson/ai-book-writer
#agent #aibookwriter
該系統採用多個專門的代理協同工作,完成從初始提示創建連貫結構化的敘述
專案地址: github.com/adamwlarson/ai-book-writer
#agent #aibookwriter
該系統採用多個專門的代理協同工作,完成從初始提示創建連貫結構化的敘述
專案地址: github.com/adamwlarson/ai-book-writer
#agent #aibookwriter
搜索、研究、寫作自動化,支持網頁內容的提取和分析,可以導出PDF、Word、Text多種格式
支持帶有時間過濾的網頁搜索功能,可調整搜索範圍和數量,自訂報告風格,自訂提示詞引導研究方向等
專案地址: github.com/btahir/open-deep-research
#AI研究助手 #OpenDeepResearch #AI研究報告生成
搜索、研究、寫作自動化,支持網頁內容的提取和分析,可以導出PDF、Word、Text多種格式
支持帶有時間過濾的網頁搜索功能,可調整搜索範圍和數量,自訂報告風格,自訂提示詞引導研究方向等
專案地址: github.com/btahir/open-deep-research
#AI研究助手 #OpenDeepResearch #AI研究報告生成