Source: https://github.com/susumuota/arxiv-reddit-summary
Maintained by @ota.bsky.social
[1/30] [2/30] [3/30] [4/30] [5/30] [6/30] [7/30] [8/30] [9/30] [10/30] [11/30] [12/30] [13/30] [14/30] [15/30] [16/30] [17/30] [18/30] [19/30] [20/30] [21/30] [22/30] [23/30] [24/30] [25/30] [26/30] [27/30] [28/30] [29/30] [30/30]
[1/30] [2/30] [3/30] [4/30] [5/30] [6/30] [7/30] [8/30] [9/30] [10/30] [11/30] [12/30] [13/30] [14/30] [15/30] [16/30] [17/30] [18/30] [19/30] [20/30] [21/30] [22/30] [23/30] [24/30] [25/30] [26/30] [27/30] [28/30] [29/30] [30/30]
実世界のタスクは、さまざまな粒度での意思決定を必要とするが、人間は、プランニングが基本的に高レベルの行動として理解される統一された認知表現を活用することで、これを得意としている。しかし、現在のラージ・ランゲージ・モデル(LLM)ベースのエージェントには、意思決定の粒度を超えて流動的に動作...
実世界のタスクは、さまざまな粒度での意思決定を必要とするが、人間は、プランニングが基本的に高レベルの行動として理解される統一された認知表現を活用することで、これを得意としている。しかし、現在のラージ・ランゲージ・モデル(LLM)ベースのエージェントには、意思決定の粒度を超えて流動的に動作...
2510.23564, cs․AI | cs․CL | cs․LG, 28 Oct 2025
🆕ReCode: Unify Plan and Action for Universal Granularity Control
Zhaoyang Yu, Jiayi Zhang, Huixue Su, Yufan Zhao, Yifan Wu, Mingyi Deng, Jinyu Xiang, Yizhang Lin, Lingxiao Tang, Yingchao Li, Yuyu Luo, Bang...
2510.23564, cs․AI | cs․CL | cs․LG, 28 Oct 2025
🆕ReCode: Unify Plan and Action for Universal Granularity Control
Zhaoyang Yu, Jiayi Zhang, Huixue Su, Yufan Zhao, Yifan Wu, Mingyi Deng, Jinyu Xiang, Yizhang Lin, Lingxiao Tang, Yingchao Li, Yuyu Luo, Bang...
既存の研究は、主にタスクの成功に焦点を当てているが、我々は、効果的な実世界のエージェントは、生産性(タスクの完了)、積極性(本質的な質問をする)、およびパーソナライゼーション(多様なユーザーの好みに適応する)の3つの側面を最適化する必要があると主張している。LLMベースのユーザ・シミュレー...
既存の研究は、主にタスクの成功に焦点を当てているが、我々は、効果的な実世界のエージェントは、生産性(タスクの完了)、積極性(本質的な質問をする)、およびパーソナライゼーション(多様なユーザーの好みに適応する)の3つの側面を最適化する必要があると主張している。LLMベースのユーザ・シミュレー...
2511.02208, cs․AI | cs․CL | cs․LG, 04 Nov 2025
🆕Training Proactive and Personalized LLM Agents
Weiwei Sun, Xuhui Zhou, Weihua Du, Xingyao Wang, Sean Welleck, Graham Neubig, Maarten Sap, Yiming Yang
2511.02208, cs․AI | cs․CL | cs․LG, 04 Nov 2025
🆕Training Proactive and Personalized LLM Agents
Weiwei Sun, Xuhui Zhou, Weihua Du, Xingyao Wang, Sean Welleck, Graham Neubig, Maarten Sap, Yiming Yang
厳密に制御された事前学習設定の下で、我々はクロスオーバーを観察した:ユニークなデータが限られている場合、拡散言語モデル(DLM)は、より多くのエポック数を学習することで、一貫して自己回帰(AR)モデルを上回る。クロスオーバーは、データが多いほど、あるいは質が高いほど遅くなり、モデルが大きい...
厳密に制御された事前学習設定の下で、我々はクロスオーバーを観察した:ユニークなデータが限られている場合、拡散言語モデル(DLM)は、より多くのエポック数を学習することで、一貫して自己回帰(AR)モデルを上回る。クロスオーバーは、データが多いほど、あるいは質が高いほど遅くなり、モデルが大きい...
2511.03276, cs․LG, 05 Nov 2025
🆕Diffusion Language Models are Super Data Learners
Jinjie Ni, Qian Liu, Longxu Dou, Chao Du, Zili Wang, Hang Yan, Tianyu Pang, Michael Qizhe Shieh
2511.03276, cs․LG, 05 Nov 2025
🆕Diffusion Language Models are Super Data Learners
Jinjie Ni, Qian Liu, Longxu Dou, Chao Du, Zili Wang, Hang Yan, Tianyu Pang, Michael Qizhe Shieh
[1/30] [2/30] [3/30] [4/30] [5/30] [6/30] [7/30] [8/30] [9/30] [10/30] [11/30] [12/30] [13/30] [14/30] [15/30] [16/30] [17/30] [18/30] [19/30] [20/30] [21/30] [22/30] [23/30] [24/30] [25/30] [26/30] [27/30] [28/30] [29/30] [30/30]
3Dオープンワールドのチャレンジングな環境の中で、何時間にも及ぶ複雑なミッションをリアルタイムでこなすジェネラリスト・エージェントを開発するための、初のオープンレシピ「Lumine」を紹介する。ルミネは、視覚言語モデルによって、知覚、推論、行動をエンド・ツー・エンドで統合する、人間のようなイン...
3Dオープンワールドのチャレンジングな環境の中で、何時間にも及ぶ複雑なミッションをリアルタイムでこなすジェネラリスト・エージェントを開発するための、初のオープンレシピ「Lumine」を紹介する。ルミネは、視覚言語モデルによって、知覚、推論、行動をエンド・ツー・エンドで統合する、人間のようなイン...
2511.08892, cs․AI, 12 Nov 2025
🆕Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds
Weihao Tan, Xiangyang Li, Yunhao Fang, Heyuan Yao, Shi Yan, Hao Luo, Tenglong Ao, Huihui Li, Hongbin Ren, Bairen Yi, Yujia Qin, Bo An, Libin Liu, Gua...
2511.08892, cs․AI, 12 Nov 2025
🆕Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds
Weihao Tan, Xiangyang Li, Yunhao Fang, Heyuan Yao, Shi Yan, Hao Luo, Tenglong Ao, Huihui Li, Hongbin Ren, Bairen Yi, Yujia Qin, Bo An, Libin Liu, Gua...
[1/30] [2/30] [3/30] [4/30] [5/30] [6/30] [7/30] [8/30] [9/30] [10/30] [11/30] [12/30] [13/30] [14/30] [15/30] [16/30] [17/30] [18/30] [19/30] [20/30] [21/30] [22/30] [23/30] [24/30] [25/30] [26/30] [27/30] [28/30] [29/30] [30/30]
LLMは、推論、洞察、ツールの使用において目覚ましいブレークスルーを達成したが、これらの能力を、人間、組織、社会が日常的に実行する規模の拡張プロセスに連鎖させることは、まだ手の届かないところにある。例えば、「ハノイの塔」ベンチマーク・ドメインでの最近の実験では、せいぜい数百ステップでプロ...
LLMは、推論、洞察、ツールの使用において目覚ましいブレークスルーを達成したが、これらの能力を、人間、組織、社会が日常的に実行する規模の拡張プロセスに連鎖させることは、まだ手の届かないところにある。例えば、「ハノイの塔」ベンチマーク・ドメインでの最近の実験では、せいぜい数百ステップでプロ...
2511.09030, cs․AI | cs․CL | cs․MA, 12 Nov 2025
🆕Solving a Million-Step LLM Task with Zero Errors
Elliot Meyerson, Giuseppe Paolo, Roberto Dailey, Hormoz Shahrzad, Olivier Francon, Conor F. Hayes, Xin Qiu, Babak Hodjat, Risto Miikkulainen
2511.09030, cs․AI | cs․CL | cs․MA, 12 Nov 2025
🆕Solving a Million-Step LLM Task with Zero Errors
Elliot Meyerson, Giuseppe Paolo, Roberto Dailey, Hormoz Shahrzad, Olivier Francon, Conor F. Hayes, Xin Qiu, Babak Hodjat, Risto Miikkulainen
我々はDepth Anything 3(DA3)を発表する。DA3は、カメラのポーズが既知であるか否かに関わらず、任意の数の視覚入力から空間的に一貫した形状を予測するモデルである。最小限のモデリングを追求した結果、DA3は2つの重要な洞察を得た。アーキテクチャに特化しなくても、単一のプレーンなトランスフォーマー(...
我々はDepth Anything 3(DA3)を発表する。DA3は、カメラのポーズが既知であるか否かに関わらず、任意の数の視覚入力から空間的に一貫した形状を予測するモデルである。最小限のモデリングを追求した結果、DA3は2つの重要な洞察を得た。アーキテクチャに特化しなくても、単一のプレーンなトランスフォーマー(...
2511.10647, cs․CV, 13 Nov 2025
🆕Depth Anything 3: Recovering the Visual Space from Any Views
Haotong Lin, Sili Chen, Junhao Liew, Donny Y. Chen, Zhenyu Li, Guang Shi, Jiashi Feng, Bingyi Kang
2511.10647, cs․CV, 13 Nov 2025
🆕Depth Anything 3: Recovering the Visual Space from Any Views
Haotong Lin, Sili Chen, Junhao Liew, Donny Y. Chen, Zhenyu Li, Guang Shi, Jiashi Feng, Bingyi Kang
[1/30] [2/30] [3/30] [4/30] [5/30] [6/30] [7/30] [8/30] [9/30] [10/30] [11/30] [12/30] [13/30] [14/30] [15/30] [16/30] [17/30] [18/30] [19/30] [20/30] [21/30] [22/30] [23/30] [24/30] [25/30] [26/30] [27/30] [28/30] [29/30] [30/30]
[1/30] [2/30] [3/30] [4/30] [5/30] [6/30] [7/30] [8/30] [9/30] [10/30] [11/30] [12/30] [13/30] [14/30] [15/30] [16/30] [17/30] [18/30] [19/30] [20/30] [21/30] [22/30] [23/30] [24/30] [25/30] [26/30] [27/30] [28/30] [29/30] [30/30]
大規模言語モデル(LLM)が自動化されたマルチステージパイプラインにますます統合されるにつれて、処理ステージ間の信頼性が検証されないことから生じるリスクパターンが現実的な懸念となっている。本稿では、商業用LLMで繰り返し発生する41のリスクパターンについて、メカニズム中心の分類法を提示する。こ...
大規模言語モデル(LLM)が自動化されたマルチステージパイプラインにますます統合されるにつれて、処理ステージ間の信頼性が検証されないことから生じるリスクパターンが現実的な懸念となっている。本稿では、商業用LLMで繰り返し発生する41のリスクパターンについて、メカニズム中心の分類法を提示する。こ...
2510.27190, cs․CR | cs․AI, 03 Nov 2025
🆕Unvalidated Trust: Cross-Stage Vulnerabilities in Large Language Model Architectures
Dominik Schwarz
2510.27190, cs․CR | cs․AI, 03 Nov 2025
🆕Unvalidated Trust: Cross-Stage Vulnerabilities in Large Language Model Architectures
Dominik Schwarz
[1/30] [2/30] [3/30] [4/30] [5/30] [6/30] [7/30] [8/30] [9/30] [10/30] [11/30] [12/30] [13/30] [14/30] [15/30] [16/30] [17/30] [18/30] [19/30] [20/30] [21/30] [22/30] [23/30] [24/30] [25/30] [26/30] [27/30] [28/30] [29/30] [30/30]
映像の生成から物理世界のモデリングを通じてロボットの学習を可能にするフレームワーク、PhysWorldを紹介する。最近のビデオ生成モデルは、言語コマンドと画像から写実的なビジュアル・デモンストレーションを合成することができ、ロボット工学のための強力な、まだ未開拓の学習信号源を提供する。しかし、...
映像の生成から物理世界のモデリングを通じてロボットの学習を可能にするフレームワーク、PhysWorldを紹介する。最近のビデオ生成モデルは、言語コマンドと画像から写実的なビジュアル・デモンストレーションを合成することができ、ロボット工学のための強力な、まだ未開拓の学習信号源を提供する。しかし、...
2511.07416, cs․RO | cs․AI | cs․CV, 11 Nov 2025
🆕Robot Learning from a Physical World Model
Jiageng Mao, Sicheng He, Hao-Ning Wu, Yang You, Shuyang Sun, Zhicheng Wang, Yanan Bao, Huizhong Chen, Leonidas Guibas, Vitor Guizilini, Howard Zhou, Yue Wang
2511.07416, cs․RO | cs․AI | cs․CV, 11 Nov 2025
🆕Robot Learning from a Physical World Model
Jiageng Mao, Sicheng He, Hao-Ning Wu, Yang You, Shuyang Sun, Zhicheng Wang, Yanan Bao, Huizhong Chen, Leonidas Guibas, Vitor Guizilini, Howard Zhou, Yue Wang
[1/30] [2/30] [3/30] [4/30] [5/30] [6/30] [7/30] [8/30] [9/30] [10/30] [11/30] [12/30] [13/30] [14/30] [15/30] [16/30] [17/30] [18/30] [19/30] [20/30] [21/30] [22/30] [23/30] [24/30] [25/30] [26/30] [27/30] [28/30] [29/30] [30/30]
2511.02824, cs․AI, 05 Nov 2025
🆕Kosmos: An AI Scientist for Autonomous Discovery
Ludovico Mitchener, Angela Yiu, Benjamin Chang, Mathieu Bourdenx, Tyler Nadolski, Arvis Sulovari, Eric C. Landsness, Daniel L. Barabasi, Siddharth Narayanan, Nicky Evans, ...
2511.02824, cs․AI, 05 Nov 2025
🆕Kosmos: An AI Scientist for Autonomous Discovery
Ludovico Mitchener, Angela Yiu, Benjamin Chang, Mathieu Bourdenx, Tyler Nadolski, Arvis Sulovari, Eric C. Landsness, Daniel L. Barabasi, Siddharth Narayanan, Nicky Evans, ...