"テキストで考える "と "画像で考える "パラダイムは、大規模言語モデル(LLM)と視覚言語モデル(VLM)の推論能力を大幅に向上させる。しかし、これらのパラダイムには固有の限界がある。(1)画像は一瞬しか捉えず、動的なプロセスや連続的な変化を表現できない。(2)テキストと視覚が別個のモダリティとして...
"テキストで考える "と "画像で考える "パラダイムは、大規模言語モデル(LLM)と視覚言語モデル(VLM)の推論能力を大幅に向上させる。しかし、これらのパラダイムには固有の限界がある。(1)画像は一瞬しか捉えず、動的なプロセスや連続的な変化を表現できない。(2)テキストと視覚が別個のモダリティとして...
大規模言語モデル(LLM)の能力が高まるにつれて、LLMは創発的行動として自己認識を発達させるのだろうか?もしそうなら、私たちはそれを測ることができるのだろうか?戦略的差別化を通じて自己認識を測定するためのゲーム理論的フレームワークであるAI自己認識指数(AISAI)を紹介する。平均の2/3を当てる」ゲ...
大規模言語モデル(LLM)の能力が高まるにつれて、LLMは創発的行動として自己認識を発達させるのだろうか?もしそうなら、私たちはそれを測ることができるのだろうか?戦略的差別化を通じて自己認識を測定するためのゲーム理論的フレームワークであるAI自己認識指数(AISAI)を紹介する。平均の2/3を当てる」ゲ...
我々は、敵対的な詩が大規模言語モデル(LLM)のための普遍的な1ターンの脱獄技術として機能する証拠を提示する。25のフロンティア独自モデルおよびオープンウエイトモデルにおいて、詩的プロンプトのキュレーションは高い攻撃成功率(ASR)を示し、90%を超えるプロバイダーもあった。プロンプトをMLCommons...
我々は、敵対的な詩が大規模言語モデル(LLM)のための普遍的な1ターンの脱獄技術として機能する証拠を提示する。25のフロンティア独自モデルおよびオープンウエイトモデルにおいて、詩的プロンプトのキュレーションは高い攻撃成功率(ASR)を示し、90%を超えるプロバイダーもあった。プロンプトをMLCommons...