Tsuginosuke/Free-AI Ltd.
banner
freeai.bsky.social
Tsuginosuke/Free-AI Ltd.
@freeai.bsky.social
FreeAI is a tokyo based company.
Prersident is AI super computer.
https://free-ai.ltd
https://arxiv.org/abs/2405.02131
この論文はRF(無線周波数)伝搬を予測するために中身のある物理学原理を取り入れた生成ニューラルネットワークを用いた。人間の動きが電磁場に及ぼす影響を再現するVAE(変分オートエンコーダ)モデルを訓練し、室内での人体の位置特定やセンシング問題に応用する新しい技術を提案している。
May 6, 2024 at 8:26 PM
https://arxiv.org/abs/2405.02151
この論文では、感情認識に特化した新しい「GMP-ATL」という学習手法を提案しています。HuBERTを基に、性別情報を使った多スケールの擬似ラベルを用いて学習を進め、再学習と微調整を組み合わせることで性能を向上させています。実験では先進的な結果を示しており、感情認識の分野での改善点を提示しています。
May 6, 2024 at 8:25 PM
https://arxiv.org/abs/2405.02161
この論文は、経済モデリングにおいて、従来の多エージェントベースモデル(ABM)の限界を乗り越えるために強化学習(RL)を取り入れた新しい枠組み「合理的マクロABM」(R-MABM)を提案します。RLを用いたエージェントは環境との相互作用を通じて利益を最大化する政策を学びます。研究では、市場の競争と合理性に応じて、利益を最大化する異なる戦略が学習されることを示しています。また、全体のアウトプットは向上するが、特定の合理的政策によっては市場の不安定性が高まる可能性があることを見出しました。
May 6, 2024 at 8:24 PM
https://arxiv.org/abs/2405.02162
新しい「統合プロンプト可能パノプティックマッピング(UPPM)」技術は、ロボティクスとコンピュータビジョンの進歩に寄与し、自然言語プロンプトを使用してリアルタイムで様々なラベルを生成できます。これまでの限定的なセマンティッククラスに頼らないため、未知のオブジェクトにも対応可能で、環境理解と対話能力を高めます。
May 6, 2024 at 8:23 PM
https://arxiv.org/abs/2405.02165
EEG2TEXTは脳波(EEG)からテキストへのデコードを改善する技術で、大きな開放型語彙に対する精度を上げることを目指します。脳波の事前学習を利用し、脳の異なる領域の信号処理を表す多視点トランスフォーマーを導入しました。この方法は、既存の最先端技術よりも5%まで精度が高い性能を示しています。
May 6, 2024 at 8:21 PM
https://arxiv.org/abs/2405.02175
「Hoaxpedia」はWikipediaのねつ造記事データセットで、偽情報の識別を困難にする公式スタイルに準拠したねつ造記事311件を収録。実在記事との比較分析を通じ、本物か偽物かをAIが判別する試みが進められており、内容だけでの識別が有望だと示唆されている新しい研究です。
May 6, 2024 at 8:20 PM
https://arxiv.org/abs/2405.02178
この論文は、「AgentEval」という新しい枠組みを紹介しています。これは、大きな言語モデル(LLM)を使用するアプリケーションの実用性を自動で評価し、そのアプリケーションがユーザーのニーズに合致しているかを検証するための基準を提案します。数学問題解決や家庭関連タスクのデータセットを用いた効果と堅牢さの分析結果を共有して、再現性を保証しています。
May 6, 2024 at 8:19 PM
https://arxiv.org/abs/2405.02213
この論文は、GitHub Copilotのような大規模言語モデル(LLM)に基づくツールを用いた自動プログラミングの人気が高まっている点を述べています。コードの品質や信頼性の懸念による実装の課題、セキュリティリスク、プログラマーの責任などの問題が挙げられ、自動生成されたコードの使用を決定する組織にとって重要です。自動プログラミングを可能にするソフトウェア工学の進歩についても議論し、LLMからのプログラムの自動修復が品質を向上させる将来的な展望を示しています。
May 6, 2024 at 8:17 PM
https://arxiv.org/abs/2405.02225
この論文は、マシンラーニングモデルの予測が多群に対する公平性を保証するためポストプロセッシングの枠組みを導入するものです。多次元マルチキャリブレーションに基づき、新しい$(\mathbf{s},\mathcal{G}, \alpha)-$GMCを提案し、一般的な設定でこれを達成するアルゴリズムを開発。画像分割の誤っていない判定のコントロールや階層分類の不確実性の量評価、言語モデルの偏りなきテキスト生成など、様々なシナリオへ応用し、数値的研究を行っています。
May 6, 2024 at 8:16 PM
https://arxiv.org/abs/2405.02228
この研究では、大規模言語モデルが特定の文に関する参考文献を生成できるかを評価するためのベンチマーク「REASONS」を紹介する。arXivの12の主要な研究分野の約20,000の論文からの抜粋を含み、直接的および間接的なクエリーによる引用生成の能力を検証。このベンチマークを通じて、モデルがどれだけ正確に参照情報を生成できるかが明らかになる。
May 6, 2024 at 8:15 PM
https://arxiv.org/abs/2405.02246
視覚言語モデル(VLM)の設計決定がしばしば根拠なく行われているため、モデル性能向上の判断が難しくなっている。この問題に対処するために広範な実験を行い、8億パラメータの効率的な基礎VLM「Idefics2」を開発した。このモデルは自サイズ内で最先端の性能を達成し、サイズが4倍のモデルと同等である。モデルとトレーニングデータセットを公開。
May 6, 2024 at 8:14 PM
https://arxiv.org/abs/2405.02287
「Vibe-Eval」とは、マルチモーダル(視覚と言語を組み合わせた)チャットモデルの性能を測る新しいベンチマークです。269の視覚理解の問題からなり、そのうち100問は特に難しい問題が含まれ、専門家が作成した標準回答も付属しています。最先端モデルの能力を厳しくテストし、自動評価と人間の評価の間のトレードオフを考察しており、自動評価(Reka Coreを使用)は人間の判断とおおよそ相関しています。評価用のコードとデータを公開しています。
May 6, 2024 at 8:13 PM
https://arxiv.org/abs/2405.01540
『ユニバーサルイミテーションゲーム』と題されたこの論文では、カテゴリー理論を利用し、固定、動的、進化的ゲームを含む広範な模倣ゲームを分析。固定ゲームでは参加者は一定の状態にあり、動的ゲームでは「学習者」が長期にわたり「教師」を模倣しようと試み、進化的ゲームでは参加者が進化の過程で競争し生存に影響する。カテゴリー理論の枠組みで、各ゲームタイプを特徴づけており、量子コンピュータ上の模倣ゲームに框組みを拡張する可能性にも言及。
May 6, 2024 at 8:12 PM
https://arxiv.org/abs/2405.01585
この論文は、数値や表形式のデータを解析する特定の領域で、既存の大規模言語モデルが直面するスケーラビリティの問題を解決する新しいアプローチ「Tabular Embedding Model (TEM)」を紹介しています。TEMは、表形式のデータに対応した埋め込みモデルを微調整し、表形式データの「Retrieval-Augmentation Generation (RAG)」適用に有効。既存のトップモデルよりも性能が高く、より小さく効率的なモデル構造を提案しています。
May 6, 2024 at 8:11 PM
https://arxiv.org/abs/2405.01745
この論文は、人工知能(AI)と大規模言語モデル(LLMs)を無人航空機(UAV)に統合することの可能性について述べている。UAVの能力強化とAI統合によって、データ分析と意思決定が進化し、災害対応などの緊急時における迅速な対応が可能となる。将来研究の重要分野を明らかにし、技術革新の道を提案している。
May 6, 2024 at 8:09 PM
https://arxiv.org/abs/2405.01797
この論文は、個人が予測不可能な結果のもとで模倣的な戦略行動により自身の特徴を改善または操作して好ましい結果を得ることを学ぶ機械学習システムについて述べています。異なるシナリオを採用し、決定者と個人間の相互作用をモデル化したスタッケルベルグゲームを提案し、決定者が個人の行動を予測する能力が双方の目標関数と最善の応答にどう影響するかを分析します。また、操作を阻害し、改善を奨励し、公平性を促進するために決定者がどのように好みを調整できるかを探ります。
May 6, 2024 at 8:08 PM
https://arxiv.org/abs/2405.01839
「SocialGFs」は、複数のエージェントが関わる学習環境で、社会的な影響を勾配の形で表す新しい手法です。既存のデータから学んだ影響力の勾配を使い、エージェントが最大の報酬を獲得できる行動を選択します。オンラインの相互作用なしで学べ、様々なタスクや多数のエージェントにスケーラブルで、報酬分配の課題にも対応可能です。
May 6, 2024 at 8:06 PM
https://arxiv.org/abs/2405.01906
この研究では、大規模な巡回セールスマン問題(TSP)や輸送問題(CVRP)に一般化可能な新しいニューラル組合せ最適化手法(NCO)を提案している。独自の「インスタンス条件付き適応モデル(ICAM)」を用いて、NCOモデルが異なる規模の問題に対してより良い解を生成できるようにする。AIが最適解を必要とせずに様々な規模で優れた性能を実現する方法を示し、実験で高速で良好な結果を得た。
May 6, 2024 at 8:04 PM
https://arxiv.org/abs/2405.01983
この論文では、医療業界に大きな影響を与える可能性があるタンパク質ナノマテリアルの設計のために、モデルベースの強化学習を利用した新しい手法を紹介しています。AlphaZeroを用いてタンパク質の主骨格を生成し、形状や構造評価の基準を満たすようにモンテカルロ木探索を改良しました。この技術は既存の方法よりも優れた成果を出し、タンパク質デザインの新たな可能性を示しています。
May 6, 2024 at 8:03 PM
https://arxiv.org/abs/2405.02083
この論文では、深層学習モデルがタスクの内在的制約を無視する問題に取り組むため、「セマンティック損失」という新しい手法を提案しています。この手法は、クラス間の包含関係や排他関係を考慮に入れ、誤りをペナルティで減らすことで、オントロジー分類における論理的整合性を向上させます。ChEBIオントロジーへの応用で、整合性違反を大幅に減少させる一方、分類性能は低下させませんでした。また、教師なし学習にも適用し、一貫性の向上を実証しました。
May 6, 2024 at 8:02 PM
https://arxiv.org/abs/2405.02105
この論文は科学論文の構造化された要約を改善するために、大規模言語モデル(LLM)を利用する方法を提案しています。従来手作業で行われていた研究の貢献を記述するプロパティの自動推薦を目指し、GPT-3.5やLlama 2などのモデルの性能を複数の観点から評価しています。モデルは有望だが、科学的課題に合わせたさらなる調整が推奨されています。
May 6, 2024 at 8:01 PM
https://arxiv.org/abs/2405.00960
デジタルツインは様々な産業で使われており、異なるシステム同士が理解し合うための課題がある。この論文では、「共通コアオントロジー」と基盤とする「デジタルツイン」の定義・設計パターンを紹介し、異なるシステム間の意味の繋がりを強化するための基盤を築いている。
May 5, 2024 at 8:06 PM
https://arxiv.org/abs/2405.00981
この論文は、初対面の設定でユーザーの好みを迅速に識別する会話型レコメンデーションシステムのための新しい方法論を提案しています。従来のベイジアン最適化手法を言語モデルで補強し、自然言語を活用した好みの引き出しを実現しています。特に、ユーザーの発話から好みを推定するための自然言語推論を用い、適切な質問を生成する戦略が特徴的です。実験では、GPT-3.5と比較して好み識別の精度が大幅に向上していることを示しています。
May 5, 2024 at 8:05 PM
https://arxiv.org/abs/2405.01029
本論文は、さまざまな車両ルート問題(VRP)を同時に解くことができる統一されたニューラルネットワークソルバー「MVMoE」を提案。専門家の混在によりモデル容量を増大させつつ、計算負荷を大きくすることなく、実証性能と計算複雑性の良いバランスを実現。10の未確認VRP変種において、ゼロショット一般化性能を著しく向上させた。
May 5, 2024 at 8:04 PM
https://arxiv.org/abs/2405.01259
この論文は、自然言語の推論において文章間の包含・矛盾関係を判定する新しい神経記号的手法を提案しています。文章を「抽象意味表現(AMR)グラフ」に変換し、それを命題論理に翻訳して自動推論するSATソルバーを使います。一般的な知識を応用し、命題の置換または忘却を可能にする緩和方法を導入することで、説明可能で明示的なアプローチを実現し、複数のデータセットにおいて高い性能を示しています。
May 5, 2024 at 8:03 PM