某国では、SNSの発言も監視されているらしいですけど、この手法を使えば安全に出し抜けそうな気がするなあ。
某国では、SNSの発言も監視されているらしいですけど、この手法を使えば安全に出し抜けそうな気がするなあ。
したのは良いのすけど、どうやらDebian6の頃から同一のUSBメモリをインストーラ用に使い続けているな…物持ちが良いにもほどがある。
したのは良いのすけど、どうやらDebian6の頃から同一のUSBメモリをインストーラ用に使い続けているな…物持ちが良いにもほどがある。
逆に言えば、これだけ舗装道路が発達すると、鉄道の優位性って以下略。
(グラフは www.mlit.go.jp/road/ir/ir-d... を加工して作成)
逆に言えば、これだけ舗装道路が発達すると、鉄道の優位性って以下略。
(グラフは www.mlit.go.jp/road/ir/ir-d... を加工して作成)
(広島大学クラウドサービス利用ガイドライン www2.media.hiroshima-u.ac.jp/public/about... の図8を適用すると、信頼度IIになるよなあ)
(広島大学クラウドサービス利用ガイドライン www2.media.hiroshima-u.ac.jp/public/about... の図8を適用すると、信頼度IIになるよなあ)
(三連休初日だけどなんとかなるでしょとたかを括っていたら、天守閣入場まで50分待ちという掲示が出ていて焦りましたが。その場で入場時間指定の電子チケットを検索したところ、運良く待ち時間ほとんど無しで入れる枠が残っていたので、なんとか事なきを得ました。やれやれ)
(三連休初日だけどなんとかなるでしょとたかを括っていたら、天守閣入場まで50分待ちという掲示が出ていて焦りましたが。その場で入場時間指定の電子チケットを検索したところ、運良く待ち時間ほとんど無しで入れる枠が残っていたので、なんとか事なきを得ました。やれやれ)
(見る人が見たら一発で場所が分かる写真。悪天候で在来線は止まるし、道路冠水でマップ通りのルートではダメで迂回しなければならないし。めちゃくちゃ苦労しました)
(見る人が見たら一発で場所が分かる写真。悪天候で在来線は止まるし、道路冠水でマップ通りのルートではダメで迂回しなければならないし。めちゃくちゃ苦労しました)
こういう結果を見ると、生成AIサービスの出力が、学習コーパスの分布を反映していると素朴に考えるのは危ないんじゃないかなあ
(なお、この論文は、生成AIサービスの出力に人間の言語運用が影響を受けている可能性を示唆しているので、さらに解釈は面倒な事態になるのですけど)
こういう結果を見ると、生成AIサービスの出力が、学習コーパスの分布を反映していると素朴に考えるのは危ないんじゃないかなあ
(なお、この論文は、生成AIサービスの出力に人間の言語運用が影響を受けている可能性を示唆しているので、さらに解釈は面倒な事態になるのですけど)
(画像は、三月のライオン3巻p.67より引用)
(画像は、三月のライオン3巻p.67より引用)
Qwen2.5-Math-7Bモデルに、MATH-500テストセットの質問文の前半60%を入力したら、後半40%を完全に再現した質問が54.60%もある。つまり、事前学習データにMATH-500テストセットが混入しているデータ汚染の可能性がとても高いよ、という論文。やっぱりデータの品質は大事だよなあ。
Qwen2.5-Math-7Bモデルに、MATH-500テストセットの質問文の前半60%を入力したら、後半40%を完全に再現した質問が54.60%もある。つまり、事前学習データにMATH-500テストセットが混入しているデータ汚染の可能性がとても高いよ、という論文。やっぱりデータの品質は大事だよなあ。