彷徨っている情報系教員
banner
tsuchm.bsky.social
彷徨っている情報系教員
@tsuchm.bsky.social
情報系の大学教員です。職務に関係するように見えるつぶやきが多いですが、全ての発言は架空のもので、所属組織はもちろん、本人および現実世界と関係ありません。
本日は子供と一緒にハイキング。まだ付き合ってくれるので嬉しい限り。かなり体力がついてきたので、大人向けのガイドブックのコースタイムとほとんど変わらない時間で歩けました。が、疲れている終盤に急な下りがあったので、想定よりきつかった。もっと筋トレしなさいと言うことらしい。
November 24, 2025 at 8:42 AM
子供が中学生になってから、どこに行く時も交通費がかさんで困る。中学卒業時まで子供料金にならないかなあ(可処分所得を倍に増やしてくれるのでも可)
November 21, 2025 at 10:43 PM
大学の入学難易度って、河合塾全国統一模試などの大規模模試の偏差値が長らく使われてきたわけですけど。近年、一部私大では、一般入試の倍率が下がりすぎて模試受験者が全員合格するとBF(ボーダーフリー)と記載されることを嫌って、推薦入試で十分に合格者を集めておいて、一般入試の倍率を形式的に維持するという対策が流行っているらしいのですが。で、そういうのは、一般入試経由での入学者率を見れば分かるらしい(表は www.newsweekjapan.jp/stories/worl... からの引用)。データって、ほんと誤魔化しが効かないな。こわやこわや。
November 10, 2025 at 12:12 PM
今回の地震 www.data.jma.go.jp/multi/quake/... でも活躍したみたいですけど。海底地震津波観測網 www.seafloor.bosai.go.jp/S-net/ の観測点の配置図を見るといつも、二度とやられるものかという執念を感じる。
November 9, 2025 at 1:03 PM
LLMを使ったsteganographyの手法 arxiv.org/abs/2510.20075 が面白い。元の隠したい文をLLMでtokenizeして、各tokenが何番目に大きい確率で生成されるか?という順位を記録しておく。秘密のプロンプトをLLMに入力した後で文を生成させる時、先に記録した順位に従ってtokenを選択して文を生成する。すると、秘密のプロンプトを上手に選べば、元の文の趣旨を隠蔽した上で、元の文と同程度に確率的に尤もらしい文を生成できる。
某国では、SNSの発言も監視されているらしいですけど、この手法を使えば安全に出し抜けそうな気がするなあ。
October 29, 2025 at 11:28 AM
Chromebook的な使い方をしているノートPCだったので、さくっとクリーンインストール。
したのは良いのすけど、どうやらDebian6の頃から同一のUSBメモリをインストーラ用に使い続けているな…物持ちが良いにもほどがある。
October 28, 2025 at 12:01 AM
現代日本では、全国津々浦々まで舗装道路が通じており、トラックで荷物が運べることが普通になっているので、想像しづらいわけですけど。道路がほとんど舗装されていなかった昭和中期までは、鉄道は「鉄で強化された高規格道」だったわけで、そりゃ貨物輸送は鉄道主体で当たり前だよね。
逆に言えば、これだけ舗装道路が発達すると、鉄道の優位性って以下略。
(グラフは www.mlit.go.jp/road/ir/ir-d... を加工して作成)
October 26, 2025 at 2:54 AM
「全てのテナントのデータは単一のテーブルに格納されていますが、各テナントには tenant_id が付与されているので、情報は区別されています!」って、それはテナントが独立しているとは言わんのじゃ。
(広島大学クラウドサービス利用ガイドライン www2.media.hiroshima-u.ac.jp/public/about... の図8を適用すると、信頼度IIになるよなあ)
September 22, 2025 at 1:47 AM
sshuttleの実行時にsudoのパスワード入力を省略しようとして、sshuttle --sudoers-no-modifyで生成された設定をsudoersに追加したところ、どうしても上手く動かず2時間はまったのですけど。sshuttleが生成したコマンド指定文字列が間違ってた…ぶつぶつ。
September 17, 2025 at 4:05 AM
基盤システムが設置されている建物なのに、雨漏りで配線ピットに水が溜まったりする大学で勤務していると、ついつい僻みっぽくなってしまう。
September 15, 2025 at 11:08 AM
子供を連れて樹上アスレチックコースに行ってきました。小さい時は勢いでクリアできたのに、大きくなって余計なこと(落ちたらどうなるか)を考えられるようになったらしく、一部のコースを回避。成長も一筋縄ではいかないものですね。
September 15, 2025 at 10:07 AM
開館時に作成したと思われる展示パネルがそのままだった市立科学館。2029年に閉館、2030年に新築・再開館という計画が発表されたのですけど。まあ、相当に古かった建物が新しくなること自体は良いニュースですが、運用体制をどうにかしないと二の舞になるんじゃないかなあ。
August 25, 2025 at 6:14 AM
子供に趣味の知識量も趣味にかける体力も負けそう(良いことだ。それにしても、いきなりマニアックなところに行きたがるのでびっくり。どこで知ったんだか)
August 21, 2025 at 2:32 PM
子供とキャニオニングに参加したのですけど。ここのところ、柔軟体操をさぼっていたツケを痛感。普段の生活ではなかなか出てこない姿勢をとろうとすると、身体がかたくて一苦労。筋トレも柔軟も両方やらなきゃ駄目だなあ。
August 16, 2025 at 11:11 PM
先日、福井県立恐竜博物館に行ってきたのですけど。骨格標本がやたらと充実していることにまず圧倒されたのですが。更に凄いのは、恐竜類についての現段階での系統樹(添付の画像は、同博物館図録から引用)に基づいて、主要な系統をきちんと網羅するように収集しているということなんですよね。これはだから、恐竜の分類学を真剣に実施する構想があるということで、それだけの構想をプレゼンして予算を獲得してきた人も、予算を措置した人も、どっちも凄いよなあ…
August 13, 2025 at 12:44 PM
本日のbluesky
(三連休初日だけどなんとかなるでしょとたかを括っていたら、天守閣入場まで50分待ちという掲示が出ていて焦りましたが。その場で入場時間指定の電子チケットを検索したところ、運良く待ち時間ほとんど無しで入れる枠が残っていたので、なんとか事なきを得ました。やれやれ)
August 9, 2025 at 5:29 AM
本日のbluesky
August 8, 2025 at 6:55 AM
そもそも来館者が少ない博物館なのですけど。その数少ない来館者もほとんどが、この赤錆びた地味な球体に気付かずに通り過ぎてしまう…なんでや。人間が宇宙に行って生きて帰って来れることを証明した貴重なブツなのに。
August 7, 2025 at 1:26 PM
本日のbluesky
(見る人が見たら一発で場所が分かる写真。悪天候で在来線は止まるし、道路冠水でマップ通りのルートではダメで迂回しなければならないし。めちゃくちゃ苦労しました)
August 7, 2025 at 12:28 PM
生成AIサービスの出現以後、advancement や delve などの生成AIサービスの出力に特有の語彙は、研究論文(書き言葉)において利用率が増加しているよ。その語彙の一部は、科学研究に関するポッドキャスト(話し言葉)でも利用率が増加しているよ、という論文 arxiv.org/abs/2508.00238
こういう結果を見ると、生成AIサービスの出力が、学習コーパスの分布を反映していると素朴に考えるのは危ないんじゃないかなあ
(なお、この論文は、生成AIサービスの出力に人間の言語運用が影響を受けている可能性を示唆しているので、さらに解釈は面倒な事態になるのですけど)
August 5, 2025 at 2:36 AM
三角六段の気持ちが良く分かるようになりました…って、この人、1巻では26歳なんですよね?人生何周目?私が26歳の頃なんて以下略。
(画像は、三月のライオン3巻p.67より引用)
August 4, 2025 at 11:43 AM
キャッシュレスバス実証運行の報告書 www.mlit.go.jp/report/press... によると、意外なことに、キャッシュレスに反対している人が多いのは10代以下の学生らしい。高校生以下はクレジットカードが持てないからクレジットカード決済が使えないし、交通系ICカードも現金チャージになるから、なのかな。
July 24, 2025 at 11:51 AM
エアコン復旧した!のとは関係なく、本日のbluesky
July 21, 2025 at 11:39 PM
Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination arxiv.org/abs/2507.10532
Qwen2.5-Math-7Bモデルに、MATH-500テストセットの質問文の前半60%を入力したら、後半40%を完全に再現した質問が54.60%もある。つまり、事前学習データにMATH-500テストセットが混入しているデータ汚染の可能性がとても高いよ、という論文。やっぱりデータの品質は大事だよなあ。
July 16, 2025 at 1:42 AM
大規模言語拡散モデル yoheikikuta.github.io/blog/2025-06... って、前方文脈だけでなく後方文脈も参照することを許容していて、とても面白い。というか、人間が作文するときも、文頭から決定的に作文するわけではなくて、作文しやすいところから行ったり戻ったりしながら作文してるものな(書き言葉の場合)。mask predictor(図は arxiv.org/pdf/2502.099... から引用)の部分を発話プラン制御と関連させる、という発展がすぐに出てきそうな気がする。
July 15, 2025 at 10:11 PM