yng
banner
yng.bsky.social
yng
@yng.bsky.social
機械学習をお仕事にしています
https://yng87.page/
素粒子現象論をやっていた者としては、天文の解析論文は同じ対象でも著者が変わって解析の仮定が変わればかなり結果が変わるという印象がある。あと例のプレスリリースはWIMPにしては消滅断面積が大きすぎると思うので、理論モデルとして解があるのか怪しい
November 28, 2025 at 4:38 AM
Reposted by yng
主に向こうのSNSで話題になっている例のWIMP検出(?)論文だけど、一般論として、観測波長によらず、ああいったdiffuseな輻射に対して観測機器由来のアーティファクトやゴースト、前景輻射を含む他のソースからのコンタミを適切に差し引いた上で評価するのは極めて難しいことは認識されておくべきだと思う。
(当該論文は斜め読みしただけだし専門外なので評価しないけど)少なくてもinstrumentationとデータ解析と想定されうるコンタミ輻射に対する極めて精緻な知見と慎重な態度を持った人が実施した研究でない限り、正直文言通り受け入れるのは難しい成果ではないだろうか。
November 28, 2025 at 4:32 AM
自分が最近Xを見ないのは、技術界隈すらClickbait的な投稿が多くて見ていてキツいからというのがある。驚き屋だけではなく、不確実な事象に断定的な口調を取ることでポジションを取ろうみたいな投稿が多くあるように感じる
November 28, 2025 at 1:17 AM
三井住友銀行アプリ、カード利用通知の許諾でOliveのキャンペーン頻繁に送ってきて本当に腹立つ
November 27, 2025 at 7:10 AM
論文実装リポジトリを雑に信頼して使ってたらnn.ModuleListではなくただのリストに重みを入れている部分があって死んだ
November 24, 2025 at 6:14 AM
uv で環境依存が激しいライブラリ(例えば特定cudaバージョンのtorch)を扱う時に、tool.uv の environments を指定すると対象となるOSとか制限できて、macでも uv lock を通しやすくなるというのを学んだ
November 23, 2025 at 1:03 PM
rectools、implicit (開発が止まっている) に依存しているせいで、最近のバージョンのpythonでインストールする難易度が高すぎる
November 23, 2025 at 12:58 PM
これ良くやるけど現職だとあまり一般的にやられてなくて驚いた
November 22, 2025 at 9:30 AM
Reposted by yng
口頭で話した内容をメモとしてチャットに書くのってあんまり一般的ではないらしいがとても便利なのでみんなやったほうがいい
November 22, 2025 at 7:56 AM
議事録って参加者で意思決定内容に齟齬がないか確認したり、next actionを明確化したりするためのものだから、AIに議事録取らせて事後共有みたいなやり方では代替できない
November 22, 2025 at 12:35 AM
「AIの要約つけておきました!」と言われても誰も読んでいないのである
November 22, 2025 at 12:26 AM
Reposted by yng
truth hurts
November 21, 2025 at 5:21 PM
今やってるタスクだと、2.5 proでthinking最小にするくらいが性能とレイテンシのバランスが良いんだよな
November 19, 2025 at 9:55 AM
Gemini 3、thinking_level=low でflash 2.5くらいのレイテンシみたいに書いてあるけど本当?ちゃんと条件揃えて比べられてないけどもっと遅い気がする
November 19, 2025 at 9:54 AM
自分がやってるタスクだとgemini 2.5 proが一番うまく指示を守ってくれてる
November 13, 2025 at 10:51 PM
オレオレ実装を書かず、SDKのドキュメントを落ち着いて読んでから作業始めて欲しい
November 7, 2025 at 6:07 AM
codex使い始めてclaude codeよりも良いコード書くなと思ってたけど、ある程度以上複雑なことをやらせると複雑でキモい本当に必要かもわからない独自実装を大量に入れてきたりするのでダメだ
November 7, 2025 at 6:06 AM
Pixel 8aが壊れたので9aを買ったんですが、今の所何も違いを感じない
November 6, 2025 at 9:34 AM
スマホが死んでいるので手の甲にペンでメモを取ったりしてる
November 1, 2025 at 5:10 AM
時々ベイジアンABテストならいつでも結果を見て閾値を越えたら実験を止めて良いという主張を見かけるけど、それは間違いだよという話
www.alexmolas.com/2025/10/30/b...
Bayesian A/B testing is not immune to peeking
www.alexmolas.com
October 30, 2025 at 10:56 AM
通勤中pixel 8aが急にブラックアウトし全く反応しなくなった。充電ケーブルに繋いでもひんやりしたままだし電気系統がイかれてしまったか…。よく地面に落としたりだいぶ雑に扱ってたからな…
October 30, 2025 at 8:53 AM
大AI時代、判定したい正例だけを集めたデータセットを作って改善などが横行してしまう(全部1と予測するヒューリスティックを超えられない)
October 30, 2025 at 12:10 AM
強化学習あまりわかってないけど、LLMの文脈だと難しいことしすぎずREINFORCEでも良さそうってことなのかな
cameronrwolfe.substack.com/p/reinforce
REINFORCE: Easy Online RL for LLMs
How to get the benefits of online RL without the complexity of PPO...
cameronrwolfe.substack.com
October 25, 2025 at 9:58 AM
Amazon アプリ、画面がすごくゴチャついてるし購入画面に進もうとしてもレコメンド大量に挟んでくるし、検索は関連度の低いスポンサー商品ばかりだし、世界一のECがABテストを幾度も繰り返した末にできるプロダクトがこれかぁと思う
October 25, 2025 at 9:05 AM