banner
sigh-kgr.bsky.social
Q
@sigh-kgr.bsky.social
普通に面倒だったのでパッケージ化して持っておく 300文字制限がきついのであんまり使うことはなさそう
October 19, 2024 at 3:55 PM
問題の設定を変えたらそれなりにうまく行くようになった やはりランダムフォレストは強い
ある程度チューニングしたらデータ10倍くらいにして本番行くか
January 13, 2024 at 4:03 PM
明らかに変化があったのでPFIを見てみる 同等程度の重要度を持っていてほしい特徴の組がいくつかあるけどそうなっていないので、やはり何かしらのチューニングが必要そう
January 13, 2024 at 11:18 AM
まずは最適化の前に特徴量を減らしてみる 大きく分けて2つの属性があるので、1つをomitしてみてどうなるか
January 13, 2024 at 10:46 AM
よくみたらrandom forestのR2は負ではあるものの他より1桁良かった のでFastForestのチューニングを試みる
January 13, 2024 at 10:42 AM
いやわかってましたよ パラメータチューニングなしで使うには特徴量多すぎるよな ちなみにRandom ForestもSDCAも全滅だった サイコロ振ったほうがマシなレベル
January 13, 2024 at 10:27 AM
わーい、RSquaredが負だー
January 13, 2024 at 10:26 AM
やっとデータ準備できた やりたいのは特徴量16, 出力1の回帰
RegressionTrainerを適当に突っ込んでみる まずはせっかくMicosoftなのでLightGBMから
January 13, 2024 at 10:23 AM
クエリも遅ければクレンジングも激重なのでバイナリに保存した
pythonならこれで爆速になるんだけど3分が40秒になっただけって感じでうーん
January 13, 2024 at 9:25 AM
とりあえず説明変数と目的変数を全部floatにしたデータクラスを作る データソースはrdbだけどクエリ一発で取ってくるにはちょっと面倒なので一回メモリに読む前提で属性とかはいいや
January 13, 2024 at 1:34 AM