orotiyamata.bsky.social
@orotiyamata.bsky.social
Xくんダウンしたのかな
March 10, 2025 at 2:01 PM
Reposted
こういう技術を作りたいのでこういうデータが必要です、あなたの利益を害することはありません。
って許諾を得て作られた前者。

とりあえずなんにでも使えるデータセットを、無許諾でネットのデータをかき集めて作りました。
これ使って何か作ってくださいの後者。

どっちがまともかなんて考えるまでもない。
まず目的がありきで必要なものをしかるべき手順を踏んで集めるべき。
データセットが先にあることがそもそもおかしいのだ。
法的には許されていても、ちゃんと学習データの許諾を得ていた医療系、顔認識系のAI開発のやり方が正解だったんだよ。

特化型だからできることかもしれないが、実現したい機能ありきでの特化型で何が問題なのかと。

もし画像生成AIを作りたいなら特化型で良かったはず、無差別にデータをかき集めるんじゃなくて許諾を得て画像を集めれば良かったのだ。
December 17, 2024 at 3:51 AM