はらたけ
banner
haratakeshi.bsky.social
はらたけ
@haratakeshi.bsky.social
AIばかり使ってるきのこ
Zenn: https://zenn.dev/haratakeshi
具体的にはJSON出力してもらうときに カンマが多すぎる率が高く、カッコが多すぎる率も高く、つまりJSON Schema指定した場合のエラー率が具体的に高すぎる。

GeminiのPreviewモデルだと毎回発生してるんで、多分なんか……こう……あるんだと思う、社内的に。後でゆっくり修正する、みたいな……

Toolユースだと致命的なのでコンテキストが腐敗すると大体おかしくなるのもコレのせいだと思ってる
November 29, 2025 at 10:35 AM
裏を返せば、この手の成果物を登録させるプラットフォーム側は「あえて自動化させづらい箇所を1〜2カ所用意して、ギリギリめんどくさいけど人間がやればまぁ解決するし……」というところを攻めると良い、という話やな
November 20, 2025 at 2:01 PM
暴論かと思ったけど、よく考えてみればAIが使うものだけ作れば(例えば些細なモジュールも外部利用可能なAPI / MCP化するとか)、むちゃくちゃ高速に開発進められるな

ユースケースもAIに提案させる
仕様設計とレビューもAIに任せる
並行実装でゴリゴリ進めさせる
出来上がったもののレビューもAIに任せる
マージの手続きもAIに任せる
出来上がったもののレビューもAI任せ
ブツが出来上がったあとに使うのもAIで、AIからのフィードバックでよりよいプロダクト化するためのIssue / TODOの作成もAIが担当

おいおい、もう人間様はご飯とトイレと寝床を行き来するだけの存在やんけ
November 7, 2025 at 2:14 AM
並行実装はすごく体験が良い
しかし莫大な量の変更があっという間に出現するので、ユーザーテストが全然間に合わない
コードレビューはCodexに任せてるし、なんならコンフリクトの修正もCodex / Claudeに任せてるけど「出来上がったものを人間が使う」というボトルネックが重たすぎる

もう人間が使うものを作るのを辞めるしかない(暴論)
November 7, 2025 at 2:14 AM
1日10回じゃなくて、1分で10回か、、、じゃあ大丈夫かな?1日だと400回くらい使えるのか。とりあえず申請しとこ
October 28, 2025 at 11:32 AM
これと同じことが多分Claude Haiku 4.5でも出来るし、実際の開発現場では行われている可能性が高そうだな〜って思ったり。

AIがタイポすることがほぼ無くなった現在、コードのミスは実装の不備ではなく仕様設計が間違っている割合が高まってるように思うので
つまり人間の要求とAIが細分化する仕様設計が100%であれば、FlashやHaikuでも正しいコードが書けるようになってるのかも
October 22, 2025 at 10:00 AM