newnakashima
newnakashima.bsky.social
newnakashima
@newnakashima.bsky.social
Web系の底辺中年プログラマです。PureScriptとかが好きですが全然触れてません。生成AIで人生を一発逆転させたいです。

https://github.com/newnakashima
Agent Teams使ってみたけど結局作業に依存関係があってシリアルにしか実行されない。プランも立てないようだしアウトプットは劣化するのではという印象。今後に期待
February 8, 2026 at 10:34 AM
Claude Codeの使いすぎがストレス源になってる気がする。いくら優秀になったとはいえAIに対してはイライラさせられる。自分がハンドリングできない領域が増えるからなのか
February 8, 2026 at 5:01 AM
下手に Plugin とか Skills とか Subagents とかいじるよりも、普通にClaude Codeにプランニングさせてコンテキスト消して実装させたほうがアウトプットが良い。
February 4, 2026 at 1:52 PM
Opus 4.5 が出してくるPRに対してこっちから軌道修正させる確率は3割行かない気がする。ノールックだと絶妙に違う方向にいってしまう率だから一応レビューするけど、大体文句ないんだよな。もう割り切ってレビューせず、不満に感じたらあとから修正のプルリク作らせるという方針でも良いのかも知んない
February 3, 2026 at 2:46 PM
ちょっと前まで Cloudflare Workers が最強だと思ってたけど最近は Cloud Run + Turso が最強だという気がしてきた。無料で個人開発しまくるという意味で。

Cloud Run の環境を AI に作らせるとバックエンドが Node であってもほぼ毎回 Dockerfile を作ってくるので、今後はここを改善していきたい。

でも Docker だからこそ Bun とかも動かせるしそれはそれでイイとも思った
February 3, 2026 at 2:42 PM
タスクを分割させてエージェントを10個並列で走らせる的な方法はやっぱり非現実的な気がする。AIはタスクの依存関係を長期記憶で理解することが苦手だしコンフリクト解消もあまりうまくない。ポテンヒット的な実装漏れも頻発する。エージェント10個走らせてる俺TUEEEww的な遊びに過ぎないし、エージェント10個走らせるだけなら誰でも簡単にできる。。。
February 3, 2026 at 2:32 PM
Opus 4.5 に設計書を書かせてから実装させてるけど、その内容が普通に勉強になる。RAGの作り方とか、ほえー、ふーんと思いながら感心している。。
February 2, 2026 at 11:57 AM
最近、ネットの有名なエンジニアの人が作ったというOSSがバグだらけでまともに動かないということがあった。それをClaudeに直させようとしたらそもそも仕様がおかしいとか複数のバグが絡んでたりしてOpus 4.5でも直せない。バイブコーディング一本槍だと行き着くところはこんなもんなんだなと思って悲しくなってしまった。。
January 30, 2026 at 3:12 PM
Claude Codeで何十個もエージェントを並行で動かす、みたいなのよく流れてくるけど、実際にClaude Codeで作業してるとそんなに並行でやってるってことは中身はおろか人の手で動作確認や仕様確認もしてないというのがわかる。それだと実験とかAIにマイクラもどき作らせてるYouTuberと変わらないのではと思う。。
January 30, 2026 at 3:10 PM
MCPよりCLIの方が良いみたいな議論あるけどMCP Appsにより MCPは別次元に行ったからこの議論おしまいという感じがある。というかこうなると思っんてたのがようやく来た。俺も自分のチャットアプリをMCP Appsに対応させたい、、、!
January 30, 2026 at 1:44 PM
Opus 4.5が書いてくるコードはケチつけようがないことが多い。そのおかげで過剰な実装になることもしばしば。プロトタイプ作る上では他のモデルみたいに見栄えだけは良いけど中身ガバガバな実装にしてもらった方が良いのかもしれない。
January 29, 2026 at 2:40 PM
未来はMCP Appsの方にありそうだな。この一年はチャットインターフェースにアプリ作ることを心がけた方がいいかもしれない
January 29, 2026 at 12:50 AM
Gemini API のドキュメントを必要な部分だけ読んでみたりするけど、もうなんでもできるな。至れり尽くせり感がある。URL渡せばそれを理解してくれるし、しかも Google の巨大なインデックスからキャッシュを探してくれるらしい。PDFも良い感じに文字も画像も理解してくれる。NotebookLMがあるんだからできなきゃおかしいという話ではあるが、こういうの他の LLM の API でやろうとしたらどれも地味に一手間二手間かかるんじゃないだろうか。
January 27, 2026 at 2:18 PM
Claude は Subagents 使えと言わないと使ってくれないなあ、、、
January 27, 2026 at 12:00 PM
次に何か開発する時はBunでSPAフォールバックを使ったサーバーとフロント統合アプリをCloud Runでデプロイしたいな。
January 24, 2026 at 8:23 AM
1日8時間働いたとして、2時間は個人開発、2時間は読書(技術書以外)するのが理想の生活だ。
January 21, 2026 at 1:30 PM
世間のみんなはClaude Codeを使ってるみたいだけど自分は最近もっぱらGemini(Antigravity)を使っている。個人開発する上ではマルチモーダル性能が強いのが本当に助かる。雑な画像渡してもいい感じに理解してくれるし、プレースホルダの画像もどんどん作ってくれる
January 6, 2026 at 1:26 PM
エッジLLMは一般化には当分至らないと思う一方、コンピューティングリソースの逼迫は明らかで、個人的には軽量安価なCDNエッジLLMと、その性能を補うためのSQLiteを使ったローカルベクトルDBが今年か来年クルのではないかと考えている。
January 6, 2026 at 1:10 PM
ローカルのRAGにsqlite-vectorが良さそうだと思ってたけどライセンスが微妙だなぁ、、、SaaSに誘導するためのOSSか〜。メンテ頻度が低いけどスター数とかネットの情報量とかを考えたら大人しくsqlite-vecを使っておくのが良さそう
December 24, 2025 at 1:09 AM
WebLLMとSQLite Vectorで、ブラウザで完結するローカルRAGを作ろうとしてみてるが難航している。難しい。。しかもその割に多分利便性は乏しい。完全な遊び。
December 16, 2025 at 11:01 AM
本当のハッカーはオープンウェイトのLLMを使ってるんだろうけど、性能でClaudeとかGPTとかGeminiに劣るのは否めない。というかプログラミングそのものの価値がChatGPT以後どんどん下がっててWebエンジニアはあんまりかっこよくなくてAIモデル作ってる人がかっこいいという雰囲気になっている
December 5, 2025 at 6:06 AM
Claudeって最初はハッカー向けのLLMという雰囲気だったのに最近は産業用のLLMになってきたなあ。なんか全然楽しくない。。。チームのルールに合わせたskillのマークダウンとか書きたくないんよ
December 5, 2025 at 4:10 AM
Claude 解約した。Opus 4.5 はまあまあ良さげだったけど、$20 で Codex が結構使えるのに比べると $100 はコスパ悪すぎる。
December 1, 2025 at 7:58 AM
今まであんまり使っていなかったけど、最近のフロントエンドはHTTPSじゃないと使えないAPIが多いし WebSocket とか WebRTC とかもあるので手軽にドメインとHTTPSが使えるngrokみたいなサービスは殆ど必須だな。
November 25, 2025 at 9:45 AM
Gemini 3 を使って Google AI Studio で簡単なWebアプリ作ってみたけどそこそこ良い感じに作れた。GitHub リポジトリにコード置けるし Cloud Run でデプロイもできる(初回は500エラー出たけど)。Stitchパワーなのか知らないがデザインもClaudeとかCodexに比べてかなり良い。これはかなり良いのでは?
November 20, 2025 at 1:12 AM