roguelikelog.blogspot.com/2020/05/osus...
Nethackヴァリアント、シンプル化、カジュアル化
常時スポイラー的ヘルプを表示するボタンが特徴(デフォoff)
日本語対応
ビジュアルとサウンドつき
試しに雑にB3までフロア全部みたあと、B4,B5を即降りしてみた結果、
B6でユニコーンに瞬殺
B1~B3がeasyで死ぬ要素なさそうな点が、初心者にもいいかも
roguelikelog.blogspot.com/2020/05/osus...
Nethackヴァリアント、シンプル化、カジュアル化
常時スポイラー的ヘルプを表示するボタンが特徴(デフォoff)
日本語対応
ビジュアルとサウンドつき
試しに雑にB3までフロア全部みたあと、B4,B5を即降りしてみた結果、
B6でユニコーンに瞬殺
B1~B3がeasyで死ぬ要素なさそうな点が、初心者にもいいかも
そうそうそういうやつがほしい
ないっぽい
現実的には、こういうアプリは、
「user各自がscript書いて運用する。
小規模TUI/CLIとしてパッケージングして発表されることは少ない」
かなあ
実際うちのWSLはそういう運用だし
そうそうそういうやつがほしい
ないっぽい
現実的には、こういうアプリは、
「user各自がscript書いて運用する。
小規模TUI/CLIとしてパッケージングして発表されることは少ない」
かなあ
実際うちのWSLはそういう運用だし
こんなもんか
ちょっと過激派だけど、こういうのを小規模コードベースで経験しておくのは学びになるだろう
昔はこういうのは手作業なりscript書くなりしていたが、今はツールかagent
こんなもんか
ちょっと過激派だけど、こういうのを小規模コードベースで経験しておくのは学びになるだろう
昔はこういうのは手作業なりscript書くなりしていたが、今はツールかagent
いきなりRust実装はさすがにハルシネーションするだろう
経験上、計画書の細分化された一部を実行するときですらハルシネーションはありうる
いきなりRust実装はさすがにハルシネーションするだろう
経験上、計画書の細分化された一部を実行するときですらハルシネーションはありうる
promptは500文字制約のなかでできるだけがっつり書いた
これで明日起きるとPRが生成されてるってわけ
内容的に、ハルシネーション確率は25%を想定
promptは500文字制約のなかでできるだけがっつり書いた
これで明日起きるとPRが生成されてるってわけ
内容的に、ハルシネーション確率は25%を想定
といっても、予習しておかないと時間あたりの理解効率が低いので、
projectを進めてもっと実験データを得て理解度を高めつつ、
都度要約させていくのがよさそう
んーリアルタイム演奏のハードルが思ったより高いなー
※事前予想:いまどきライブラリもマシンパワーもあるでしょ
→ 現実:そんなものウチにはないよ…
おそらく「今からリアルタイム演奏に固執して泥沼」のかわりに、
「ゆるい実装で高レイヤーから低レイヤーまで実験してデータを得る」
ほうが全体最適としてはよさげ
といっても、予習しておかないと時間あたりの理解効率が低いので、
projectを進めてもっと実験データを得て理解度を高めつつ、
都度要約させていくのがよさそう
んーリアルタイム演奏のハードルが思ったより高いなー
※事前予想:いまどきライブラリもマシンパワーもあるでしょ
→ 現実:そんなものウチにはないよ…
おそらく「今からリアルタイム演奏に固執して泥沼」のかわりに、
「ゆるい実装で高レイヤーから低レイヤーまで実験してデータを得る」
ほうが全体最適としてはよさげ
うーんいつもの論になってしまった
これはこれでMMLの意義と課題のわかりやすい説明にはなる
ただ、今日この8時に深堀りしたいことはそこじゃないんだよな
朝食とってから整理したほうがいいな
うーんいつもの論になってしまった
これはこれでMMLの意義と課題のわかりやすい説明にはなる
ただ、今日この8時に深堀りしたいことはそこじゃないんだよな
朝食とってから整理したほうがいいな
「おまえはカスタム軽量ホスト(オーディオプラグインの)を試作して
おまえなりのUI/UXを模索しろ」
みたいな提案が出てきてなるほどと思っている
まぁ今やってること
(ホストやプラグイン規格よりも前の素朴な時代のスタイルで、
車輪の再発明をして学ぶこと)
も、それにもつながっていく土台の経験になるとは思う
「おまえはカスタム軽量ホスト(オーディオプラグインの)を試作して
おまえなりのUI/UXを模索しろ」
みたいな提案が出てきてなるほどと思っている
まぁ今やってること
(ホストやプラグイン規格よりも前の素朴な時代のスタイルで、
車輪の再発明をして学ぶこと)
も、それにもつながっていく土台の経験になるとは思う
issueで指示出しでなく、
リポジトリ作成ダイアログで指示出しをするのでそうなる
issueで指示出しでなく、
リポジトリ作成ダイアログで指示出しをするのでそうなる
agentに6並列で投機的実行させて
正答を引くという
成功体験を味わってしまったかー
agentに6並列で投機的実行させて
正答を引くという
成功体験を味わってしまったかー
prompt側でがっつり指示を書いてある
prompt側でがっつり指示を書いてある
事態は変わらないが、
バッfaで吹き出す
どうやったらそんなtypo生成できるんだよ
事態は変わらないが、
バッfaで吹き出す
どうやったらそんなtypo生成できるんだよ
Python soundevice moduleなら、
こんなwithのcallbackだけで
8msで動くんやけどなあ」とcode貼ったら
ギブアップしてしまわれた
Python soundevice moduleなら、
こんなwithのcallbackだけで
8msで動くんやけどなあ」とcode貼ったら
ギブアップしてしまわれた
というノウハウ、割と貴重な気がする
アンチパターンを提示し、それへの対策として提示するのがいいかな
「教えて」
→ 「調査して」
「教えて」
→ 「(自分なりに書いてから)この理解であってる?」
「教えて」
→ 「メリデメ書いて」
(意見を書くだけ)
→ 「(自分なりに書いてから)肯定的批判的にコメントして」
ほかにも用途別にいろいろあるよね
というノウハウ、割と貴重な気がする
アンチパターンを提示し、それへの対策として提示するのがいいかな
「教えて」
→ 「調査して」
「教えて」
→ 「(自分なりに書いてから)この理解であってる?」
「教えて」
→ 「メリデメ書いて」
(意見を書くだけ)
→ 「(自分なりに書いてから)肯定的批判的にコメントして」
ほかにも用途別にいろいろあるよね
これはこれで楽しいな
これはこれで楽しいな
手動でgroundingを指示した
LLM、まだ自動groundingするかどうかの判断基準が学習不足よね
groundingさせた結果、
決定論的ふるまいを指示するファイルがあった
だが、これは環境構築用GitHub-Actions側のほうだった
今回の用途にはマッチしない、という情報が得られた
手動でgroundingを指示した
LLM、まだ自動groundingするかどうかの判断基準が学習不足よね
groundingさせた結果、
決定論的ふるまいを指示するファイルがあった
だが、これは環境構築用GitHub-Actions側のほうだった
今回の用途にはマッチしない、という情報が得られた
別の手をとるのでそれもagentに丸投げした
で、agentの挙動って、決定論的な部分もあるよね
LLMの外側、PRを出す部分とかね
なので、そういう決定論的な部分の設定、
「AGENTS . md のような非決定論的な設定」ではないもの、
ができるといんじゃね?
と思ってClaudeと壁打ちしてた
ただしこの生成、Claudeがヨイショしてるだけの気配はする
別の手をとるのでそれもagentに丸投げした
で、agentの挙動って、決定論的な部分もあるよね
LLMの外側、PRを出す部分とかね
なので、そういう決定論的な部分の設定、
「AGENTS . md のような非決定論的な設定」ではないもの、
ができるといんじゃね?
と思ってClaudeと壁打ちしてた
ただしこの生成、Claudeがヨイショしてるだけの気配はする
容赦なく弱点をえぐってくるねー
容赦なく弱点をえぐってくるねー