Experiments

再現可能なデータで AI を検証する。

「やってみた」ではなく「N 回試した結果はこう」。Codex / Claude Code / Gemini をマルチエージェント合意で動かし、検証可能な実験ログを蓄積します。

方針

数字とコードで検証する、マルチエージェント合意の考察。

実験ごとに Claude(仮説検証視点)/ Codex(批判視点)/ 別エージェント(統合視点)を走らせ、 複数の AI が合意した点だけを最終考察として残します。 「ありふれた一般論」を排除し、データドリブンに次の判断を提示します。

最初の実験を準備中です。

GitHub Actions の `run-experiment` ワークフローが起動すると、 ここに最新の検証データが追加されます。実験設定はscripts/experiments/[id].ymlに書きます。