ボンギンカン、AIエージェントの成功ワークフロー共有OSS「Fairy Tale」を公開

AIエージェントの成功ワークフローを共有する研究OSS「Fairy Tale」が公開

AIエージェントの成功ワークフローを共有する研究OSS「Fairy Tale」が公開

ボンギンカン株式会社は、AIエージェントに関する公開情報やユーザー報告に基づき、再現可能なワークフロー強化スキルとして整理・提供するオープンソースソフトウェア（OSS）「Fairy Tale」を公開しました。このプロジェクトは、既存のAIモデルでFable級のベンチマークスコアを再現することを目指しています。

開発の背景

近年、AIエージェントはソフトウェア開発、調査業務、ドキュメント作成といった多岐にわたる領域で高い成果を示す事例が増加しています。特にFableクラスやMythosクラスと呼ばれる高性能エージェントは注目を集めていますが、その能力はサービスやアクセス環境に依存し、優れたワークフローや運用知見が閉鎖的になる可能性があります。
また、成果がモデル性能、ワークフロー設計、フィードバックループのどれに起因するのかが不明確であり、再現や検証が難しい状況がありました。「Fairy Tale」は、優れたエージェントの成果を単なる「神話」としてではなく、その背後にある再現可能な手順として確立することを目指して開発されました。

プロジェクト名「Fairy Tale」は、アンデルセン童話『ナイチンゲール』に由来しています。この物語では、機械仕掛けの鳥よりも生きたナイチンゲールの歌声に本質的な価値があると描かれています。この着想に基づき、「Fairy Tale」はAIモデルそのものよりも、その根底にある再現可能な知見やワークフローに焦点を当てた研究プロジェクトとして位置づけられています。

「Fairy Tale」の主な特徴

「Fairy Tale」は、AIモデル自体を改変するものではなく、公開されている高性能AIエージェントに関する報告や事例を研究対象とし、再利用可能なワークフローやベストプラクティスを抽出・整理する点が特徴です。

公開情報のみを対象とした研究アプローチ

「Fairy Tale」は、公開されている公式情報やユーザー報告（SNS投稿、GitHub Issue、技術ブログ、ベンチマーク結果など）のみを研究対象としています。アクセス制御の回避や非公開情報の取得は行わず、公開された事例を分析し、再現可能な手順として整理することに注力しています。

Claude Code・Codex向けに利用可能

本ソフトウェアは、汎用エージェント向けスキル、Claude Code向けスキル、Codex向けスキル、Claude Code向けプラグイン、Codex向けプラグインといった形式で提供されます。これにより、異なるエージェント環境でも共通のワークフローを活用できる構成となっています。

自己フィードバックによる継続的な改善

「Fairy Tale」には、モデルの再学習なしにワークフロー側の改善で性能向上を図る「自己フィードバック機構」が実装されています。この機構は、タスク実行、失敗パターンの分類、汎用的な改善ルールへの変換、同条件での再評価、効果のないルールの自動削除という閉ループで構成されています。例えば、「あと1項目で合格だったケース」や「根拠不足による失敗」などを分類し、再利用可能な改善ルールとして蓄積します。効果が確認できないルールは自動的に刈り込まれるため、知見が肥大化することなく、継続的な精度向上が期待できます。

研究段階での検証結果

「Fairy Tale」では、生物学、法務、コーディングなど複数の領域でワークフロー改善の有効性が検証されています。ローカル検証では、BioMysteryBench-previewにおいてGPT-5.5単体60.0%に対し80.0%、Harvey LAB互換法務ベンチマークではGPT-5.5単体2.1%に対し11.0%を記録しました。一部のベンチマークでは、公開されているFable/Mythos系エージェントの報告値に近づく結果も確認されています。
また、自己フィードバック機構を適用した法務評価では、全項目合格率が0.0%から20.0%へ、Criterion Pass率が83.21%から90.61%へ改善し、One-Miss失敗が10件から5件に減少しました。これらの結果は研究段階でのローカル検証値であり、公式ランキングやベンダー公表値を示すものではありません。