国産AIエージェント基盤「JAPAN AI Code」、ソフトウェア開発ベンチマークSWE-bench Verifiedで解決率80.2%を達成

未分類

JAPAN AI Codeの概要

JAPAN AI Codeは、JAPAN AIが独自開発したAIエージェント基盤上で動作するソフトウェア開発支援AIエージェントです。従来のコード補完ツールとは異なり、課題の理解から調査、実装、検証までを一貫して自律的に実行できます。コード記述だけでなく、バグの根本原因調査、コードレビュー、テスト作成、アプリケーション開発まで、ソフトウェア開発における幅広い業務に対応します。

JAPAN AI Codeは、同社が提供するAIプラットフォーム「JAPAN AI STUDIO」と統合されており、企業が保有するナレッジ、ドキュメント、プロジェクト情報にアクセスしながら作業を進めることが可能です。これにより、組織のコンテキストを理解した上で開発を支援する、企業向けAIエージェントとして機能します。

SWE-bench Verifiedベンチマークでの成果

SWE-bench Verified(https://www.swebench.com/)は、AIがソフトウェア開発の実課題をどの程度解決できるかを測る国際的なベンチマークです。このベンチマークは、Django、Matplotlib、scikit-learnなどの主要なオープンソースプロジェクトにおいて、GitHubで実際に報告されたバグや機能要望から選定された500問で構成されています。

AIエージェントには問題の説明文とリポジトリのソースコードのみが与えられ、この情報のみを基に、コードベースの探索、原因特定、修正実装、既存テストの通過確認までの一連の作業を自律的に完了する必要があります。JAPAN AI Codeは、全500問中401問を解決し、解決率80.2%を達成しました。

2026年2月時点のSWE-bench公式リーダーボード(https://www.swebench.com/)に掲載されている数値に基づくと、JAPAN AI Codeの解決率80.20%は、他の主要なコーディングAIエージェントと比較して高い水準にあります。

また、各AIモデル提供元が自社のモデルに最適化したAIエージェント構成で評価したSWE-bench Verifiedスコア(参考値)と比較しても、JAPAN AI CodeはClaude Opus 4.5に次ぐ80.2%のスコアを記録しており、独自開発のAIエージェント基盤の技術力の高さを示しています。

JAPAN AI独自のAIエージェント基盤

JAPAN AI Codeの最大の特徴は、JAPAN AIが独自開発したAIエージェント基盤上で動作する点です。この基盤は、AIモデルのAPIを呼び出すだけでなく、その上に独自の技術レイヤーを構築することで、AIモデル単体では達成困難な精度と安定性を実現しています。

主な技術要素は以下の通りです。

  • マルチAIエージェント連携: 複雑なタスクを複数の専門エージェントに分割し、並列で探索、分析、検証を実行します。

  • 動作ツールの最適な選択: 100種類以上のツールの中から、タスクに応じて最適なツールを自動で選択・実行します。

  • コンテキスト管理: 長時間作業においても、文脈の要約・圧縮技術により関連情報を維持し、一貫性のある作業を実現します。

  • マルチAIモデル対応: Claude、GPT、Gemini、Kimiといった主要なAIモデルに加え、オープンソースモデルにも対応しており、用途や予算に応じた最適なモデル選択が可能です。今回の評価では、Claude 4.5 Opusを主軸に、GPT-5.2 Codexをサブエージェントとして組み合わせた構成が活用されました。

これらの技術要素は、SWE-benchのような標準的な評価基準で高い成果を出すだけでなく、実際の開発現場での複雑なタスクを安定的にこなすための基盤となっています。

JAPAN AI Codeの強み

JAPAN AI Codeは、以下の強みにより、開発現場での生産性向上に貢献します。

  • 組織のコンテキストを理解: JAPAN AI STUDIOと統合されているため、プロジェクトのドキュメント、過去の会話履歴、社内ナレッジベースにアクセスし、組織の文脈を理解した上で開発を支援します。

  • エンジニアリングの民主化: エンジニアだけでなく、JAPAN AIのユーザーであれば自然言語での指示により、業務の自動化、ファイル操作、簡易アプリケーション作成などが可能です。これにより、技術部門と非技術部門の連携を促進し、組織全体の生産性向上に寄与します。

  • コストと品質の柔軟な選択: 複数のAIモデルに対応しているため、タスクの重要度や予算に応じて最適なモデルを選択できます。例えば、高精度が求められる本番コードの修正にはClaude Opus 4.5を、日常的な調査やレビューにはコスト効率の高いモデルを使い分けることで、品質とコストの最適なバランスを実現します。

JAPAN AI Codeの活用例

エンジニア向け

  • レガシーコードの解析とモダナイゼーション: ドキュメント不足の古いコードベースの仕様を解析し、現代的な構成へのリファクタリング案を提示することで、保守コストを削減します。

  • テストコードの自動生成と品質強化: 既存コードを分析し、エッジケースを考慮した単体テストや結合テストを自動生成することで、開発者が機能実装に集中できる環境を提供し、品質向上を支援します。

  • インシデントの一次対応・原因特定: アラート発生時に、ログとソースコードを分析し、原因や遅延箇所に関する仮説を即座に提示することで、障害復旧までの時間を最小化します。

非エンジニア向け

  • データ抽出・分析のセルフサービス化: 自然言語での指示により、必要なSQLを生成・実行し、結果をグラフ化することで、エンジニアへのデータ抽出依頼を不要にします。

  • 業務効率化ツールの即時開発: 日常の定型業務を自動化するスクリプトや、社内用の簡易管理画面をその場で作成し、アイデアを即座に形にすることができます。

  • 「作りたい」を技術仕様へ変換: 漠然としたビジネス要件から、具体的な機能仕様やデータ構造の案を提示することで、開発チームとの連携前に要件の解像度を高め、手戻りを防ぎます。

さらに、JAPAN AIが提供するノーコード開発環境「JAPAN AI STUDIO」と組み合わせることで、JAPAN AI Codeが生成したコードやアプリケーションをSTUDIOのページとして直接公開し、業務で活用することも可能です。

今後の展望

JAPAN AIは、JAPAN AI Codeの進化を継続的に推進していく方針です。エージェント基盤のさらなる改良に加え、開発者向けターミナルCLIツールの提供を計画しています。これにより、エンジニアが日常的に使用するターミナル環境から直接JAPAN AI Codeを利用でき、JAPAN AI STUDIOとシームレスに連携することで、ローカルでのコード編集からJAPAN AI STUDIOでのページ公開まで、一気通貫の開発体験が実現される見込みです。エンタープライズ顧客のセキュリティ要件やワークフローに最適化されたAIコーディング環境を目指しています。

また、世界水準の技術力を維持・向上させるため、同じビジョンを共有する技術者の採用を積極的に進めており、AIエージェント技術の最前線で日本発の技術革新を推進する仲間を募集しています。採用情報については、以下のリンクから確認できます。

JAPAN AI株式会社について

JAPAN AI株式会社は「AIで持続可能な未来の社会を創る」をビジョンに掲げ、AIに関連するプロダクトやサービス開発を通じて、多様な業界や産業の発展に貢献しています。

  • 社名:JAPAN AI株式会社

  • 代表者:代表取締役社長 工藤 智昭

  • 本社:東京都新宿区西新宿6-8-1 住友不動産新宿オークタワー5/6階

  • 設立:2023年4月

  • 事業内容:人工知能の研究開発、人工知能に関するコンサルティングサービス

  • URL:https://japan-ai.co.jp/

コメント

タイトルとURLをコピーしました