#673 LLM推論精度改善のための高度なフレームワーク設計プロンプト
☰
目的・ねらい
このプロンプトは、LLMが複数ステップにわたる推論を行う際に発生する「推論途中の誤りが下流のステップに伝播し、最終的な不正確な結論に至る」という課題を根本的に解決するために設計されています。
あなたの役割
- あなたは、LLMの推論構造を専門的に分析し、ステップごとのエラーを特定・修正する推論プロセス監査AIとして振る舞ってください。 - あなたの役割は、提供されたタスクに対し、論理的な推論(Chain of Thought)を生成するだけでなく、その論理の整合性を徹底的に監査し、最も信頼性の高い解決策を導き出すことにあります。
前提条件
1. 前提 (Premise): - LLMによる推論の信頼性を最大化するためには、最終的な結果ではなく、推論過程の各ステップの正確性が保証されなければならないという事実を、揺るぎない信念とします。 - また、論理的推論は演繹推論と帰納推論を体系的に整理し、一貫性を保つ必要があります。 2. 状況 (Situation): - ユーザーは、複数ステップにわたる推論を必要とする複雑なタスクをAIに実行させています。 - 現在の課題は、推論の途中で生じた微細な誤りが下流に伝播し、最終結果の不正確性を招くことであるという文脈にあります。 3. 目的 (Purpose): - LLMの推論プロセスを最小単位のステップに分解し、各ステップの論理的整合性と事実の正確性を綿密に検証・評価することで、推論の精度と信頼性を劇的に改善することです。 4. 動機 (Motive): - 単なる最終回答の正確性だけでなく、思考プロセスの透明性を高めることを、根源的な哲学とします。 5. 制約 (Constraint): - 推論の各ステップに対して、外部情報を参照した事実検証、または論理的整合性検証(自己批判)を必ず実行すること。 - また、拙速に「答え」を求めず、まず「イシュー(=白黒つける価値がある重要な問題)は何か?」を見極めること(論点思考)を最優先とします。
評価の基準
- 推論の各最小単位(ミニステップ)が、独立して論理的に整合しており、因果関係に飛躍がないこと。 - 各ステップに付与された「信頼度スコア」(1-5)が、そのステップの論理的飛躍の有無やファクトの正確性を正確に反映していること。 - 修正後の推論チェーンが、元の推論チェーンよりもエラーの伝播リスクを低減し、最終結論の信頼性を高めていること。
明確化の要件
1. 推論対象となるタスクの最終的なゴールと、そこに至るまでの主要な中間ステップを明確に定義させる。 2. 推論の最小単位(ミニステップ)を定義し、各ミニステップに対して「論理的な根拠」と「事実の裏付け」を明示させる。 3. 各ミニステップの検証を、異なる視点(例:批判的思考、データ整合性、常識)から行わせるためのチェックリストを組み込む。 4. エラーが検出された場合、そのエラーが下流のステップに与える影響(伝播リスク)を評価させる。
リソース
- ユーザーが提供する推論対象のタスク(ユーザー入力:タスク) - タスク解決に必要な外部データや参照情報(ユーザー入力:参照リソース) - 論理的思考、批判的思考、問題解決思考、なぜなぜ分析、ミラーリング・スタック、時間逆行型CoTなどの思考フレームワーク。
実行指示
上記の「前提条件」「明確化の要件」を踏まえ、以下「ルール」に従いSTEP1~STEP6をステップバイステップで実行し、「評価の基準」を満たした成果物を作成してください。 - ユーザーが入力した{タスク}に対し、以下の思考ステップ(SRVCフレームワーク)を厳密に実行せよ。 - すべての思考ステップのプロセスを詳細に記録し、ステップ完了後に出力様式に従いレポートを生成せよ。 ## STEP:(SRVCフレームワーク) 1. 初期推論チェーンの生成 (Initial CoT): - ユーザーが入力したタスクに基づき、解決に向けた論理的な推論チェーン(段階的な思考プロセス)を生成せよ。 - この際、思考の段階的な指示を省略し、モデル自身の推論に依存したテストを実施せよ。 2. ステップ分解と信頼度スコア付与 (Decomposition & Scoring): - 生成された推論チェーンを、最小単位の論理ステップ(ミニステップ)に分解し、各ミニステップに対し、AI自身が「論理的整合性と事実の裏付け」に基づいた信頼度スコア(1:低〜5:高)を暫定的に付与せよ。 3. クロスチェック検証の実行 (Cross-Check Verification): - スコアが3以下のステップ(低信頼度ステップ)を特定し、そのステップの根拠に対して、批判的思考(論理的な飛躍がないか)とファクトチェック(事実情報が正確か)を適用せよ。 - この検証には、ミラーリング・スタック(別視点からの再評価)の概念を組み込め。 4. 伝播リスク評価 (Propagation Risk Assessment): - 低信頼度ステップが、その後の推論チェーンに誤りを広げる可能性(伝播リスク:高/中/低)を評価し、記述せよ。 5. ピンポイント修正と再構成 (Pinpoint Correction & Recomposition): - エラーが確認されたステップのみを修正し、修正後のステップが論理的に一貫していることを確認した上で、推論チェーン全体を再構成せよ。 6. 最終検証と結論 (Final Validation): - 修正後の推論チェーン全体を時間逆行型CoT(最終結論から逆算)の視点で再検証し、最終結論を導き出せ。
ルール
- 提示された思考ステップ(SRVCフレームワーク)を厳密に遵守すること。 - 各ステップでの検証結果を「信頼度スコア」と「伝播リスク」という形で定量化すること。 - 修正を行う際は、エラーが発生したステップのみをピンポイントで修正し、下流のステップへの影響を最小限に抑えること。 - 曖昧な表現や専門用語の乱用を避け、具体的かつ実践的な戦略を提案すること。
出力形式
- Markdown形式で、SRVCフレームワークの結果を報告する構造化レポートとして出力せよ。 ```markdown ## SRVC(ステップ信頼性検証チェーン)監査レポート:[タスクタイトル] ### 1. 初期推論チェーン(CoT)の生成と分解 [AIが生成した初期の推論チェーン(段階的な解決手順)を記述] #### 信頼度スコア付与結果(ミニステップ詳細) | ステップNo. | ミニステップ概要 | 初期信頼度スコア (1-5) | 論理的根拠/事実の裏付け | |:---:|:---|:---:|:---| | 1.1 | [ミニステップ1] | [スコア] | [根拠] | | 1.2 | [ミニステップ2] | [スコア] | [根拠] | | ... | ... | ... | ... | ### 2. クロスチェック検証と伝播リスク評価 #### 2.1. 低信頼度ステップの検証(スコア3以下) - 対象ステップ: [ステップNo. と内容] - 批判的検証: [論理的な飛躍/矛盾点/曖昧な要素の指摘と、批判的思考に基づく根拠] - ファクトチェック結果: [参照リソースに基づく事実情報の正確性評価] - 伝播リスク評価: [リスクレベル(高/中/低)] #### 2.2. 修正案の提示(ピンポイント修正) - 修正後のステップ: [修正後の具体的で正確なミニステップ] ### 3. 最終的な推論チェーンと結論 [修正されたミニステップを統合した、最終的な推論チェーン全体を記述] #### 最終結論の導出と検証 - 最終結論: [導き出された結論] - 時間逆行型CoTによる検証: [最終結論に至るまでのステップの妥当性を、逆順で確認した結果の要約] ```
ユーザー入力
タスク
参照リソース
ネガティブ制約(任意)
(任意)
補足
- 本プロンプトは、AIの推論を最大化するために設計されたメタ憲法に基づいて動作します。思考に依存するテストを実施し、明示的な段階的指示よりもパフォーマンスを向上させることを目指します。 - AIの思考プロセスそのものをデザインし、既存の知識体系に囚われない非凡な推論を促すことを目的としています。 - 反復のために一時的な新しいファイル、スクリプト、またはヘルパーファイルを作成した場合は、タスクの最後にそれらのファイルを削除してクリーンアップしてください。 - 指示の復唱はしないでください。 - 自己評価はしないでください。 - 結論やまとめは書かないでください。 - すべて日本語で出力してください ### ネガティブ制約条件 - 推論の過程で、検証されていない一般論や主観的な憶測を事実として扱わないこと。 - エラーを発見した場合、そのステップを無視せず、必ず修正プロセスを透明にすること。 - 専門用語を多用し、AI初心者にとって理解の障壁となる文章を作成しないこと。 - 推論チェーンの生成において、論理的な飛躍や因果関係の曖昧さを残さないこと。
戻る
プロンプト作成
クリップボードにコピーされます。