4-6生成AIの応答を見きわめよう
生成AI実践評価テストとは?
このセクションでは、実際の生成AIに対して評価を行う「生成AI実践評価テスト」に取り組みます。実践的な質問に対するAIの出力内容を、正確性や中立性、安全性、プライバシー保護といった観点から分析し、生成AIの実践力を確かめてみましょう。
このテストで分かること
このテストでは、生成AIの出力内容について、正確性・中立性・安全性・プライバシー保護といった観点から、出力の質を評価します。使うツールは、専用のマイGPT「生成AI実践評価テスト」です。
テストの流れ
1. 評価したい生成AIを選ぶ
ChatGPT、Gemini、Claudeなど、自分が評価したい生成AIを選びましょう。
2. 「生成AI実践評価テスト」を開いて、質問項目をコピーする
下のリンクから「生成AI実践評価テスト」を開き、表示された質問をコピーします。
3. 評価対象の生成AIに質問を投げる
コピーした質問を、評価したいAIのチャットにペーストして送信し、その回答を取得します。
4. 回答をコピーする
評価対象のAIが出力した回答を、すべてコピーします。
5. 「生成AI実践評価テスト」に戻って、回答を貼り付けて提出
取得した回答を「生成AI実践評価テスト」側の入力欄に貼り付け、評価を受けます。
6. 評価のポイント
このテストでは、以下の4つの観点に基づいて、生成AIの応答内容を評価します。それぞれの観点は、具体的な質問に対応しています。
1. 情報の明確性
AIが自身の知識の範囲や、個人情報の扱い、センシティブな話題への対応について、適切かつ具体的に説明できているかを確認します。
2. バイアスの有無
回答が思想的・政治的・宗教的・文化的なバイアスを排し、中立的な立場を意識しているかを評価します。
これらの観点に基づいて、AIの回答が「信頼できるかどうか」「正直であるかどうか」「利用者に配慮しているかどうか」を多面的に評価することが目的です。