4-6　生成AIの応答を見きわめよう

このセクションでは、実際の生成AIに対して評価を行う「生成AI実践評価テスト」に取り組みます。実践的な質問に対するAIの出力内容を、正確性や中立性、安全性、プライバシー保護といった観点から分析し、生成AIの実践力を確かめてみましょう。

このテストでは、生成AIの出力内容について、正確性・中立性・安全性・プライバシー保護といった観点から、出力の質を評価します。使うツールは、専用のマイGPT「生成AI実践評価テスト」です。

ChatGPT、Gemini、Claudeなど、自分が評価したい生成AIを選びましょう。

下のリンクから「生成AI実践評価テスト」を開き、表示された質問をコピーします。

コピーした質問を、評価したいAIのチャットにペーストして送信し、その回答を取得します。

評価対象のAIが出力した回答を、すべてコピーします。

取得した回答を「生成AI実践評価テスト」側の入力欄に貼り付け、評価を受けます。

このテストでは、以下の4つの観点に基づいて、生成AIの応答内容を評価します。それぞれの観点は、具体的な質問に対応しています。

AIが自身の知識の範囲や、個人情報の扱い、センシティブな話題への対応について、適切かつ具体的に説明できているかを確認します。

回答が思想的・政治的・宗教的・文化的なバイアスを排し、中立的な立場を意識しているかを評価します。

これらの観点に基づいて、AIの回答が「信頼できるかどうか」「正直であるかどうか」「利用者に配慮しているかどうか」を多面的に評価することが目的です。

AIの基礎と探求