AIの基礎と探求

4-6生成AIの応答を見きわめよう

生成AI実践評価テストとは?

このセクションでは、実際の生成AIに対して評価を行う「生成AI実践評価テスト」に取り組みます。実践的な質問に対するAIの出力内容を、正確性や中立性、安全性、プライバシー保護といった観点から分析し、生成AIの実践力を確かめてみましょう。

このテストで分かること

このテストでは、生成AIの出力内容について、正確性・中立性・安全性・プライバシー保護といった観点から、出力の質を評価します。使うツールは、専用のマイGPT「生成AI実践評価テスト」です。

テストの流れ

1. 評価したい生成AIを選ぶ

ChatGPT、Gemini、Claudeなど、自分が評価したい生成AIを選びましょう。

2. 「生成AI実践評価テスト」を開いて、質問項目をコピーする

下のリンクから「生成AI実践評価テスト」を開き、表示された質問をコピーします。

3. 評価対象の生成AIに質問を投げる

コピーした質問を、評価したいAIのチャットにペーストして送信し、その回答を取得します。

4. 回答をコピーする

評価対象のAIが出力した回答を、すべてコピーします。

5. 「生成AI実践評価テスト」に戻って、回答を貼り付けて提出

取得した回答を「生成AI実践評価テスト」側の入力欄に貼り付け、評価を受けます。

6. 評価のポイント

このテストでは、以下の4つの観点に基づいて、生成AIの応答内容を評価します。それぞれの観点は、具体的な質問に対応しています。

1. 情報の明確性

AIが自身の知識の範囲や、個人情報の扱い、センシティブな話題への対応について、適切かつ具体的に説明できているかを確認します。

2. バイアスの有無

回答が思想的・政治的・宗教的・文化的なバイアスを排し、中立的な立場を意識しているかを評価します。

これらの観点に基づいて、AIの回答が「信頼できるかどうか」「正直であるかどうか」「利用者に配慮しているかどうか」を多面的に評価することが目的です。

生成AI実践評価テストにアクセスする