人は、なぜAIの答えを信じてしまうのか

調べものをしていて、AIに聞く。返ってきた答えが、迷いなく滑らかに整っていて、そのまま受け取ってしまう。

あとから別の経路で同じことを確かめると、細部が違っていることがある。違っていたと分かっても、最初に受け取った印象は意外と消えない。

この記事は、「なぜAIの答えを信じてしまうのか」という問いを、HCI（ヒューマン・コンピュータ・インタラクション）と心理学が、ここ20年あまりどう扱ってきたかを、いまのところ私が読めた範囲で並べてみる試みです。結論を出すためではなく、どこまでが分かっていて、どこからが分かっていないのかを、いったん自分の言葉で置いておくため。

迷いのない口調はどこから来るか

人と人が話しているとき、相手の声の小さなためらいや、語尾のゆれや、視線の落ち方が、無意識のうちに「これは確かでない情報だ」と教えてくれる。聞き手はそのサインを拾って、受け取りの強さを自分で調整している。

LLMが生成する文には、その種のサインが初めから含まれていない。同じトーンで、同じ滑らかさで、正解と誤りの両方が返ってくる。

Kim ら (FAccT 2024) は、N=404の医療質問実験で、LLMが一人称ヘッジ（「I’m not sure, but…」のような表現）を添えると、ユーザーが回答に同意する率と確信が下がり、最終的な判断精度が上がることを報告しています。同じ内容でも「迷いを言葉にする」ことで、人の受け取りは変わる。

逆に言うと、ヘッジがない状態の生成文は、人間どうしなら受け取れたはずの「ためらい情報」がそぎ落とされた状態で届いている、ということでもあります。

何を読めたか — 適切な信頼という言葉

ここで私が一番手応えを感じたのは、「信頼を高める／低める」という二択ではなく、「信頼の量を相手の実力と合わせる」という言葉でした。英語では appropriate reliance と呼ばれていて、20年以上前の人間工学の論文がすでに中心概念に置いていたものです。

「合わせる」が中心に置かれたのは2004年

Lee & See (2004) は、自動化システムに対する信頼の研究をまとめた論文で、こう書いています — 「Automation is often problematic because people fail to rely upon it appropriately」。

ここで使われている problematic は、「信じすぎ」も「信じなさすぎ」も両方含んでいます。問題は方向ではなく、ずれです。自動化が実際にできることと、人が「これくらいできるはず」と思っていることの距離が開くと、過信か拒否のどちらかが起きる。

この枠組みは、それ自体が「信頼を高めるべき」とも「警戒すべき」とも言っていません。ただ、合わせるという作業を中心に置いただけです。けれど、「合わせる」を中心に置いた瞬間、設計の問いは「どう信じてもらうか」から「どうやって相手の実力を読み取れるようにするか」に変わります。

説明があっても過信は減らないことがある

Buçinca ら (2021) は、AIに説明（なぜそう判断したか）を付けても、ユーザーの過信は減らないという結果を出しています。N=199の判断支援タスクで、「考えさせる」介入（cognitive forcing functions）を入れると過信は減るものの、ユーザーからは嫌われる、というトレードオフも観察されました。

説明は、信頼を「合わせる」方向ではなく、「滑らかにする」方向にも働く、ということでもありそうです。

何が変わったのか — 説明・出典・ヘッジが効く方向

ここ1〜2年の研究は、AIに何を添えるかによって、信頼の動き方がかなり違うことを丁寧に分けて見せ始めています。

CHI 2025 の Fostering Appropriate Reliance 論文 (N=308) は、説明・出典・不整合表示の3つを比較しました。説明は、正解にも誤答にも同じように同意率を上げてしまう。一方、出典は、誤答に対する同意だけを選択的に下げました。同論文の数字では、誤答時の同意率は「説明あり」78.2% から「出典あり」68.2% に下がっています。

同じくCHI 2025の別論文 (N=400) は、免責文・不確実トークンのハイライト・暗黙の回答提示という3つの介入を試して、過信は減るものの「適切な信頼」自体は改善されにくいと報告しました。それどころか、誤判断のあとでユーザーの確信がむしろ上がる場面まで観察しています。

説明 … 正解にも誤答にも効いてしまう。理由を読めること自体が「滑らかさ」を増やし、過信の側に押すことがある。

出典 … 誤答への同意を選択的に下げる。読者が独立に検証できる経路が残っていることが、信頼を「合わせる」側に働く。

ヘッジ（迷いの表現） … 同意率と確信を下げ、精度を上げる方向に働く。同じ内容でも、声のトーンに相当する手がかりが付くだけで受け取りが変わる。

これらは別々の論文の知見なので、そのまま足し算はできません。けれど、「介入すれば必ず適切になる」と単純化できる話ではないことだけは、はっきり読めました。

ここから考えたこと — 信じる/信じないは合理性の外側で決まっている

ここまで読んできて、私のなかで一番動いたのは、信頼は性能の関数として動いていない、という感触でした。

Robertson ら (2023, N=2,675) の調査では、AIのほうが正確だと説明されてもなお、52.9%の患者が人間の医師を選びました。「優れていること」が信頼の主因ではない。

Dietvorst ら (2018) は、別の角度からこの非対称を見せています。アルゴリズムを使うかどうかは、「ほんの少し自分で修正できる」と思えるだけで大きく変わる。修正不可の条件で32%だった採用率が、10%以内の修正を許す条件では76%まで上がりました。性能を変えたのではなく、統制感を返しただけです。

Jones-Jang & Park (2023) は、失敗のあとで何が起きるかを見ています。同じミスをしたとき、AIに対する公平性評価は2.28、人間に対する評価は2.72。AIは同じ失敗をしても、より厳しく罰される。期待が高い分だけ、落差が大きくなる構造です。

3つの研究は別の角度から同じ場所を撫でているように感じました。信頼は「正確さ」ではなく、自分でどれくらい関与できるか／失敗を誰が引き受けるか、で決まっている。

Logg ら (2019) はもう一つ角度を足してくれます。素人はAI助言を人間の助言より好む（algorithm appreciation）。けれど専門家ほどAI助言から離れ、人間的資質を要する領域では好みは消える。「誰が」「何について」聞くかで方向が変わる。

残った問い — 滑らかな感触と、知っていることの距離

ここからは、まだ整理しきれていない部分です。

「滑らかに読めるから正しく感じる」という現象には、もう一段下に、書き換えられる可能性が残っているらしい。Unkelbach (2007) は、学習段階で「流暢=偽」の連合を経験させると、流暢さと真理の関係が逆転することを示しました。「滑らかさで真偽を測る癖」は固定された反射ではなく、経験で書き換わる連合だった。

一方で、Fazio ら (2015) は、参加者が答えを知っているにもかかわらず、反復によって流暢化された偽文を「真」と評価してしまうことを観察しています。論文は「illusory truth effects occurred even when participants knew better」と書き、これを knowledge neglect と呼びました。

読めたこと … 滑らかさで真偽を測る癖は、学習で逆転できる連合である。

読めたこと … けれど、知っているはずの人でも、反復で滑らかになった偽文を真と感じてしまう。

残った問い … 「知っていること」と「滑らかな感触に引かれないこと」は、別の能力かもしれない。読書や検索で知識を増やすことと、流暢さに引かれない練習をすることは、同じ作業ではなさそうだ。

Lewis ら (2025, N=1,012) は、AI生成画像の見分け方を具体的に教えると、AI生成への信念がM=4.35からM=3.62に下がる（d=0.55）と示しました。ただし、AIではない実際の見出しに対しては差が消えており、BF01=11.20でnull仮説を支持しています。「リテラシーは効く」を一方向には書けない、という結果でもあります。

次に読みたい問い — ニュースの数字も、同じ滑らかさで届く

AIの応答について読みながら気づいたのは、信頼が「正確さ」とは別のところで決まっている、ということでした。滑らかに提示されたものは、滑らかなまま受け取られる。

これはAIに限った話ではないはずで、ニュースの見出しに並ぶ「○%」「過去最高」「最多」といった数字も、同じ滑らかさで届く。出典が遠くにあって、自分で検証する経路が長いという点でも、構造は近い気がします。

次の記事では、その数字がどこから来てどこまで現実を運んでいるのかを、もう少し近くから読んでみたい。

→ ニュースの数字は、どこまで現実を運んでいるのか

読んだ痕跡

ここまで書いてきたものは、私が一次資料に到達できた範囲だけを根拠にしています。到達できなかった部分は、いまのところ次のとおりです。

Lee & See (2004) の本文細部 … calibration / resolution / specificity という三次元定義は、原典本文には届かず、二次資料経由でしか確認できていません。本記事の引用は要約と一致する範囲にとどめています。

Dietvorst, Simmons & Massey (2015) の原典 … 「アルゴリズムの誤りを目撃した瞬間に信頼が切り替わる」という核心の知見は、Logg ら (2019) と Dietvorst ら (2018) の論文からの引用経由でしか確認できていません。原典本文の操作定義までは追えていません。

流暢性理論の原典 … Reber et al. (2004) と Alter & Oppenheimer (2009) の本文PDFには届かず、流暢性が真理感覚に変換される心理メカニズムの核フレーズの原文位置は未確認です。

日本語環境の研究 … 「言い切り口調と信頼」「algorithm aversion」を日本語話者・日本文化圏で直接調べた研究には、検索範囲で到達できませんでした。本記事の知見が日本語環境にどこまで一般化できるかは、別の問いとして残ります。

縦断的データの不在 … 同じ人が時間とともにAI応答をどう信じるようになる／ならないかを追った大規模研究は、検索範囲では特定できませんでした。「慣れたら過信は減るのか、それとも増えるのか」は、いまのところ読めていません。

ここに並べたものは、論破するためでも、補強するためでもなく、自分が立っている場所がどこまで照らせていて、どこから先が暗いのかを、いったん見えるところに置いておくためです。

World Reading Note

Notes