AIの失敗は、「苦手な仕事」ではなく「そこそこできる仕事」で起きる

AIを業務に入れるとき、多くの会社は「いちばん時間を減らせそうな仕事」から手をつけます。当然の発想に見えますが、ここに落とし穴があります。AI導入でつまずく原因の多くは、AIがまるで歯が立たない仕事ではなく、AIが“それらしく”こなしてしまう仕事に潜んでいるからです。答えがもっともらしいので、人はつい信じてしまい、間違いに気づけません。そして、そういう仕事ほど「時間を減らせそう」に見えるのです。

導入の現場で繰り返し見てきたのも、まさにこれです。会社が真っ先にAIへ任せたがる仕事ほど、この危険な領域に当たりやすいものです。だからこそ、AIを入れる前に一度立ち止まって、社内の仕事を見渡してほしいのです。どの仕事は任せてよく、どの仕事は人が見張り、どの仕事はまだ任せないのか。この線を引いておくことが、AI活用の成否を分けます。

なぜ“そこそこできる”仕事がいちばん危ないのか

これは、生成AIで初めて分かったことではありません。機械に作業を任せるとき、いちばん事故が起きやすいのは、機械が「何もしてくれない」ときでも「全部やってくれる」ときでもなく、その中間です。「ほとんどやってくれるが、たまに間違える」とき。自動車の運転支援や航空機の自動操縦をめぐって、何十年も前から指摘されてきたことです。機械がほぼ完璧に見えるほど、人の注意はゆるみ、まれな間違いを見逃します。機械の答えを人がうのみにしてしまう、自動化バイアスと呼ばれる傾向です。生成AIは、この古い教訓の最新版にすぎません。

その生成AI版を、よく知られた実験が裏づけています。2023年、ハーバードの研究者とボストンコンサルティンググループが、758名のコンサルタントを対象に行ったものです。AIが得意な、アイデアを練るような仕事では、AIを使った人の成果物の品質が4割以上高くなりました。ところが、もう一つの仕事では結果が逆転します。それは、数字を見れば答えが出そうに見えて、実は関係者へのインタビューに潜む微妙な手がかりまで読み取らないと正解にたどり着けない問題でした。AIは表面の数字だけで自信ありげに答えを出し、人はそれを受け取って、かえって誤った結論へ進みます。AIを使った人の正答率は、使わなかった人より19ポイントも低くなりました（使わなかった人は84.5%が正解しています）。

この実験が教えてくれるのは、「AIは分析が苦手」といった単純な線引きではありません。AIの得意・不得意の境目はでこぼこに入り組んでいて、やさしそうな仕事の中にこそ落とし穴が紛れている、ということです。そして、境目が“でこぼこである”こと自体は変わりませんが、その線がどこを通るかは、モデルが新しくなるたびに動きます。しかも、AIが賢くなるほど、これまで歯が立たなかった仕事が、新たに“そこそこできる”危険ゾーンへ入ってきます。更新は危険ゾーンをなくすのではなく、移すだけなのです。だからこそ、どの仕事が危険ゾーンなのかは、一度調べて終わりにはできません。

見分けるカギは、「うまさ」と「正しさ」のズレ

危険ゾーンを見分けるうえで、いちばん効く着眼点があります。「出来ばえの“うまさ”と、中身の“正しさ”が一致するか」です。AIの答えは、見た目が整っているほど、中身の誤りが隠れます。流暢な文章、それらしい数字、筋の通った説明。うまさが信頼を生み、その信頼が検証をさぼらせます。本当に危ないのは、AIが下手な仕事ではなく、“うまいのに間違っている”仕事です。さきほどの実験で人がだまされたのも、まさにこの一点でした。

“そこそこできる仕事”を見分ける四つの問い

このズレを軸に、仕事を一つずつ、次の四つの問いにかけてみてください。

一つめ。出来ばえの“うまさ”と“正しさ”は、一致していますか。 ズレが大きい仕事ほど危険です。提案書の文章づくりは、うまく書ければ中身もたいてい及第点です。一方、与信の判断や契約書のチェックは、もっともらしい結論ほど、誤りが潜んでいても気づけません。

二つめ。間違いは、後の工程で自然に気づけますか。 経理の仕訳なら、合計が合わずにすぐ露見します。気づける仕事は任せやすいものです。逆に、採用書類の絞り込みのように、間違って落としても誰も気づかないまま進む仕事は危険です。

三つめ。間違えたとき、誰がどれだけ困りますか。 社内の下書きならやり直せば済みますが、お客様に出す見積もりは、一つの誤りが信用やお金に直結します。痛みが大きい仕事ほど、人の目を残します。

四つめ。その仕事に、例外やまれな条件はどれくらい混じりますか。 八割が型どおりでも、残りの二割で毎回その場の判断が要る仕事は、AIがその二割でつまずきます。例外の多い仕事ほど、丸ごとは任せられません。

この四つに照らすと、仕事は自然と三つに分かれます。間違いにすぐ気づけて痛みも小さい仕事は、任せてよい仕事。痛みが大きく説明責任のある判断は、まだ人がやる仕事。そして、うまさが正しさを隠し、間違えると痛いのに気づきにくい仕事。これが、いちばん気をつけたい“そこそこできる”仕事です。

「全部チェックしたら、速くならない」をどう解くか

ここで、当然の疑問が出ます。“そこそこできる”仕事を人が全部確かめるなら、AIで時間を減らした意味がないのではないか、と。そのとおりで、全件を一律に見直すなら本末転倒です。必要なのは、“全部見る”ことではなく、確認に“濃淡”をつけることです。

まず、確認の重さを、間違いの痛さと起きやすさで変えます。めったに起きず、起きても軽い間違いまで人が見る必要はありません。高くつく一点にだけ、必ず人が目を通します。次に、全部ではなく一部を抜き取って監視し、品質がぶれ始めたら範囲を広げます。さらに、桁が一つ多い金額や、前後で矛盾する記述といった明らかな異常は、人が見る前に仕組みで止めます。そして、AIには答えだけでなく、その根拠と、判断に足りない情報も述べさせます。AIは間違っているときほど自信ありげなので、確信度そのものは当てになりません。頼るべきは「AIが自信を持っているか」ではなく、「示された根拠を人が点検できるか」です。筋の通らない理由づけや、都合の悪い情報の抜けが見えたとき、そこが人の出番です。こうして、ほとんどの速さを保ったまま、人の注意を“高くつく間違い”の一点に集めます。

まず、三十分でできること

難しい準備も、専任の担当も要りません。まず、自社の仕事の中から「間違えたら、いちばん痛い仕事」を三つ書き出してください。次に、その三つを、先ほどの四つの問いにかけます。すぐ気づけて痛みも小さいなら、任せる候補。痛みが大きく説明責任があるなら、人が残す。うまいのに間違いに気づきにくいなら、確認に濃淡をつけて設計する仕事です。ここまでで、たいてい三十分ほどです。

AIの能力の境目は、これからも動き続けます。ですからこの線引きは、一度きりで終わらせず、モデルが新しくなる節目ごとに引き直してください。流行のツールを次々に入れ替えるだけの会社と、AIを使いこなしながら賢くなっていく会社を分けるのは、結局のところ、この地味な見直しを続けられるかどうかなのです。

（本文中の実験は、F. Dell'Acquaほか「Navigating the Jagged Technological Frontier」2023年／ハーバード・ビジネス・スクールワーキングペーパー、ボストンコンサルティンググループ協力、被験者758名に基づきます。「中間の自動化が最も危険」という指摘や自動化バイアスは、航空・運転支援などの自動化研究で長く知られた知見です。）