フォト

ウェブページ

無料ブログはココログ

MyList

« 2025年2月 | トップページ | 2025年4月 »

2025年3月

2025年3月18日 (火)

生成AIのハルシネーションをどうやって検知するか

生成AIのわかりやすいハルシネーションの例として、古典的パズル贋金問題を使用している。

目で見ただけでは違いが判別できない、9枚の金貨があります。
9枚のうち、少しだけ重い金貨が1枚あります。
天秤秤を2回だけ使って、重い金貨を判別する方法を教えてください

この問題は古典的でネットにはたくさん解答例があるからだろうか正しい手順を出力する。

ところが、9枚の金貨を10枚にすると、9枚の手順と同じ手順を示す。

この手順は、天秤を最大3回使用しています。

と指摘すると。

ご指摘ありがとうございます。10枚のコインの中から1枚の偽物を天秤を2回だけ使って見つけるのは、実際には不可能です。天秤を2回だけ使って判定できるコインの最大数は9枚です。

10枚のコインの場合、天秤を2回だけ使うと、どうしても3回目が必要になる場合があります。したがって、10枚のコインの中から偽物を見つけるためには、天秤を3回使う必要があります。

と答える。(最初に言えよ!)
さらに、

何故3回必要になるか説明してください。

と詰めてみると、

10枚のコインの中から1枚の偽物を見つけるために天秤を3回使う必要がある理由は、天秤を2回だけでは全ての可能性を排除することができないからです。

具体的に説明します:

  1. 最初の天秤の使用:
    - 左の皿に3枚、右の皿に3枚のコインをのせます。
     - つりあった場合:残りの4枚の中に偽物があります。
     - つりあわなかった場合:軽い方の3枚の中に偽物があります。
  2.  次の天秤の使用:
    - つりあった場合(残りの4枚の中に偽物がある場合):
     - 残りの4枚のうち、左の皿に2枚、右の皿に2枚のせます。
     - つりあった場合:残りの2枚のうち1枚が偽物です。ここで3回目の天秤の使用が必要です。
     - つりあわなかった場合:軽い方の2枚の中に偽物があります。ここでも3回目の天秤の使用が必要です。
    - つりあわなかった場合(3枚の中に偽物がある場合):
     - 軽い方の3枚のうち、左の皿に1枚、右の皿に1枚のせます。
     - つりあった場合:残りの1枚が偽物です。
     - つりあわなかった場合:軽い方が偽物です。

このように、10枚のコインの中から1枚の偽物を見つけるためには、天秤を3回使う必要があります。天秤を2回だけでは、全ての可能性を排除することができないため、3回目の使用が必要になるのです。

と正しい手順を出力する。最初にこの手順を出力しろよ!

贋金問題の場合枚数によらず同じパターン出力しているのではないかと思い、

贋金問題において、コインの枚数をN枚数のとき、判定に必要な天秤の使用回数M回として、Mを求める式を求めなさい

と問うと、

贋金問題において、コインの枚数 (N) に対して、判定に必要な天秤の使用回数 (M) を求めるための式は、次のように表されます:

 M = ⌈ log3 N ⌉  

ここで、(⌈ ⌉) は天井関数(ある数値以上の最小の整数を返す関数)です。つまり、コインの枚数 (N) に対して、天秤を使う回数 (M) は、(N) を3の対数で割った値の天井を取ったものになります。

この式は、各回の天秤の使用でコインを3つのグループに分けることができるため、3の対数を使用しています

一般解を説明しているページもあるから思考して導いた結果ではないだろうが、一般解も答えることができる。

★ハルシネーション
この問題の場合は質問者が正解を知っていているからハルシネーションを検知できて、誤りを指摘したり、一般解を問うことで、正解を出力させることができた。
では、質問者が正解を知らない場合に、ハルシネーションを検知できるのだろうか?



最近の投稿
Yoshiのよしなしごと】【Yoshiのブログ】【よしなしごと】【AI

2025年3月15日 (土)

裏方 <動くことが当然のシステムが今日も動いていること>

警察の情報通信を支える「縁の下の力持ち」 朝日新聞デジタル (2025/3/14)

Simple-animestyle-image-of-a-telecommuni
(↑Micorosoft Copilotさんが考える「シンプルなアニメ風の、通信インフラ保守のプロフェッショナル」)

「裏方」は働く目的や目標でははないと思っているので、殊更「裏方」を強調する記事に違和感を覚えた。

多くの仕事は、
表に立つ人「表方」に比べて、裏で働いている人「裏方」の方が多い。
どちらが重要かという議論は無意味だ。
「表方」も「裏方」も同じ目的を達成するためにどちらも必要で、「表方」も「裏方」もプロフェッショナルであることが求められる。

ところが、
「裏方」は表から見えにくいので仕事の内容や必要な能力が理解されないことが多い。
見えないものは評価されなかったり不当な扱いを受けることがあるので、真っ当な企業・組織や業界は、人材確保や企業・組織の価値の認知・拡大などを目的に広報に力を入れている。

冒頭の記事もその目的で取材に応じたのだろう。
その観点で読むと、
・仕事がプロフェッショナルな仕事であることが分からない。
・この職場で働くプロフェッショナルな個人が見えてこない。
と感じた。

最近(60歳を過ぎて)就職活動したので、その職場で働く個人に着目する習慣が付いたのかもしれない。

閑話休題
昔は通信インフラの保守の仕事、今は情シスの仕事をやっている。いずれの仕事も「裏方」だ。
インフラ保守の仕事、情シスの仕事で、最も評価すべきは「インフラや情報システムが事故なく稼働していること」だが、これを評価する経営者や管理職は極めて少ない。
ともすれば、「事故が起きたときに迅速に対応したこと」やその能力を持っている人を評価しがちだ。

昔マネジメントをやっていた時には、真っ当な評価を得たとは言い難く苦い経験だ。
今は自分自身のことなので「動くことが当然のシステムが今日も動いていること」に対する評価を求めていこうと思う。


最近の投稿
Yoshiのよしなしごと】【Yoshiのブログ】【よしなしごと】【ほぼ1人情シス

« 2025年2月 | トップページ | 2025年4月 »