Log Probabilities

LLMが処理した結果にどれだけ自信があるのだろうかとか、分類に使いたい時があります。システムプロンプトで指示するのもいいのですが、定量的に知る方法に、どういったパラメータがあるのかちょっと調べてみました。

サーバ起動
llama.cpp/build/bin/llama-server -m "/mnt/c/Users//.lmstudio/models/mmnga/ELYZA-japanese-Llama-2-7b-fast-instruct-gguf/ELYZA-japanese-Llama-2-7b-fast-instruct-q4_K_S.gguf" --host 0.0.0.0 --port 8080 --ctx-size 4096 --n-predict -1

・・・
終了理由: length
⚠️ 最大トークン数(200トークン)に達しました。
・・・
質問: プリウスの重さは?
平均log probability: -0.137
平均entropy: 0.201
確信度(logprob由来): 0.432
確信度(entropy由来): 0.818
最終確からしさスコア: 0.548
回答: プリウスの車両重量は、グレードによって異なります。
・・・

結果は、なかなか判定が難しいということでした。もう少しいろいろな実験をしたいと思います。ただ不確かな答えの場合、出力トークンが多くなるという特性はあるようです。いろんな条件の元、総合的に判定することはできる可能性はあるように感じました。

参考)
https://qiita.com/kanata564/items/e8aaf6d4aeb99842dc62

About

Categories: 未分類