Graph Retrieval Augmented Generation

LLMにおけるRAGの仕組みを一通り理解すると、Graph RAGというものに興味を持ちました。
NVIDIA Geforce RTX5060Ti 16GB も購入したので、試してみました。
グラフィックボードを有効に動かすには、いろいろと設定が面倒でした。
いろんなサンプルを動かそうとしましたが、まだ新しいドライバなのでPythonのライブラリの依存性が合わず、思ったより苦労します。
そんな中下記サイトではDocker環境で全て用意していただいているため、順調に動作させることができました。

引用)https://highreso.jp/edgehub/machinelearning/graphrag.html

langchain.Dockerfile

neo4j.Dockerfile

docker-compose.yml

ここではこのサイトの通り動かしてみて、グラフDBにどのようにテキストが保存されるかを理解することを目的としました。
Jupyter環境で、step by step で確認ができるのでとても便利です。必要とするファイルもUIからインポートできます。

実行前に下記のやり方でライブラリをインストールする必要があリました。

!{sys.executable} -m pip install openai

グラフ化の処理時間は、10分から15分くらいでした。

とても素晴らしいデモでした!

NVIDIAのGPUを使うにあたり、ライブラリ、ドライバなどの依存関係を調べることが多くあります。参考リンクを下記にメモしておきます。

https://developer.nvidia.com/cudnn-archive

https://developer.nvidia.com/cuda-toolkit-archive

https://www.tensorflow.org/install/source#gpu

https://pytorch.org/

https://developer.nvidia.com/cuda-gpus

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/

https://en.wikipedia.org/wiki/CUDA#GPUs_supported

https://www.nvidia.com/ja-jp/drivers/