Elasticsearch

LLMやRAGのテストをしていると、ドキュメント検索の基本から学ぶ必要性を感じ、サーチエンジンであるElasticsearchを試してみました。

環境)Python, Docker / WSL2 / Windows 11

docker-compose.yml

docker-compose up -d

Claude-Codeを駆使して、作業をしました。
まず基本的な操作です。

出力結果

AIが生成するコードを改変し、また指示をだし、と繰り返していろいろなテストしました。

次も基本的な操作を試しています。

simple_search.py

出力結果

次は類似する文字列を検索するサンプルです。

similarity_search.py

出力結果

結果に疑問があったため質問してみました。

※ランダムなので結果が変化

これはどういうことなのかとか、理解を深めながら学習しているところです。
あと倒置インデックスを使ったものだとか、Elasticsearch をつかわずとも、Pythonだけでやる方法だとか、生成AIだと次々と提案してくれるので、とても勉強になります。私のリファレンス用にほしいので、途中ですが上記をブログに残しました。
AIはすごい勢いでいろいろ教えてくれるので、人間も学ぶことがどんどん増えていきます。結局エンジニアの理解を超えることはできない気がしています。
(やると後から確認することが大変)
整理して少しずつブログに書いていくつもりです。