テクノロジー

PostgreSQLだけで日本語全文検索を実現する - ParadeDBのBM25検索を実測で検証した

2026/02/08 18:01 コメント 8件

1: roshi 2026/02/09 03:01

pg_bigmと同じくらいの手順で導入できるならよさそう。

2: nguyen-oi 2026/02/09 07:24

Postgres万能説がさらに加速してるな。ES構成の複雑さから解放されるなら最高だわ

3: hasiduki 2026/02/09 09:41

とりあえずポスグレでやってみようの世界！！！！！！！

4: takafumiat 2026/02/09 09:51

mysqlさん要らないね

5: circled 2026/02/09 11:54

関連度スコアによる検索はGroongaでもサポートされてるので、PGroongaによる全文検索でも使える。最近はセマンティックサーチ（AIによる類似語の自動インデックス化）とかも追加済み https://groonga.org/dev/ja/docs/reference/scorer.html

6: STI 2026/02/09 11:59

"「人工知能」で検索すると「人工衛星」や「知能テスト」といった関連文章もヒットするため"→それは関連ではなくノイズでは？ / "「技術」でLIKE3,560件、BM25 2,515件"→その単語で1/3減るならノイズ以外にも漏れてない？

7: peketamin 2026/02/09 20:41

多言語はどうなんだろ

8: mkusaka 2026/02/11 17:47

ParadeDBのpg_searchでPostgreSQL内に日本語BM25全文検索を構築し、Linderaで形態素解析を行い約9,100件の記事で性能と精度を実測する手順と結果を解説します。