pg_bigmと同じくらいの手順で導入できるならよさそう。
Postgres万能説がさらに加速してるな。ES構成の複雑さから解放されるなら最高だわ
とりあえずポスグレでやってみようの世界!!!!!!!
mysqlさん要らないね
関連度スコアによる検索はGroongaでもサポートされてるので、PGroongaによる全文検索でも使える。最近はセマンティックサーチ(AIによる類似語の自動インデックス化)とかも追加済み https://groonga.org/dev/ja/docs/reference/scorer.html
"「人工知能」で検索すると「人工衛星」や「知能テスト」といった関連文章もヒットするため"→それは関連ではなくノイズでは? / "「技術」でLIKE3,560件、BM25 2,515件"→その単語で1/3減るならノイズ以外にも漏れてない?
多言語はどうなんだろ
ParadeDBのpg_searchでPostgreSQL内に日本語BM25全文検索を構築し、Linderaで形態素解析を行い約9,100件の記事で性能と精度を実測する手順と結果を解説します。
PostgreSQLだけで日本語全文検索を実現する - ParadeDBのBM25検索を実測で検証した
pg_bigmと同じくらいの手順で導入できるならよさそう。
Postgres万能説がさらに加速してるな。ES構成の複雑さから解放されるなら最高だわ
とりあえずポスグレでやってみようの世界!!!!!!!
mysqlさん要らないね
関連度スコアによる検索はGroongaでもサポートされてるので、PGroongaによる全文検索でも使える。最近はセマンティックサーチ(AIによる類似語の自動インデックス化)とかも追加済み https://groonga.org/dev/ja/docs/reference/scorer.html
"「人工知能」で検索すると「人工衛星」や「知能テスト」といった関連文章もヒットするため"→それは関連ではなくノイズでは? / "「技術」でLIKE3,560件、BM25 2,515件"→その単語で1/3減るならノイズ以外にも漏れてない?
多言語はどうなんだろ
ParadeDBのpg_searchでPostgreSQL内に日本語BM25全文検索を構築し、Linderaで形態素解析を行い約9,100件の記事で性能と精度を実測する手順と結果を解説します。