『検索システム ― 実務者のための開発改善ガイドブック』
「情報検索」×「データサイエンス」×「全文検索エンジン」
- 打田智子・古澤智裕・大谷 純・加藤 遼・鈴木翔吾・河野晋策 共著
- 360ページ
- A5判
- ISBN:978-4-908686-13-9
- 2022年5月2日 第1版第1刷 発行
大量のデータから必要な情報をすばやく見つけ出したい。その要求をコンピューターで叶えるための「検索システム」を実現するためには、「情報を見つけたい」という漠然とした要求をどうやって定式化すればいいか、それに合致する情報を膨大なデータから効率的に取り出すためのデータ構造とアルゴリズム、そうして見つかった複数の情報を提示する方法や順序などなど、考慮しなければならない課題がたくさんあります。
検索システムの実現に伴うさまざまな課題に取り組む鍵は情報検索です。情報検索は、コンピューターを利用するものに限っても、すでに数十年に及ぶ理論の蓄積がある研究分野です。さらに近年では、「ユーザーが検索したいものを定式化できていない状態での検索」(探索的検索)や、検索結果を提示する際の順序決定(ランキング)において、機械学習をはじめとするいわゆるデータサイエンスの知見が強力な手段として活用されています。
本書は、情報検索とデータサイエンスを見据えつつ、主に全文検索エンジンを利用した検索システムの構築を考えている人、もしくはすでに運用している検索システムの改善を考えている人のためのガイドとなるべく書かれました。利用者はもちろんシステムを提供する側にとっても「よい検索」を実現するために必要になるさまざまな知識や考え方を整理してお伝えするものです。