AI Search のシノニム(同意語)検索機能を使用する方法
はじめに
お世話になっております。PaaS Dev サポート担当の李です。
AI Search にはインデックス検索時にそのキーワードと共に事前に登録した同意語を一緒に検索する、シノニム検索機能をサポートしております。
本日はシノニム検索の使用方法をご案内致します。手順の一部やシノニムの詳細に関しては以下の弊社公式ドキュメントからもご参照頂けます。
Azure AI Search でのシノニム
サンプル環境の用意
AI Search にデータソース・インデックスなどを Azure ポータルの UI で簡単に登録する手順は以下のページをご参照ください。
Azure AI Search のデータのインポート ウィザード
今回のデータソースである BLOB ストレージには以下のテキストファイルを用意して検索結果を検証します。
ファイル名 | 本文 |
---|---|
テスト1.txt | マイクロソフト |
テスト2.txt | 日本マイクロソフト |
テスト3.txt | MS |
テスト4.txt | Office365 |
シノニムマップの登録と確認
冒頭でご案内致しました公式ドキュメントにも記載されておりますが、本記事が投稿された現時点では Azure ポータル UI でのシノニムマップの登録はサポートされておらず、REST API または C#・Python などで登録を行う必要がございます。本記事では REST API を用いて登録する手順をご案内致します。
① AI Search の「キー」から API キーを取得します。
② 下記の内容で POST します。201 応答が返されます。
POST https://[service name].search.windows.net/synonymmaps?api-version=[api-version]
Header
Content-Type: application/json
api-key: [admin key]
Body
{
"name" : "[synonymmap name]",
"format" : "solr",
"synonyms" : "マイクロソフト, 日本マイクロソフト, MS"
}
③ 登録されたシノニムマップを確認する場合は、同じ内容で GET すると登録されたシノニムマップのリストを取得することができます。
GET https://[service name].search.windows.net/synonymmaps?api-version=[api-version]
Header
Content-Type: application/json
api-key: [admin key]
④ インデックスの JSON 定義で、「content」の「synonymMaps」に②で登録したシノニムマップ名を入力します。これでシノニムマップの登録手順は完了です。
⑤ クエリに「日本マイクロソフト」と検索しても、「マイクロソフト」及び「MS」の検索も同時に行われます。これで同意語の検索ができるようになりました。
明示的なマッピングの設定
明示的なマッピングの規則は、矢印「=>」によって示され、「=>」の左側に一致する検索クエリの用語のシーケンスが、クエリ時に右側の代替語で置き換えられる機能となります。
例えば下記の様にマイクロソフト, 日本マイクロソフト, MS => MS でシノニムマップを登録した場合は、いずれのキーワードで検索した場合でも「MS」が含まれている「テスト3.txt」のみが検索される機能となっております。
{
"name" : "[synonymmap name]",
"format" : "solr",
"synonyms" : "マイクロソフト, 日本マイクロソフト, MS => MS"
}
シノニムマップの更新または削除
下記の内容で更新は PUT、削除は DELETE リクエストすると、シノニムマップを更新・削除することができます。
PUT/DELETE https://[service name].search.windows.net/synonymmaps/[synonymmap name]?api-version=[api-version]
Content-Type: application/json
api-key: [admin key]
各REST APIの詳細は以下のページをご参照ください。
シノニム マップの作成 (REST API Azure AI Search)
シノニム マップの一覧表示 (Azure AI Search REST API)
シノニム マップの更新 (REST API Azure AI Search)
シノニム マップの削除 (Azure AI Search REST API)
登録可能なシノニムマップ数
シノニム マップの最大数はレベルによって異なり、最大20の拡張を含めることができます。
詳細は以下のページをご参照ください。
シノニムの制限
以上、AI Search のシノニム検索機能を紹介いたしました。
2023 年 10 月 28 日時点の内容となります。
本記事の内容は予告なく変更される場合がございますので予めご了承ください。