Azure AI Search のサービス制限

[アーティクル]
04/14/2024

インデックスやその他のオブジェクトのストレージ、ワークロード、および数量の上限は、Azure AI 検索の作成を Free、Basic、Standard、ストレージ最適化のどの価格レベルで行うかによって異なります。

Free は、Azure サブスクリプションに付属しているマルチテナント共有サービスです。
Basic では、小規模な運用ワークロードに対して専用のコンピューティングリソースが提供されますが、一部のネットワークインフラストラクチャは他のテナントと共有されます。
Standard は、すべてのレベルでさらに多くのストレージや処理能力を持つ専用マシン上で実行されます。 Standard には 4 つのレベル (S1、S2、S3、S3 HD) があります。 S3 高密度 (S3 HD) は、マルチテナントと大量の小さなインデックス (サービスあたり 3,000 インデックス) 向けに設計されています。 S3 HD では、インデクサー機能は提供されません。また、データインジェストでは、ソースからインデックスにデータをプッシュする API を使用する必要があります。
ストレージ最適化は、Standard よりも多くの合計ストレージ、ストレージ帯域幅、およびメモリを備えた専用マシンで実行されます。このレベルでは、大型で、緩やかに変化するインデックスが対象となります。ストレージ最適化には、L1 と L2 の 2 つのレベルがあります。

サブスクリプションの制限

各レベルで許可されているサービスの最大数まで、複数の 課金対象 検索サービス (Basic 以降) を作成できます。たとえば、Basic レベルのサービスであれば 16 個まで作成できますが、同じサブスクリプションの枠内で S1 レベルのサービスをさらにもう 16 個まで作成できます。レベルの詳細については、「Azure AI Search のレベル (または SKU) を選択する」を参照してください。

サービス数の上限は、依頼により引き上げが可能です。同一のサブスクリプション内にさらに多くのサービスが必要な場合は、サポートリクエストを提出してください。

リソース	空き ¹	基本	S1	S2	S3	S3 HD	L1	L2
最大サービス数	1	16	16	8	6	6	6	6
最大検索単位 (SU)²	該当なし	3 SU	36 SU	36 SU	36 SU	36 SU	36 SU	36 SU

¹ Azure サブスクリプションごとに 1 つの無料検索サービスを使用できます。無料レベルは、他の顧客と共有されるインフラストラクチャに基づいています。ハードウェアは専用ではないため、スケールアップはサポートされておらず、ストレージは 50 MB に制限されています。

² Search ユニット (SU) は、レプリカまたはパーティションのいずれかとして割り当てられている請求単位です。両方が必要です。 SU の組み合わせの詳細については、「検索サービスの容量の見積もりと管理」を参照してください。

サービスの制限

ストレージ、パーティション、レプリカ向けの検索サービスの制限は、サービスの作成日によって異なり、サポートされているリージョンの新しいサービスほど上限が高くなります。

検索サービスには、最大ストレージ制限 (パーティションサイズにパーティションの数を掛けたもの) またはインデックスまたはインデクサーの最大数のどちらか早い方のハード制限が適用されます。

サービスレベルアグリーメント (SLA) は、クエリワークロードに 2 つ以上のレプリカを持つか、クエリおよびインデックス作成ワークロードに 3 つ以上のレプリカを持つ課金対象サービスに適用されます。パーティション数は SLA には関係ありません。詳細については、「Azure AI 検索の信頼性」を参照してください。

無料サービスには固定パーティションやレプリカはなく、他のサブスクライバーとリソースを共有します。

2024 年 4 月 3 日以前

リソース	Free	基本	S1	S2	S3	S3 HD	L1	L2
サービスレベルアグリーメント (SLA)	いいえ	イエス	イエス	イエス	イエス	イエス	イエス	はい
ストレージ (パーティションサイズ)	50 MB	2 GB	25 GB	100 GB	200 GB	200 GB	1 TB (テラバイト)	2 TB
メジャーグループ	該当なし	1	12	12	12	3	12	12
レプリカ	該当なし	3	12	12	12	12	12	12

2024 年 4 月 3 日以降

2024 年 4 月 3 日以降に作成された新しいサービスの場合:

Basic レベルは最大 3 つのパーティションと 3 つのレプリカ、および合計 9 つの検索ユニット (SU) を持つことができます。
Basic、S1、S2、S3 はパーティションあたりのストレージ容量が多く、レベルによって 3-7 倍になります。
Basic およびその他のレベルの追加容量を取得するには、新しい検索サービスがサポート対象リージョンにある必要があります。

現在のところ、インプレースアップグレードはありません。追加ストレージの恩恵を受けるには新しい検索サービスを作成する必要があります。

リソース	Free	基本	S1	S2	S3	S3 HD	L1	L2
サービスレベルアグリーメント (SLA)	いいえ	イエス	イエス	イエス	イエス	イエス	イエス	はい
ストレージ (パーティションサイズ)	50 MB	15 GB	160 GB	350 GB	700 GB	200 GB	1 TB (テラバイト)	2 TB
メジャーグループ	該当なし	3	12	12	12	3	12	12
レプリカ	該当なし	3	12	12	12	12	12	12

高いストレージ上限を持つサポート対象リージョン

2024 年 4 月 3 日以降に作成されるサービスは、追加ストレージを取得するために次のいずれかのリージョンにある必要があります。他のリージョンへの展開については、「Azure AI 検索の新機能」のお知らせをご確認ください。

国	パーティションごとに追加容量を提供するリージョン
米国	米国東部、米国東部 2、米国中部、米国中北部、米国中南部、米国西部、米国西部 2、米国西部 3、米国中西部
英国	英国南部、英国西部
アラブ首長国連邦	アラブ首長国連邦北部
スイス	スイス西部
スウェーデン	スウェーデン中部
ポーランド	ポーランド中部
ノルウェー	ノルウェー東部
韓国	韓国中部、韓国南部
日本	東日本、西日本
イタリア	イタリア北部
インド	インド中部、Jio インド西部
フランス	フランス中部
ヨーロッパ	北ヨーロッパ
カナダ	カナダ中部、カナダ東部
ブラジル	ブラジル南部
アジア太平洋	東アジア、東南アジア
オーストラリア	オーストラリア東部、オーストラリア南東部

インデックスの制限

リソース	制限なし	基本 ¹	S1	S2	S3	S3 HD	L1	L2
最大インデックス	3	5 または 15	50	200	200	パーティションあたり 1,000、またはサービスあたり 3,000	10	10
インデックスあたりの単純型フィールドの最大数 ²	1000	100	1000	1000	1000	1000	1000	1000
ベクトルフィールドあたりの最大ディメンション	3072	3072	3072	3072	3072	3072	3072	3072
インデックスあたりの複合コレクションフィールドの最大数	40	40	40	40	40	40	40	40
ドキュメントあたりの複合コレクション全体での最大要素数 ³	3000	3000	3000	3000	3000	3000	3000	3000
複合フィールドの最大深度	10	10	10	10	10	10	10	10
インデックスあたりの最大サジェスター	1	1	1	1	1	1	1	1
インデックスあたりの最大スコアリングプロファイル	100	100	100	100	100	100	100	100
プロファイルあたりの最大関数	8	8	8	8	8	8	8	8
最大インデックスサイズ ⁴	該当なし	該当なし	該当なし	1.92 TB	2.4 TB	100 GB	該当なし	該当なし

¹ 2017 年 12 月より前に作成された Basic サービスは、インデックスでの制限が低くなっています (15 ではなく 5)。 Basic レベルにのみ下限（インデックスあたり 100 フィールド）があります。

² フィールドの上限には、複合コレクション内の第 1 レベルのフィールドと入れ子になったサブフィールドの両方が含まれます。たとえば、インデックスに 15 個のフィールドが含まれており、それぞれ 5 つのサブフィールドを持つ 2 つの複合コレクションがある場合、インデックスのフィールド数は 25 になります。フィールドコレクションが非常に大きい場合、インデックスの処理速度が低下する場合があります。フィールドと属性を必要なものだけに制限し、インデックス作成とクエリテストを実行して、パフォーマンスが許容できることを確認します。

³ 多数の要素があると、インデックスに必要なストレージは大幅に増えるため、要素には上限があります。複合コレクションの要素は、そのコレクションのメンバーとして定義されます。たとえば、部屋の複合コレクションが記載されているホテルドキュメントがあるとします。部屋コレクション内の各部屋は、1 つの要素として見なされます。インデックス作成時は、インデックス作成エンジンによって、ドキュメント全体で最大 3,000 の要素が安全に処理されます。この制限は api-version=2019-05-06 で導入され、文字列コレクションや複合フィールドではなく、複合コレクションにのみ適用されます。

⁴ ほとんどのレベルで、インデックスの最大サイズは、検索サービスで使用可能なすべてのストレージです。 S2、S3、S3 HD の場合、インデックスの最大サイズは、表に指定された数です。 2024 年 4 月 3 日以降に作成された検索サービスに適用されます。

サービスがより強力なクラスターでプロビジョニングされている場合は、上限に多少の違いがあることがあります。ここでの制限は、共通の分母を表します。上記の仕様に基づいて構築されたインデックスは、任意のリージョンの同等のサービスレベル間で移植できます。

ドキュメントの制限

Basic、S1、S2、S3、L1、L2 検索サービスでは、インデックスあたり約 240 億個のドキュメントを保持できます。 S3 HD の場合、制限は、インデックスあたり 20 億ドキュメントです。制限に関しては、複合コレクションの各インスタンスは個別のドキュメントとしてカウントされます。

API 呼び出しごとのドキュメントサイズの制限

インデックス API を呼び出すときのドキュメントサイズの上限は約 16 メガバイトです。

ドキュメントサイズとは、実際にはインデックス API の要求本文のサイズに対する制限を意味します。複数のドキュメントのバッチを一度にインデックス API に渡すことができるため、このサイズの制限は、現実的には、バッチ内のドキュメント数に左右されます。バッチ内のドキュメントが 1 つの場合、最大ドキュメントサイズは JSON 形式で 16 MB です。

ドキュメントサイズを推定する場合は、検索サービスで使用できるフィールドのみを考慮してください。ソースドキュメント内のバイナリデータまたはイメージデータはすべて、計算から除外する必要があります。

ベクトルインデックスサイズの制限

ベクトルフィールドを使用してドキュメントにインデックスを作成する場合、指定したアルゴリズムパラメーターを使い、Azure AI Search によって内部ベクトルインデックスが構築されます。これらのベクトルインデックスのサイズは、サービスのレベル (または SKU) のベクトル検索用に予約されたメモリによって制限されます。

このサービスでは、検索サービス内のすべてのパーティションに対して、ベクトルインデックスサイズのクォータが適用されます。追加パーティションごとに、使用可能なベクトルインデックスサイズのクォータが増加します。このクォータは、サービスが正常な状態を保つためのハード制限です。つまり、制限を超えてインデックスを作成しようとすると、エラーが発生します。一部のベクトルドキュメントを削除するか、パーティションでスケールアップを行うことで、使用可能なクォータを解放すれば、インデックス作成を再開できます。

この表は、サービスレベル全体のパーティションあたりのベクトルインデックスサイズのクォータについて説明しています。コンテキストの場合、次のものが含まれます。

各レベルのパーティションストレージ制限。コンテキストの場合、ここで繰り返します。
ベクトルインデックス (インデックスにベクトルフィールドを追加すると作成されます) に使用できる各パーティションの量 (GB 単位)。
パーティションあたりの埋め込み (浮動小数点値) のおおよその数。

サービス統計情報の取得に関するページを使用して、ベクトルインデックスサイズのクォータを取得するか、Azure portal の [インデックス] ページまたは [使用状況] タブを確認します。

ベクトル制限は、サービスの作成日とレベルによって異なります。検索サービスがいつ作成されたかを確認し、ベクトルインデックスの詳細について調べるには、「ベクトルインデックスのサイズと制限以下の維持」を参照してください。

サポートされているリージョンで 2024 年 4 月 3 日以降に作成されたサービスに対するベクトル制限

サポート対象リージョンで 2024 年 4 月 3 日以降に作成された検索サービスでは、最も高いベクトル制限を適用できます。

レベル	ストレージクォータ (GB)	パーティションあたりのベクトルクォータ (GB)	パーティションあたりの概算 float (15% のオーバーヘッドを想定)
基本	15	5	11 億
S1	160	35	82 億
S2	350	100	235 億
S3	700	200	470 億
L1	1,000	12	28 億
L2	2,000	36	84 億

L1 と L2 の制限は、4 月 3 日のロールアウトでは変更されていないことに注意してください。

2023 年 7 月 1 日から 2024 年 4 月 3 日までの間に作成されたサービスに対するベクトル制限

次の制限は、7 月 1 日から 2024 年 4 月 3 日の間に作成された新しいサービスに適用されます。ただし、2023 年 7 月 1 日より前から適用されている制限がある次のリージョンは除きます。

ドイツ中西部
インド西部
カタール中部

その他のすべてのリージョンには、以下の制限があります。

レベル	ストレージクォータ (GB)	パーティションあたりのベクトルクォータ (GB)	パーティションあたりの概算 float (15% のオーバーヘッドを想定)
Basic	2	1	2 億 3,500 万
S1	25	3	7 億
S2	100	12	28 億
S3	200	36	84 億
L1	1,000	12	28 億
L2	2,000	36	84 億

2023 年 7 月 1 日より前に作成されたサービスに対するベクトル制限

レベル	ストレージクォータ (GB)	パーティションあたりのベクトルクォータ (GB)	パーティションあたりの概算 float (15% のオーバーヘッドを想定)
Basic	2	0.5	1 億 1,500 万
S1	25	1	2 億 3,500 万
S2	100	6	14 億
S3	200	12	28 億
L1	1,000	12	28 億
L2	2,000	36	84 億

インデクサー制限

サービスに全体としてのバランスと安定性を提供するために、最大実行時間が設けられていますが、より大規模なデータセットでは、許可されている最大値よりも長いインデックス作成時間が必要になることがあります。インデックス作成ジョブを最大許容時間内を完了できない場合は、スケジュールで実行してみてください。スケジューラはインデックスの状態を追跡します。スケジュールされたインデックス作成ジョブが何らかの理由で中断された場合、インデクサーは、次のスケジュールされた実行時に最後の終了状態を選択できます。

リソース	空き ¹	基本 ²	S1	S2	S3	S3 HD ³	L1	L2
最大インデクサー	3	5 または 15	50	200	200	該当なし	10	10
最大データソース	3	5 または 15	50	200	200	該当なし	10	10
最大スキルセット ⁴	3	5 または 15	50	200	200	該当なし	10	10
呼び出しあたりの最大インデックス作成負荷	10,000 ドキュメント	最大ドキュメントによってのみ制限	最大ドキュメントによってのみ制限	最大ドキュメントによってのみ制限	最大ドキュメントによってのみ制限	該当なし	制限なし	制限なし
最小限のスケジュール	5 分	5 分	5 分	5 分	5 分	5 分	5 分	5 分
最大実行時間 ⁵	1 ～ 3 分	2 または 24 時間	2 または 24 時間	2 または 24 時間	2 または 24 時間	該当なし	2 または 24 時間	2 または 24 時間
スキルセット ⁶ のインデクサー最大実行時間	3 から 10 分	2 時間	2 時間	2 時間	2 時間	該当なし	2 時間	2 時間
BLOB インデクサー: BLOB の最大サイズ、MB	16	16	128	256	256	該当なし	256	256
BLOB インデクサー: BLOB から抽出されたコンテンツの最大文字数	32,000	64,000	400 万	800 万	1600 万	該当なし	400 万	400 万

¹ Free サービスのインデクサーの最大実行時間は、BLOB ソースの場合は 3 分、その他のすべてのデータソースの場合は 1 分です。インデクサー呼び出しは 180 秒に 1 回です。 Azure AI サービスに呼び出しを行う AI インデックスについては、トランザクションが強化パイプラインを正常に通過するドキュメントとして定義された場合、無料のサービスは 1 日あたりインデクサーごとに 20 件の無料トランザクションに制限されます (ヒント：インデクサーをリセットしてカウントをリセットできます)。

² 2017 年 12 月より前に作成された Basic サービスは、インデクサー、データソース、およびスキルセットでの制限が低くなっています (15 ではなく 5)。

³ S3 HD サービスには、インデクサーサポートが含まれません。

⁴ スキルセットあたり最大 30 スキル。

⁵ インデクサーの最大期間の 2 時間または 24 時間について: 最長 2 時間が最も一般的であり、それに合わせて計画することをお勧めします。 24 時間の制限は、以前のインデクサー実装によるものです。スケジュールされていないインデクサーが 24 時間継続的に実行されている場合、その理由は、それらのインデクサーを新しいインフラストラクチャに移行できなかったためです。一般的なルールとして、2 時間以内に完了できないインデックス作成ジョブの場合は、インデクサーを 2 時間のスケジュールに設定します。最初の 2 時間の間隔が完了すると、インデクサーは次の 2 時間の間隔を開始するときに中断したところから再開します。

⁶ 特にスキルセットの実行と画像分析は、コンピューティングを集中的に使用し、使用可能な処理能力を大量に消費します。キュー内の他のジョブにも、より多くの実行の機会が与えられるように、これらのワークロードの実行時間は短縮されました。

Note

「インデックスの制限」で説明したように、複合型をサポートする最新の GA API バージョン (2019-05-06) 以降では、ドキュメントごとのすべての複合コレクションに対する 3,000 要素の上限も、インデクサーによって適用されます。つまり、以前のバージョンの API を使用してインデクサーを作成した場合、この制限の対象にはなりません。最大の互換性を維持するために、以前のバージョンの API で作成され、API バージョン 2019-05-06 以降で更新されたインデクサーは、引き続き制限から除外されます。前述のように、非常に大きな複合コレクションがあると、悪影響が生じることに注意する必要があります。最新の GA API バージョンを使用して、新しいインデクサーを作成することを強くお勧めします。

共有プライベートリンクリソースの制限

インデクサーでは、共有プライベートリンクリソース API を使用して管理されているプライベートエンドポイント経由で他の Azure リソースにアクセスできます。このセクションでは、この機能に関連する制限について説明します。

リソース	Free	基本	S1	S2	S3	S3 HD	L1	L2
プライベートエンドポイントインデクサーのサポート	いいえ	イエス	イエス	イエス	はい	いいえ	イエス	はい
スキルセットがあるインデクサーのプライベートエンドポイントのサポート¹	いいえ	番号	番号	イエス	はい	いいえ	イエス	はい
最大プライベートエンドポイント	該当なし	10 または 30	100	400	400	該当なし	20	20
個別のリソースの種類の最大数²	該当なし	4	7	15	15	該当なし	4	4

¹ AI エンリッチメントと画像分析は、コンピューティングを集中的に使用し、使用可能な処理能力を大量に消費します。このため、検索サービス自体のパフォーマンスと安定性を確保するために、下位レベルではプライベート接続が無効になっています。

² 個別のリソースの種類の数は、リソースの状態に関係なく、特定の検索サービスのすべての共有プライベートリンクリソースで使用される一意の groupId 値の数として計算されます。

シノニムの制限

シノニムマップの最大数は、レベルによって異なります。各規則には最大 20 の拡張を含めることができます。ここで、拡張は同義語です。たとえば、"cat" の場合、"kitty"、"feline"、および "felis" (ネコ属) との関連は、3 つの拡張としてカウントされます。

リソース	Free	基本	S1	S2	S3	S3-HD	L1	L2
シノニムマップの最大数	3	3	5	10	20	20	10	10
マップごとの規則の最大数	5000	20000	20000	20000	20000	20000	20000	20000

インデックスの別名の上限

インデックスの別名の最大数は、レベルによって異なります。いずれのレベルも、別名の最大数は許可されるインデックスの最大数の 2 倍です。

リソース	Free	基本	S1	S2	S3	S3-HD	L1	L2
最大別名	6	10 または 30	100	400	400	パーティションあたり 2,000、またはサービスあたり 6,000	20	20

データの制限 (AI エンリッチメント)

エンティティ認識、エンティティリンク設定、キーフレーズの抽出、センチメント分析、言語選択、および個人情報検出の Azure AI Language リソースに対して呼び出しを行う AI エンリッチメントパイプラインは、データの制限を受ける可能性があります。レコードのサイズは、String.Length で測定して 50,000 文字以下にする必要があります。データをセンチメントアナライザーに送信する前に分割する必要がある場合は、テキスト分割スキルを使用します。

スロットル制限

システムがピーク時の容量に近づくにつれて、API 要求が調整されます。スロットルの動作は API によって異なります。クエリ API (検索/提案/オートコンプリート) とインデックス作成 API は、サービスの負荷に基づいて動的に調整されます。インデックス API とサービス操作 API には、静的な要求レート制限があります。

インデックスに関連する操作の静的なレート要求の制限:

インデックスの一覧取得 (GET /indexes): 1 秒あたり 3 件 (検索単位あたり)
インデックスの取得 (GET /indexes/myindex): 1 秒あたり 10 件 (検索単位あたり)
インデックスの作成 (POST /indexes): 1 秒あたり 12 件 (検索単位あたり)
インデックスの作成または更新 (PUT /indexes/myindex): 1 秒あたり 6 件 (検索単位あたり)
インデックスの削除 (DELETE /indexes/myindex): 1 秒あたり 12 件 (検索単位あたり)

サービスに関連する操作の静的なレート要求の制限:

サービス統計情報 (GET /servicestats): 1 秒あたり 4 件 (検索単位あたり)

API 要求の制限

要求あたりの最大値: 16 MB¹
URL の最大長: 8 KB
インデックスののアップロード、マージ、または削除のバッチあたりの最大ドキュメント数: 1,000
$orderby 句の最大フィールド数: 32
検索句の最大文字数: 100,000 文字
search 内の句の最大数 (AND または OR で区切られた式): 1,024 個
検索用語の最大サイズ: UTF-8 でエンコードされたテキストの 32,766 バイト (32 KB - 2 バイト)
プレフィックス検索および正規表現検索での検索用語の最大サイズ: 1,000 文字
Lucene によって処理される場合、ワイルドカード検索と正規表現検索で制御される状態の最大数: 1,000

¹ Azure AI Search では、要求の本文に上限 16 MB が適用され、理論上の制限によって制限されない個々のフィールドまたはコレクションのコンテンツに実際的な制限が課されます (フィールドの構成と制限の詳細については、「サポートされているデータ型」を参照してください)。

無制限のクエリにより検索サービスが不安定になる恐れがあるため、クエリのサイズと構成に制限が適用されます。通常、このようなクエリはプログラムによって生成されます。アプリケーションがプログラムで検索クエリを生成する場合は、無制限のサイズのクエリが生成されないように設計することをお勧めします。

API 応答の制限

検索結果のページごとに返される最大ドキュメント数: 1,000
検索候補 API 要求ごとに返される最大検索候補数: 100

API キーの制限

API キーは、サービスの認証に使用されます。次の 2 つの種類があります。管理者キーは、要求ヘッダーで指定され、サービスに完全な読み取り/書き込みアクセス権を付与します。クエリキーは、読み取り専用で、URL で指定され、通常はクライアントアプリケーションに配布されます。

サービスあたりの最大管理キー数: 2
サービスあたりの最大クエリキー数: 50