ソリューションのアーキテクチャ: ディープ ラーニングと自然言語処理による情報の検出

ソーシャル サイト、フォーラム、その他のテキストによる Q&A サービスはタグ付けに大きく依存しており、タグが付けられているためにインデックス作成やユーザー検索が可能になっています。適切なタグ付けがされていないと、これらのサイトの効果は極めて小さくなります。しかし多くの場合、タグ付けはユーザーの裁量次第となっています。また、検索頻度の高い用語のリストがないため、またはサイトのカテゴリや情報の構成が十分に把握されていないために、投稿が適切にラベル付けされないことがよくあります。そのため、後で必要になったときにコンテンツを見つけ出すのが難しくなったり、コンテンツを見つけ出せなくなったりします。

ディープ ラーニングと自然言語処理 (NLP) をサイト固有の検索用語に関するデータと組み合わせたこのソリューションを使用すれば、お客様のサイトのタグ付けの正確さは大幅に向上します。ユーザーが投稿を入力すると、使用頻度の高い用語が推奨タグとして表示されるため、入力された情報を他の人がより簡単に見つけることができます。

実装ガイダンス

製品/説明 ドキュメント

Microsoft SQL Server

データは Microsoft SQL Server を使用して保存、構成、インデックス作成されます。

GPU ベースの Azure データ サイエンス Virtual Machine

中核の開発環境は Microsoft Windows Server 2016 GPU DSVM NC24 です。

Azure Machine Learning ワークベンチ

このワークベンチは、データ クリーニングとデータ変換に使用され、実験およびモデル管理サービスのプライマリ インターフェイスとして機能します。

Azure Machine Learning 実験サービス

実験サービスは、ハイパーパラメーター チューニングなどのモデル トレーニングで使用されます。

Azure Machine Learning モデル管理サービス

モデル管理サービスは、Kubernetes のマネージ Azure クラスターへのスケールなど、最終モデルのデプロイで使用されます。

Azure データ サイエンス VM での Jupyter Notebooks

Jupyter Notebooks はモデルのベース IDE として使用され、Python で開発されています。

Azure Container Registry

モデル管理サービスでは、リアルタイムの Web サービスを Docker コンテナーとして作成し、パッケージ化します。これらのコンテナーは Azure Container Registry 経由でアップロードされ、登録されます。

Azure Container Service クラスター

このソリューションのデプロイには、Kubernetes のマネージ クラスターを実行する Azure Container Service を使用します。これらのコンテナーは、Azure Container Registry に格納されているイメージからデプロイされます。