Lösningsarkitektur: Informationsidentifiering med djupinlärning och naturlig språkbearbetning

Sociala webbplatser, forum och andra textbaserade tjänster med frågor och svar är starkt beroende av taggning för indexering och användarsökning. Dessa webbplatser är mycket mindre effektiva om de inte använder taggning. Men ofta lämnas taggningen helt och hållet till användarna. Och eftersom användarna inte har listor med vanliga sökord eller en djup förståelse av webbplatsens kategoriserings- eller informationsarkitektur får inläggen ofta fel namn. Det gör det svårt, eller till och med omöjligt, att sedan hitta innehåll när man behöver det.

Den här lösningen kan förbättra taggningen på din webbplats genom att kombinera djupinlärning och språkbearbetning (NLP) med data om webbplatsspecifika sökord. När användaren skriver sitt inlägg föreslås vanliga ord som taggar, så att andra lättare kan hitta den information som de anger.

Implementeringsanvisningar

Produkter Dokumentation

Microsoft SQL Server

Data lagras, struktureras och indexeras med Microsoft SQL Server.

GPU-baserad Azure Data Science Virtual Machine

Den huvudsakliga utvecklingsmiljön är Microsoft Windows Server 2016 GPU DSVM NC24.

Azure Machine Learning Workbench

Workbench används för datarensning och transformering och fungerar som primärt gränssnitt för experimenterings- och modellhanteringstjänsterna.

Azure Machine Learning Experimentation Service

Experimenteringstjänsten används för modellträning, inklusive finjustering av hyperparametrar.

Azure Machine Learning Model Management Service

Modellhanteringstjänsten används för distribution av den slutliga modellen, inklusive utskalning till ett Kubernetes-hanterat Azure-kluster.

Jupyter Notebooks på Azure Data Science VM

Jupyter Notebooks används som grundläggande utvecklingsmiljö för modellen, som har utvecklats i Python.

Azure Container Registry

Modellhanteringstjänsten skapar och paketerar realtidswebbtjänster som Docker-behållare. Dessa behållare överförs och registreras via Azure Container Registry.

Azure Container Service Cluster

Vid distributionen av den här lösningen används en Azure Container Service som kör ett Kubernetes-hanterat kluster. Behållarna distribueras från avbildningar som lagras i Azure Container Registry.