Architektura řešení: Zjišťování informací pomocí obsáhlého learningu a zpracování přirozeného jazyka

Sociální sítě, fóra a další služby otázek a odpovědí, které obsahují hodně textu, se výrazně spoléhají na využití značek, které umožňuje indexování a uživatelské hledání. Bez odpovídajícího využití značek jsou tyto weby mnohem méně efektivní. Využití značek je ale často ponechané na uvážení uživatelů. A vzhledem k tomu, že uživatelé nemají k dispozici seznamy běžně hledaných termínů a nejsou podrobně obeznámení s kategorizační nebo informační architekturou webů, jsou příspěvky často špatně označené. To potom znesnadňuje nebo dokonce znemožňuje vyhledání příslušného obsahu, když je později potřeba.

Díky kombinaci obsáhlého learningu a zpracování přirozeného jazyka (NLP) s údaji o hledaných výrazech pro konkrétní weby toto řešení pomáhá výrazně zlepšit přesnost použití značek na vašem webu. Když uživatel píše text, toto řešení nabízí často používané termíny jako navrhované značky a usnadňuje tak vyhledávání poskytovaných informací pro ostatní uživatele.

Pokyny k implementaci

Produkty/popis Dokumentace

Microsoft SQL Server

K ukládání, strukturování a indexaci dat se využívá Microsoft SQL Server.

Virtuální počítač Azure pro datové vědy založený na GPU

Základním vývojovým prostředím je virtuální počítač GPU NC24 pro datové vědy s Microsoft Windows Serverem 2016.

Azure Machine Learning Workbench

Služba Workbench se využívá pro transformaci a čištění dat a slouží jako primární rozhraní pro služby Experimentování a Správa modelů.

Služba Experimentování ve službě Azure Machine Learning

Služba Experimentování se používá k tréninku modelu, včetně vyladění hyperparametrů.

Správa modelů ve službě Azure Machine Learning

Služba Správa modelů se využívá k nasazení finálního modelu, včetně horizontálního navýšení kapacity v clusteru Azure spravovaném pomocí protokolu Kubernetes.

Poznámkové bloky Jupyter ve virtuálním počítači Azure pro datové vědy

Poznámkové bloky Jupyter se používají jako základní integrované vývojové prostředí pro model vyvinutý v Pythonu.

Azure Container Registry

Služba Správa modelů vytváří a balí webové služby v reálném čase jako kontejnery Dockeru. Tyto kontejnery se načítají a registrují prostřednictvím služby Azure Container Registry.

Cluster Azure Container Service

Nasazení pro toto řešení využívá Azure Container Service s clusterem spravovaným pomocí protokolu Kubernetes. Kontejnery se nasazují z imagí uložených v Azure Container Registry.