Oplossingsideeën
Dit artikel is een oplossingsidee. Als u wilt dat we de inhoud uitbreiden met meer informatie, zoals mogelijke use cases, alternatieve services, implementatieoverwegingen of prijsrichtlijnen, laat het ons dan weten door GitHub-feedback te geven.
In dit artikel wordt beschreven hoe u Microsoft AI kunt gebruiken om de nauwkeurigheid van website-inhoud te verbeteren door deep learning en natuurlijke taalverwerking (NLP) te combineren met gegevens op sitespecifieke zoektermen.
Architectuur
Een Visio-bestand van deze architectuur downloaden.
Gegevensstroom
Gegevens worden opgeslagen in verschillende indelingen, afhankelijk van de oorspronkelijke bron. Gegevens kunnen worden opgeslagen als bestanden in Azure Data Lake Storage of in tabelvorm in Azure Synapse of Azure SQL Database.
Azure Machine Learning (ML) kan verbinding maken met en lezen uit dergelijke bronnen om de gegevens op te nemen in de NLP-pijplijn voor preverwerking, modeltraining en naverwerking.
NLP-voorverwerking omvat verschillende stappen om gegevens te gebruiken, met als doel tekstgeneralisatie. Zodra de tekst is opgesplitst in zinnen, kunnen NLP-technieken, zoals lemmatisatie of stemming, de taal in een algemene vorm worden getokeniseerd.
Omdat NLP-modellen al vooraf zijn getraind, raadt de overdrachtsleermethode u aan taalspecifieke insluitingen te downloaden en een industriestandaardmodel te gebruiken voor tekstclassificatie met meerdere klassen, zoals variaties van BERT.
Naverwerking van NLP raadt u aan het model op te slaan in een modelregister in Azure ML om metrische modelgegevens bij te houden. Bovendien kan tekst na verwerking worden verwerkt met specifieke bedrijfsregels die deterministisch zijn gedefinieerd, op basis van de bedrijfsdoelen. Microsoft raadt u aan ethische AI-hulpprogramma's te gebruiken om bevooroordeste taal te detecteren, wat zorgt voor een eerlijke training van een taalmodel.
Het model kan worden geïmplementeerd via Azure Kubernetes Service, terwijl een door Kubernetes beheerd cluster wordt uitgevoerd waarin de containers worden geïmplementeerd vanuit installatiekopieën die zijn opgeslagen in Azure Container Registry. Eindpunten kunnen beschikbaar worden gesteld voor een front-endtoepassing. Het model kan worden geïmplementeerd via Azure Kubernetes Service als realtime-eindpunten.
Modelresultaten kunnen worden geschreven naar een opslagoptie in bestands- of tabelvorm en vervolgens correct geïndexeerd door Azure Cognitive Search. Het model wordt uitgevoerd als batchdeductie en slaat de resultaten op in het respectieve gegevensarchief.
Onderdelen
- Data Lake Storage voor Big Data Analytics
- Azure Machine Learning
- Azure Cognitive Search
- Azure Container Registry
- Azure Kubernetes Service (AKS)
Scenariodetails
Sociale sites, forums en andere tekstzware Q&A-services zijn sterk afhankelijk van inhoudstags, waardoor goede indexering en gebruikerszoekopdrachten mogelijk zijn. Vaak is inhoudstags echter naar eigen goeddunken van gebruikers overgelaten. Omdat gebruikers geen lijsten met veelgebruikte zoektermen of een grondige kennis van de sitestructuur hebben, worden inhoud vaak verkeerd gelabeld. Verkeerd gelabelde inhoud is moeilijk of onmogelijk te vinden wanneer deze later nodig is.
Potentiële gebruikscases
Door gebruik te maken van natuurlijke taalverwerking (NLP) met deep learning voor inhoudstags, kunt u een schaalbare oplossing inschakelen om tags voor alle inhoud te maken. Wanneer gebruikers inhoud zoeken op trefwoorden, verrijkt dit classificatieproces met meerdere klassen inhoud met labels waarmee u kunt zoeken op aanzienlijke delen van tekst, waardoor de processen voor het ophalen van gegevens worden verbeterd. Nieuwe binnenkomende inhoud wordt op de juiste wijze getagd door NLP-deductie uit te voeren.
Medewerkers
Dit artikel wordt onderhouden door Microsoft. De tekst is oorspronkelijk geschreven door de volgende Inzenders.
Hoofdauteur:
- Louis Li | Senior klanttechnicus
Volgende stappen
Raadpleeg de productdocumentatie:
- Inleiding tot Azure Data Lake Storage Gen2
- Azure Machine Learning
- Documentatie voor Azure Cognitive Search
- Meer informatie over Azure Container Registry
- Azure Kubernetes Service
Probeer deze Microsoft Learn-modules:
- Inleiding tot natuurlijke taalverwerking met PyTorch
- Deep Learning-modellen trainen en evalueren
- Kennisanalyse implementeren met Azure Cognitive Search
Verwante resources
Zie de volgende gerelateerde architecturale artikelen:
- Technologie voor verwerking van natuurlijke taal
- Een Delta Lake bouwen ter ondersteuning van ad-hocquery's in online vrije tijd en reisboeking
- Een query uitvoeren op een data lake of lakehouse met behulp van serverloze Azure Synapse
- MlOps-framework (Machine Learning Operations) om de levenscyclus van machine learning te verbeteren met Azure Machine Learning
- Inleiding tot voorspellend onderhoud in productie
- Oplossing voor voorspellend onderhoud