Çözüm fikirleri
Bu makale bir çözüm fikridir. İçeriği olası kullanım örnekleri, alternatif hizmetler, uygulama konuları veya fiyatlandırma yönergeleri gibi daha fazla bilgiyle genişletmemizi isterseniz GitHub geri bildirimi sağlayarak bize bildirin.
Bu makalede, derin öğrenme ve doğal dil işlemeyi (NLP) siteye özgü arama terimlerindeki verilerle birleştirerek web sitesi içerik etiketleme doğruluğunu geliştirmek için Microsoft AI'yi nasıl kullanabileceğiniz açıklanmaktadır.
Mimari
Bu mimarinin bir Visio dosyasını indirin.
Veri akışı
Veriler, özgün kaynağına bağlı olarak çeşitli biçimlerde depolanır. Veriler Azure Data Lake Depolama içinde veya Azure Synapse veya Azure SQL Veritabanı'da tablo biçiminde dosya olarak depolanabilir.
Azure Machine Learning (ML), verileri ön işleme, model eğitimi ve işlem sonrası için NLP işlem hattına almak üzere bu tür kaynaklara bağlanabilir ve bu kaynaklardan okuyabilir.
NLP ön işleme, metin genelleştirme amacıyla verileri kullanmaya yönelik birkaç adım içerir. Metin cümlelere bölününce, lemmatizasyon veya kök oluşturma gibi NLP teknikleri dilin genel bir biçimde belirteç haline getirilmesini sağlar.
NLP modelleri önceden eğitilmiş olarak kullanılabilir olduğundan, aktarım öğrenmesi yaklaşımı dile özgü eklemeleri indirmenizi ve BERT çeşitlemeleri gibi çok sınıflı metin sınıflandırması için endüstri standardı bir model kullanmanızı önerir.
NLP işlem sonrası, model ölçümlerini izlemek için modelin Azure ML'deki bir model kaydında depolanmasını önerir. Ayrıca metinler, iş hedeflerine göre belirlendik şekilde tanımlanan belirli iş kurallarıyla birlikte işlenebilir. Microsoft, bir dil modelinin adil bir şekilde eğitilmesini sağlayan yanlı dili algılamak için etik yapay zeka araçlarının kullanılmasını önerir.
Model, Azure Container Registry'de depolanan görüntülerden kapsayıcıların dağıtıldığı Kubernetes tarafından yönetilen bir küme çalıştırılırken Azure Kubernetes Service aracılığıyla dağıtılabilir. Uç noktalar bir ön uç uygulaması için kullanılabilir hale getirilebilir. Model, Azure Kubernetes Service aracılığıyla gerçek zamanlı uç noktalar olarak dağıtılabilir.
Model sonuçları dosya veya tablo biçiminde bir depolama seçeneğine yazılabilir, ardından Azure Bilişsel Arama tarafından düzgün dizinlenebilir. Model toplu çıkarım olarak çalışır ve sonuçları ilgili veri deposunda depolar.
Bileşenler
- Büyük Veri Analizi için Data Lake Depolama
- Azure Machine Learning
- Azure Bilişsel Arama
- Azure Container Registry
- Azure Kubernetes Service (AKS)
Senaryo ayrıntıları
Sosyal siteler, forumlar ve metin yoğunluklu diğer Soru-Cevap hizmetleri, iyi dizin oluşturma ve kullanıcı arama olanağı sağlayan içerik etiketlemeye büyük ölçüde dayanır. Ancak genellikle içerik etiketleme kullanıcıların takdirine bırakılır. Kullanıcılar, sık aranan terimlerin listelerine veya site yapısı hakkında ayrıntılı bilgilere sahip olmadığından, içeriği sık sık yanlış etiketlemektedir. Yanlış etiketlenmiş içeriği daha sonra ihtiyaç duyulduğunda bulmak zordur veya imkansızdır.
Olası kullanım örnekleri
İçerik etiketleme için derin öğrenme ile doğal dil işlemeyi (NLP) kullanarak, içerik genelinde etiket oluşturmak için ölçeklenebilir bir çözüm etkinleştirirsiniz. Kullanıcılar anahtar sözcüklere göre içerik ararken, bu çok sınıflı sınıflandırma işlemi etiketsiz içeriği, metnin önemli bölümlerinde arama yapmanızı sağlayacak etiketlerle zenginleştirir ve bu da bilgi alma işlemlerini geliştirir. Yeni gelen içerik, NLP çıkarımı çalıştırılarak uygun şekilde etiketlenir.
Katkıda Bulunanlar
Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.
Asıl yazar:
- Louis Li | Kıdemli Müşteri Mühendisi
Sonraki adımlar
Ürün belgelerine bakın:
- Azure Data Lake Storage 2. Nesil Giriş
- Azure Machine Learning
- Azure Bilişsel Arama belgeleri
- Azure Container Registry hakkında daha fazla bilgi edinin
- Azure Kubernetes Service
Şu Microsoft Learn modüllerini deneyin:
- PyTorch ile Doğal Dil İşlemeye Giriş
- Derin öğrenme modellerini eğitin ve değerlendirin
- Azure Bilişsel Arama ile bilgi madenciliği uygulama
İlgili kaynaklar
Aşağıdaki ilgili mimari makalelere bakın:
- Doğal dil işleme teknolojisi
- Çevrimiçi eğlence ve seyahat rezervasyonlarında geçici sorguları desteklemek için delta gölü oluşturma
- Azure Synapse sunucusuz kullanarak veri gölü veya göl evi sorgulama
- Azure Machine Learning ile makine öğrenmesi yaşam döngüsünün ölçeğini artırmaya yönelik makine öğrenmesi işlemleri (MLOps) çerçevesi
- Üretimde tahmine dayalı bakıma giriş
- Tahmine dayalı bakım çözümü