Arama sorguları ve belgeleri için eklemeler oluşturma

Azure AI Search vektörleştirme modellerini barındırmaz, bu nedenle zorluklarınızdan biri sorgu girişleri ve çıkışları için eklemeler oluşturmaktır. Herhangi bir ekleme modelini kullanabilirsiniz, ancak bu makalede Azure OpenAI ekleme modelleri varsayılmaktadır. Örnek depodaki tanıtımlar, Azure OpenAI'nin benzerlik ekleme modellerine dokunun.

Boyut özniteliklerinin vektör alanı başına en az 2 ve en fazla 3072 boyutu vardır.

Not

Bu makale, vektörleştirme için uygulama kodunuzun Azure OpenAI gibi bir dış kaynağı çağırdığı varsayılan vektör aramasının genel kullanıma sunulan sürümü için geçerlidir. Şu anda önizleme aşamasında olan tümleşik vektörleştirme adlı yeni bir özellik, katıştırılmış vektörleştirme sunar. Tümleşik vektörleştirme dizin oluşturuculara, beceri kümelerine ve AzureOpenAIEmbedding becerisine veya Azure AI Search'ten harici olarak yürütülen bir modele işaret eden özel beceriye bağımlıdır.

Modeller nasıl kullanılır?

  • Sorgu girişleri, insan tarafından okunabilir metni hızla vektöre dönüştüren bir ekleme modeline kullanıcı tarafından sağlanan girişler göndermenizi gerektirir.

  • Sorgu çıkışları, arama dizininde bulunan tüm eşleşen belgelerdir. Arama dizininiz daha önce eklenmiş bir veya daha fazla vektör alanına sahip belgelerle yüklenmiş olmalıdır. Dizin oluşturmak için kullandığınız model, sorgular için aynı modeli kullanın.

Aynı bölgede kaynak oluşturma

Kaynakların aynı bölgede olmasını istiyorsanız, şununla başlayın:

  1. Benzerlik ekleme modeli için bir bölge, şu anda Avrupa'da ve Birleşik Devletler.

  2. Azure AI Search için bir bölge.

  3. Anlamsal derecelendirme içeren karma sorguları desteklemek için veya yapay zeka zenginleştirme işlem hattında özel becerikullanarak makine öğrenmesi modeli tümleştirmesini denemek istiyorsanız, bu özellikleri sağlayan bölgelere dikkat edin.

Geliştirilmiş sorgu için ekleme oluşturma

Aşağıdaki Python kodu, bir vektör sorgusunun "values" özelliğine yapıştırabileceğiniz bir ekleme oluşturur.

!pip install openai==0.28.1

import openai

openai.api_type = "azure"
openai.api_key = "YOUR-API-KEY"
openai.api_base = "https://YOUR-OPENAI-RESOURCE.openai.azure.com"
openai.api_version = "2023-05-15"

response = openai.Embedding.create(
    input="How do I use Python in VSCode?",
    engine="text-embedding-ada-002"
)
embeddings = response['data'][0]['embedding']
print(embeddings)

Model tümleştirmesi eklemeye yönelik İpuçları ve öneriler

  • Kullanım örneklerini tanımlama: Vektör arama özellikleri için model tümleştirmesi eklemenin arama çözümünüzde değer katıştırabileceği belirli kullanım örneklerini değerlendirin. Bu, metin içeriğiyle eşleşen resim içeriğini, diller arası aramaları veya benzer belgeleri bulmayı içerebilir.
  • Maliyeti ve performansı iyileştirme: Vektör araması yoğun kaynak kullanımlı olabilir ve maksimum sınırlara tabidir, bu nedenle yalnızca anlamsal anlam içeren alanları vektörleştirmeyi göz önünde bulundurun.
  • Doğru ekleme modelini seçin: Metin tabanlı aramalar için sözcük eklemeler veya görsel aramalar için resim ekleme gibi belirli kullanım örneğiniz için uygun bir model seçin. OpenAI'den text-embedding-ada-002 veya Azure AI Görüntü İşleme'dan Görüntü Alma REST API'si gibi önceden eğitilmiş modelleri kullanmayı göz önünde bulundurun.
  • Vektör uzunluklarını normalleştirme: Benzerlik aramasının doğruluğunu ve performansını geliştirmek için vektör uzunluklarının arama dizininde depolamadan önce normalleştirildiğinden emin olun. Önceden eğitilmiş modellerin çoğu zaten normalleştirilmiştir, ancak tümü değildir.
  • Modelde ince ayar yapma: Gerekirse, arama uygulamanızın performansını ve ilgi düzeyini artırmak için etki alanına özgü verilerinizde seçili modele ince ayar yapın.
  • Test edin ve yineleyin: İstenen arama performansını ve kullanıcı memnuniyetini elde etmek için ekleme modeli tümleştirmenizi sürekli test edin ve geliştirin.

Sonraki adımlar