Azure AI Search'te arama dizinine veri yükleme

Bu makalede, önceden tanımlanmış bir arama dizinindeki içeriği içeri aktarma, yenileme ve yönetme açıklanmaktadır. Azure AI Search'te ilk olarak bir arama dizini oluşturulur ve ikinci adım olarak veri içeri aktarma işlemi gerçekleştirilir. Tek bir iş akışında dizin oluşturup yükleyen Veri İçeri Aktarma sihirbazı ve dizin oluşturucu işlem hatları özel durumdur.

Arama hizmeti, tam metin arama, vektör arama, karma arama ve bilgi madenciliği senaryolarında kullanılan JSON'da metin ve vektörleri içeri aktarır ve dizinler. Metin içeriği dış veri kaynağındaki alfasayısal alanlardan, arama senaryolarında yararlı olan meta verilerden veya beceri kümesi tarafından oluşturulan zenginleştirilmiş içerikten elde edilebilir (beceriler görüntülerden ve yapılandırılmamış içerikten metin açıklamalarını ayıklayabilir veya çıkarabilir). Vektör içeriği, dış ekleme modeli veya tümleşik vektörleştirme (önizleme) kullanılarak vektörleştirilir.

Veriler dizine eklendikten sonra dizinin fiziksel veri yapıları kilitlenir. Nelerin değiştirilebileceği ve değiştirilebileceği konusunda yönergeler için bkz . Dizini bırakma ve yeniden derleme.

Dizin oluşturma bir arka plan işlemi değildir. Arama hizmeti dizin oluşturma ve sorgu iş yüklerini dengeler, ancak sorgu gecikme süresi çok yüksekse, kapasite ekleyebilir veya dizin yüklemek için düşük sorgu etkinliği dönemlerini belirleyebilirsiniz.

Belge yükleme

Arama hizmeti, dizin şemasına uygun JSON belgelerini kabul eder.

Bu belgeleri kendiniz hazırlayabilirsiniz, ancak içerik desteklenen bir veri kaynağında bulunuyorsa, bir dizin oluşturucuyu veya Verileri içeri aktarma sihirbazını çalıştırmak belge alma, JSON serileştirme ve dizin oluşturmayı otomatikleştirebilir.

Azure portalında, sorunsuz bir iş akışında dizinler oluşturmak ve yüklemek için Verileri İçeri Aktarma sihirbazlarını kullanın. Mevcut bir dizini yüklemek istiyorsanız alternatif bir yaklaşım seçin.

  1. Azure hesabınızla Azure portalında oturum açın.

  2. Arama hizmetinizi bulun ve Genel Bakış sayfasında Verileri içeri aktar'ı veya Arama dizini oluşturup doldurmak için komut çubuğunda verileri içeri aktar ve vektörleştir'i seçin. İş akışını gözden geçirmek için şu bağlantıları izleyebilirsiniz: Hızlı Başlangıç: Azure AI Arama dizini oluşturma ve Hızlı Başlangıç: Tümleşik vektörleştirme (önizleme).

    Verileri içeri aktar komutunun ekran görüntüsü

Dizin oluşturucular zaten tanımlanmışsa Azure portalından bir dizin oluşturucuyu sıfırlayabilir ve çalıştırabilirsiniz. Bu, alanları artımlı olarak ekliyorsanız kullanışlıdır. Sıfırlama, dizin oluşturucuyu baştan başlamaya zorlayarak tüm kaynak belgelerden tüm alanları almaya zorlar.

Yalnız bırakılmış belgeleri silme

Azure AI Search, belirli bir belgeyi tek başına aramanız, güncelleştirmeniz ve silmeniz için belge düzeyinde işlemleri destekler. Aşağıdaki örnekte belgenin nasıl silineceği gösterilmektedir. Arama hizmetinde belgeler birbiriyle ilişkili değildir, bu nedenle bir belgenin silinmesi dizinin geri kalanını etkilemez.

  1. Belge anahtarının hangi alan olduğunu belirleyin. Portalda her dizinin alanlarını görüntüleyebilirsiniz. Belge anahtarları dize alanlarıdır ve daha kolay fark etmelerini sağlamak için bir anahtar simgesiyle gösterilir.

  2. Belge anahtarı alanının değerlerini denetleyin: search=*&$select=HotelId. Basit bir dize basittir, ancak dizinde base-64 kodlanmış bir alan kullanılıyorsa veya bir parsingMode ayardan arama belgeleri oluşturulduysa, aşina olmadığınız değerlerle çalışıyor olabilirsiniz.

  3. Belge kimliğinin değerini doğrulamak ve silmeden önce içeriğini gözden geçirmek için belgeyi arayın. İstekte anahtarı veya belge kimliğini belirtin. Aşağıdaki örneklerde Hotels örnek dizini için basit bir dize ve cog-search-demo dizininin metadata_storage_path anahtarı için base-64 kodlanmış bir dize gösterilmektedir.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Belgeyi silip arama dizininden kaldırın.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Ayrıca bkz.