Konuşmayı Metne Dönüştürme

Doğal yanıtlama hızı sağlamak için sesi hızla metne dönüştürün.

Bilişsel Hizmetler Konuşmayı Metne dönüştürme, çeşitli dönüştürme senaryolarını desteklemek için uygulamalarınıza ekleyebileceğiniz, diyalog transkripsiyonu, konuşma transkripsiyonu ve özel konuşma transkripsiyonu gibi bir dizi özellik sunar.

Konuşma transkripsiyonu

Kişisel toplantı transkripsiyonu özelliği sağlayın. Konuşma transkripsiyonu, konuşmayı gerçek zamanlı olarak yakalar ve kimin neyi, ne zaman söylediğini tanımlama ve hızla bir sonraki adımları gerçekleştirme olasılığı sunarak katılımcıların görüşme esnasında tam olarak etkileşim kurmasını sağlar.

Konuşma transkripsiyonunu kullanarak:

  • Toplantı odasının her yerinden konuşmayı yakalayın.
  • Endüstri lideri güvenlik ve uyumluluk sertifikaları ile verilerinizin korunmasına yardımcı olun.
  • Konuşma Cihazları SDK’sı ile birleştirerek, mikrofon ve video kameralarını kullanan toplantı ve konferans kurulumlarını destekleyin.

Nasıl çalıştığını görün

Tanıtım yüklenirken bir hata oluştu. Lütfen bir süre bekledikten sonra tekrar deneyin

Konuşmacı Transkript

Bu tanıtım tarayıcınızla uyumlu değil. En iyi deneyim için lütfen farklı bir tarayıcı kullanın.

Bunu oluşturmak istiyor musunuz?

Konuşma transkripsiyonu

Konuşma sesini metne dönüştürün. Mikrofondan, diğer gerçek zamanlı akış kaynaklarından ya da kayıtlı bir ses dosyasından gelen sesleri birbirinden ayırt etmek için API’ye çağrı yapın. İstenirse ses sunucuya gönderildiği sırada kısmi tanıma sonuçları döndürülür.

API’yi kullanarak sesle tetiklenen akıllı uygulamalar oluşturabilirsiniz. Tanıtımı deneyerek nasıl çalıştığını görün. Hedef dilinizi seçip mikrofona tıklayın ve konuşmaya başlayın. Dilerseniz basitçe örnek konuşma ifadelerinden birine de tıklayabilirsiniz.*

Nasıl çalıştığını görün

Tanıtımı bir mikrofon üzerinden kendi sesinizi kullanarak denemek için lütfen WebRTC destekli başka bir tarayıcıya (örneğin, Microsoft Edge, Firefox veya Chrome’un yeni bir sürümü) geçin.

Bunu oluşturmak istiyor musunuz?

Özel konuşma tanıma hizmeti: Özel Modelle Konuşma Transkripsiyonu

Konuşma tarzı, sözlük ve arka plan gürültüsü gibi konuşma tanıma engellerini aşın. Konuşma tanıma teknolojilerimiz, metin çıkışını oluşturmak için birden çok API’yi birleştirir. Müşteriler API’leri kendi gereksinimlerine ve sahip oldukları verilere göre özelleştirebilir.

Nasıl çalıştığını görün

Örnek Cümleler

Taban Çizgisi

Özel Konuşma

Kullanıcılarınızın konuşma tarzlarına göre uyarlanmış özel dil modelleri oluşturun

Sözcük hazineleri ve konuşma tarzlarındaki çeşitliliğin anlayışa engel olmasını önleyin. Uygulamanızın konuşma tanıma teknolojisinin dil modelini sektörünüzde kullanılan ifadelere, teknik, coğrafi veya pazarla ilgili terimlere, hatta konuşmacı tarzına göre uyarlayarak özelleştirin.

Özel akustik modellerle kullanıcının ortamına uyum sağlayın

Uygulamanızın konuşma tanıma özelliğinin her ortamda çalışabildiğinden emin olun. Özel akustik modellerle arka plan gürültüsünü telafi edebilir ve kullanıcılarınızın beklediği ortamlarla eşleştirebilirsiniz.

Microsoft tarafından sunulan güçlü konuşma tanıma modellerini kullanın

Microsoft’un sunduğu son teknoloji modellerin üzerinde kendi özelleştirilmiş konuşma modellerinizi oluşturarak güçlü, kişiselleştirilmiş konuşma tanımayı etkinleştirin.

Bunu oluşturmak istiyor musunuz?

Bir konuşma senaryosunu keşfedin

Çağrı merkezi

語音服務使用語音服務時,您可以輕鬆轉譯每個通話。您可以編製轉譯的索引,以進行全文檢索搜尋,或套用文字分析來偵測情感、語言與關鍵片語,以獲取見解。如果話務中心的錄音涉及專用術語 (例如,產品名稱或 IT 專業術語),您可以建立自訂語言模型讓語音服務學習這些詞彙。即使在背景噪音或通話連線差的環境下,自訂原音模型仍可協助語音服務了解說話者的內容。如需詳細資訊,請參閱批次轉譯與語音服務的運作方式。
  1. Genel Bakış
  2. Akış

Konuşma Hizmetleri

Genel Bakış

Konuşma Tanıma Hizmetleri ile çağrıların dökümünü oluşturmak çok kolay. Transkripsiyonu tam metin araması için dizinleyebilir veya Metin Analizi uygulayarak içgörü için yaklaşımı, dili ve anahtar ifadeleri algılayabilirsiniz. Çağrı merkezi kayıtlarınız özel terminoloji (ürün adları veya BT jargonu gibi) içeriyorsa Konuşma Tanıma Hizmetlerine bu sözlüğü öğretmek için bir dil modeli oluşturun. Özel bir akustik model, Konuşma Tanıma Hizmetinin arka plan gürültüsü içeren veya telefon bağlantısının kötü olduğu koşullarda bile konuşmacıları anlamasına yardımcı olur.

Daha fazla bilgi için toplu iş transkripsiyonunun Konuşma Tanıma Hizmetleri ile nasıl çalıştığını öğrenin.

Akış

  1. 1 Etki alanınız için bir model benimseyin ve modeli dağıtın
  2. 2 Kayıtlarınızı bir blob kapsayıcısına yükleyin
  3. 3 Toplu iş transkripsiyonu için bir POST talebi oluşturun
  4. 4 Konuşma Tanıma Hizmetleri transkripsiyon işini zamanlar
  5. 5 Stereo dosyalar iki kanala bölünür
  6. 6 Hoparlörler ayırmak için mono dosyalara günlük tutma işlemi uygulanır
  7. 7 Transkripsiyon kimliğini kullanarak transkripsiyonu indirin

Bilişsel Hizmetler API’lerini keşfedin

Görüntü İşleme

Görüntülerden eyleme dönüştürülebilir bilgiler çıkarın

Yüz Tanıma

Fotoğraflardaki yüzleri algılayın, tanımlayın, çözümleyin, düzenleyin ve etiketleyin

Mürekkep Tanıma ÖNİZLEME

El yazısı, şekiller ve mürekkeple yazılan belge düzeni gibi dijital mürekkep içeriğini tanıyan bir yapay zeka hizmeti

Video Indexer

Videolardaki içgörüleri ortaya çıkarın

Özel Görüntü İşleme

Son teknoloji ürünü görüntü işleme modellerini kolayca özelleştirerek kendinize özgü kullanım örnekleri oluşturun

Form Tanıma ÖNİZLEME

Formlarınızı anlayan yapay zeka destekli belge ayıklama hizmeti

Metin Analizi

Duyguları ve konuları kolayca değerlendirerek kullanıcıların ne istediğini anlayın

Translator Metin Çevirisi

Basit bir REST API çağrısıyla kolayca makine çevirisi yapın

Soru-Cevap Oluşturma

Bilgileri kategorilere ayırarak konuşma bağlamında kullanılabilen ve kolayca bulunabilen yanıtlar elde edin

Language Understanding

Uygulamalarınıza kullanıcılarınızın verdiği komutları anlamayı öğretin

Tam Ekran Okuyucu ÖNİZLEME

Tüm yaş ve beceri gruplarından kullanıcılara metin okuyup anlamada destek olun

Konuşma Hizmetleri

Konuşmayı metne dönüştürme, metin okuma ve konuşma çevirisi için birleşik konuşma hizmetleri

Konuşmacı Tanıma ÖNİZLEME

Tek tek konuşmacıları belirlemek ve doğrulamak için konuşma özelliklerinden yararlanın

Content Moderator

Otomatik görüntü, metin ve video denetimi

Anomali Algılayıcısı ÖNİZLEME

Uygulamalarınıza anomali algılama özelliklerini kolayca ekleyin.

Kişiselleştirme ÖNİZLEME

Kişiselleştirilmiş kullanıcı deneyimi sağlayan bir AI hizmeti

Bir ortam cihazı ve özel bir uyandırma kelimesi oluşturmak için Konuşma Cihazları SDK’sını kullanın

Daha fazla bilgi