Konuşmayı Metne Dönüştürme

Doğal yanıtlama hızı sağlamak için sesi hızla metne dönüştürün.

Bilişsel Hizmetler Konuşmayı Metne dönüştürme, çeşitli dönüştürme senaryolarını desteklemek için uygulamalarınıza ekleyebileceğiniz, diyalog transkripsiyonu, konuşma transkripsiyonu ve özel konuşma transkripsiyonu gibi bir dizi özellik sunar.

Konuşma transkripsiyonu

Kişisel toplantı transkripsiyonu özelliği sağlayın. Konuşma transkripsiyonu, konuşmayı gerçek zamanlı olarak yakalar ve kimin neyi, ne zaman söylediğini tanımlama ve hızla bir sonraki adımları gerçekleştirme olasılığı sunarak katılımcıların görüşme esnasında tam olarak etkileşim kurmasını sağlar.

Konuşma transkripsiyonunu kullanarak:

  • Toplantı odasının her yerinden konuşmayı yakalayın.
  • Endüstri lideri güvenlik ve uyumluluk sertifikaları ile verilerinizin korunmasına yardımcı olun.
  • Konuşma Cihazları SDK’sı ile birleştirerek, mikrofon ve video kameralarını kullanan toplantı ve konferans kurulumlarını destekleyin.

Nasıl çalıştığını görün

Tanıtım yüklenirken bir hata oluştu. Lütfen bir süre bekledikten sonra tekrar deneyin

Konuşmacı Transkript

Bu tanıtım tarayıcınızla uyumlu değil. En iyi deneyim için lütfen farklı bir tarayıcı kullanın.

Bunu oluşturmak istiyor musunuz?

Konuşma transkripsiyonu

Konuşma sesini metne dönüştürün. Mikrofondan, diğer gerçek zamanlı akış kaynaklarından ya da kayıtlı bir ses dosyasından gelen sesleri birbirinden ayırt etmek için API’ye çağrı yapın. İstenirse ses sunucuya gönderildiği sırada kısmi tanıma sonuçları döndürülür.

API’yi kullanarak sesle tetiklenen akıllı uygulamalar oluşturabilirsiniz. Tanıtımı deneyerek nasıl çalıştığını görün. Hedef dilinizi seçip mikrofona tıklayın ve konuşmaya başlayın. Dilerseniz basitçe örnek konuşma ifadelerinden birine de tıklayabilirsiniz.*

Nasıl çalıştığını görün

Tanıtımı bir mikrofon üzerinden kendi sesinizi kullanarak denemek için lütfen WebRTC destekli başka bir tarayıcıya (örneğin, Microsoft Edge, Firefox veya Chrome’un yeni bir sürümü) geçin.

Bunu oluşturmak istiyor musunuz?

Özel konuşma tanıma hizmeti: Özel Modelle Konuşma Transkripsiyonu

Konuşma tarzı, sözlük ve arka plan gürültüsü gibi konuşma tanıma engellerini aşın. Konuşma tanıma teknolojilerimiz, metin çıkışını oluşturmak için birden çok API’yi birleştirir. Müşteriler API’leri kendi gereksinimlerine ve sahip oldukları verilere göre özelleştirebilir.

Nasıl çalıştığını görün

Örnek Cümleler

Taban Çizgisi

Özel Konuşma

Kullanıcılarınızın konuşma tarzlarına göre uyarlanmış özel dil modelleri oluşturun

Sözcük hazineleri ve konuşma tarzlarındaki çeşitliliğin anlayışa engel olmasını önleyin. Uygulamanızın konuşma tanıma teknolojisinin dil modelini sektörünüzde kullanılan ifadelere, teknik, coğrafi veya pazarla ilgili terimlere, hatta konuşmacı tarzına göre uyarlayarak özelleştirin.

Özel akustik modellerle kullanıcının ortamına uyum sağlayın

Uygulamanızın konuşma tanıma özelliğinin her ortamda çalışabildiğinden emin olun. Özel akustik modellerle arka plan gürültüsünü telafi edebilir ve kullanıcılarınızın beklediği ortamlarla eşleştirebilirsiniz.

Microsoft tarafından sunulan güçlü konuşma tanıma modellerini kullanın

Microsoft’un sunduğu son teknoloji modellerin üzerinde kendi özelleştirilmiş konuşma modellerinizi oluşturarak güçlü, kişiselleştirilmiş konuşma tanımayı etkinleştirin.

Bunu oluşturmak istiyor musunuz?

Bir konuşma senaryosunu keşfedin

Çağrı merkezi

Speech ServicesWith Speech Services, it's easy to transcribe every call. Index the transcription for full-text search, or apply Text Analytics to detect sentiment, language, and key phrases for insights. If your call center recordings involve specialized terminology, such as product names or IT jargon, create a custom language model to teach Speech Services the vocabulary. A custom acoustic model helps Speech Services understand speakers even with background noise or poor phone connections. For more information, read how batch transcription works with Speech Services.
  1. Genel Bakış
  2. Akış

Konuşma Hizmetleri

Genel Bakış

Konuşma Tanıma Hizmetleri ile çağrıların dökümünü oluşturmak çok kolay. Transkripsiyonu tam metin araması için dizinleyebilir veya Metin Analizi uygulayarak içgörü için yaklaşımı, dili ve anahtar ifadeleri algılayabilirsiniz. Çağrı merkezi kayıtlarınız özel terminoloji (ürün adları veya BT jargonu gibi) içeriyorsa Konuşma Tanıma Hizmetlerine bu sözlüğü öğretmek için bir dil modeli oluşturun. Özel bir akustik model, Konuşma Tanıma Hizmetinin arka plan gürültüsü içeren veya telefon bağlantısının kötü olduğu koşullarda bile konuşmacıları anlamasına yardımcı olur.

Daha fazla bilgi için toplu iş transkripsiyonunun Konuşma Tanıma Hizmetleri ile nasıl çalıştığını öğrenin.

Akış

  1. 1 Etki alanınız için bir model benimseyin ve modeli dağıtın
  2. 2 Kayıtlarınızı bir blob kapsayıcısına yükleyin
  3. 3 Toplu iş transkripsiyonu için bir POST talebi oluşturun
  4. 4 Konuşma Tanıma Hizmetleri transkripsiyon işini zamanlar
  5. 5 Stereo dosyalar iki kanala bölünür
  6. 6 Hoparlörler ayırmak için mono dosyalara günlük tutma işlemi uygulanır
  7. 7 Transkripsiyon kimliğini kullanarak transkripsiyonu indirin

Bilişsel Hizmetler API’lerini keşfedin

Görüntü İşleme

Görüntülerden eyleme dönüştürülebilir bilgiler çıkarın

Yüz Tanıma

Fotoğraflardaki yüzleri algılayın, tanımlayın, çözümleyin, düzenleyin ve etiketleyin

Mürekkep Tanıma ÖNİZLEME

El yazısı, şekiller ve mürekkeple yazılan belge düzeni gibi dijital mürekkep içeriğini tanıyan bir yapay zeka hizmeti

Video Indexer

Videolardaki içgörüleri ortaya çıkarın

Özel Görüntü İşleme

Son teknoloji ürünü görüntü işleme modellerini kolayca özelleştirerek kendinize özgü kullanım örnekleri oluşturun

Form Tanıma ÖNİZLEME

Formlarınızı anlayan yapay zeka destekli belge ayıklama hizmeti

Metin Analizi

Duyguları ve konuları kolayca değerlendirerek kullanıcıların ne istediğini anlayın

Translator Metin Çevirisi

Basit bir REST API çağrısıyla kolayca makine çevirisi yapın

Soru-Cevap Oluşturma

Bilgileri kategorilere ayırarak konuşma bağlamında kullanılabilen ve kolayca bulunabilen yanıtlar elde edin

Language Understanding

Uygulamalarınıza kullanıcılarınızın verdiği komutları anlamayı öğretin

Tam Ekran Okuyucu ÖNİZLEME

Tüm yaş ve beceri gruplarından kullanıcılara metin okuyup anlamada destek olun

Konuşma Hizmetleri

Konuşmayı metne dönüştürme, metin okuma ve konuşma çevirisi için birleşik konuşma hizmetleri

Konuşmacı Tanıma ÖNİZLEME

Tek tek konuşmacıları belirlemek ve doğrulamak için konuşma özelliklerinden yararlanın

Content Moderator

Otomatik görüntü, metin ve video denetimi

Anomali Algılayıcısı ÖNİZLEME

Uygulamalarınıza anomali algılama özelliklerini kolayca ekleyin.

Kişiselleştirme ÖNİZLEME

Kişiselleştirilmiş kullanıcı deneyimi sağlayan bir AI hizmeti

Bir ortam cihazı ve özel bir uyandırma kelimesi oluşturmak için Konuşma Cihazları SDK’sını kullanın

Daha fazla bilgi