Opracowywanie wielomodalnych aplikacji generatywnej sztucznej inteligencji przy użyciu modeli mowy
Transkrypcja mowy na tekst
Transkrybuj konwersacje prowadzone w biurze obsługi lub na spotkaniach. Przejdź na globalną obsługę napisów audio w ponad 100 językach.
Konwertowanie tekstu na mowę
Twórz boty, które mówią naturalnie. Wyróżnij swoją markę za pomocą niestandardowych, realistycznych głosów i stylów mówienia.
Analiza mowy
Analizuj nagrania połączeń audio lub wideo, aby uzyskać szczegółowe informacje. Podsumuj kluczowe tematy i wyodrębnij lub zredaguj osobiste informacje identyfikacyjne.
Transkrypcja dźwięku za pomocą modelu OpenAI Whisper
Przekształć swoje biura obsługi, korzystając z najnowszego modelu OpenAI Whisper w aplikacjach Mowa platformy Azure AI lub usłudze Azure OpenAI Service.
Tworzenie głosów niestandardowych
Twórz naturalnie brzmiące głosy za pomocą niestandardowego neuronowego modelu głosu.
Tworzenie awatarów
Ożyw swoją markę, używając wstępnie utworzonych lub niestandardowych awatarów z naturalnie brzmiącymi głosami.
Weryfikowanie i rozpoznawanie osób mówiących
Potwierdź tożsamość osoby lub rozpoznaj osoby mówiące na spotkaniu, dodając do aplikacji funkcje weryfikacji i identyfikacji osoby mówiącej.
Włącz komunikację wielojęzyczną
Tłumacz dane dotyczące dźwięku lub wideo z lub na stale rosnącą listę obsługiwanych języków. Dostosuj tłumaczenia do swojej branży.
Osadzona mowa
Używaj osadzonej mowy, aby włączać na urządzeniu scenariusze zamiany mowy na tekst i zamianę tekstu na mowę, w których łączność z chmurą jest sporadyczna lub niedostępna.
Płać wyłącznie za rzeczywiste użycie bez kosztów ponoszonych z góry. Ceny aplikacji Mowa platformy Azure AI z płatnością zgodnie z rzeczywistym użyciem są oparte na następujących zasadach:
„Naszym największym przypadkiem użycia platformy Azure jest sztuczna inteligencja, usługi Cognitive Services i obszary mowy. Dotyczy to niemal każdej części naszej platformy”.
Jeff Gallino, współzałożyciel i dyrektor ds. technologii, CallMiner
„Byliśmy pionierami w Brazylii. Dokonaliśmy odważnych wyborów, inwestując w używanie neuronowego, syntetyzowanego modelu głosu, gdy nikt inny tego wcześniej nie zrobił. Rozmawiamy z milionami klientów każdego roku, więc zmiana naszego modelu głosu jest aktem odwagi”.
Olimpio Fernandes, dyrektor Cognitive Experience Center, TIM
„Dość trudno jest zaoferować głosy o wysokiej jakości na dużą skalę, ale firma Microsoft naprawdę pomogła nam doprowadzić kwestię TTS do końca i uzyskać głosy dla naszych klientów”.
Moad Ben-Suleiman, inżynier ds. oprogramowania, NaturalReader
Aplikacje Mowa platformy Azure AI oferują szereg funkcji i możliwości, w tym zamianę mowy na tekst, zamianę tekstu na mowę i tłumaczenie mowy. Są one oferowane za pośrednictwem zestawów SDK w kilku językach programowania, takich jak C#, C++, Java i nie tylko.
Aplikacje Mowa platformy Azure AI obsługują coraz większy zestaw języków. W celu uzyskania aktualnej listy obsługiwanych języków zapoznaj się z tą listą.
Klienci tworzą interesujące aplikacje przy użyciu usług platformy Azure AI. Rozpocznij pracę z funkcją analiza mowy w usłudze Azure AI Foundry na potrzeby sztucznej inteligencji konwersacji, analizy po połączeniu, podsumowywania wideo i innych przypadków użycia.
Następne kroki
Wybierz konto platformy Azure odpowiednie dla siebie
Płać zgodnie z rzeczywistym zużyciem lub bezpłatnie wypróbuj platformę Azure przez 30 dni.