Pomiń nawigację

Usługi mowy — cennik

Ujednolicone usługi przetwarzania mowy umożliwiające zamianę mowy na tekst i tekstu na mowę oraz tłumaczenie mowy

Ujednolicone usługi mowy oferują szeroką gamę możliwości generowania i rozpoznawania mowy, takich jak na przykład transkrypcja mowy, zamiana tekstu na mowę i tłumaczenie mowy. Usługi mowy oferują szeroką gamę możliwości generowania i rozpoznawania mowy, takich jak na przykład transkrypcja mowy, zamiana tekstu na mowę, tłumaczenie mowy i rozpoznawanie osoby mówiącej.

Eksplorowanie opcji cennika

Zastosuj filtry, aby dostosować opcje cennika do własnych potrzeb.

Prices are estimates only and are not intended as actual price quotes. Actual pricing may vary depending on the type of agreement entered with Microsoft, date of purchase, and the currency exchange rate. Prices are calculated based on US dollars and converted using Thomson Reuters benchmark rates refreshed on the first day of each calendar month. Sign in to the Azure pricing calculator to see pricing based on your current program/offer with Microsoft. Contact an Azure sales specialist for more information on pricing or to request a price quote. See frequently asked questions about Azure pricing.

Bezpłatnie

Wystąpienie Kategoria Funkcje Cena
Bezpłatnie - Internet/kontener
Równoczesne żądania: 11
Zamiana mowy na tekst Standardowy2 Bezpłatne godziny audio na miesiąc: 5
Niestandardowe Bezpłatne godziny audio na miesiąc: 5
Hosting punktów końcowych: 1 bezpłatny model na miesiąc 3
Transkrypcja konwersacji — wielokanałowe audio WERSJA ZAPOZNAWCZA 4 Bezpłatne godziny audio na miesiąc: 5
Zamiana tekstu na mowę Neuronowa Bezpłatne znaki na miesiąc: 0.5 million
Tłumaczenie mowy Standardowa Bezpłatne godziny audio na miesiąc: 5
Rozpoznawanie osoby mówiącej Weryfikacja osoby mówiącej Bezpłatne transakcje miesięcznie: 10,000
Identyfikacja osoby mówiącej Bezpłatne transakcje miesięcznie: 10,000
Magazyn danych głosowych Bezpłatne transakcje miesięcznie: 10,000

Więcej szczegółowych informacji na temat limitów przydziałów i ograniczeń dla wszystkich warstw cenowych można znaleźć w dokumentacji.

1Aby zwiększyć liczbę współbieżnych żądań, zobacz instrukcje.

2Funkcja zamiany mowy na tekst będzie teraz obejmować ocenę wymowy zarówno dla wystąpienia w warstwie Bezpłatna (np. 5 bezpłatnych godzin audio miesięcznie), jak i dla wystąpienia w warstwie Standardowa, które będzie zgodne z cenami warstwy Standardowa ($1 za godzinę audio).

3Nieużywane modele zostaną automatycznie zlikwidowane po 7 dniach.

4Na potrzeby wielokanałowej transkrypcji konwersacji zaleca się używanie macierzy mikrofonowej typu Circular Microphone Array. Więcej informacji można znaleźć w dokumentacji zestawu Microsoft Speech Device SDK.

Płatność zgodnie z rzeczywistym użyciem

Wystąpienie Kategoria Funkcje Cena
Standardowa — internet/kontener
100 współbieżnych żądań dla modelu podstawowego
20 współbieżnych żądań dla modelu niestandardowego1
Zamiana mowy na tekst Standardowy2 $- za godzinę audio
Niestandardowe $- za godzinę audio
Hosting punktów końcowych: $- za model na godzinę
Transkrypcja konwersacji — wielokanałowe audio WERSJA ZAPOZNAWCZA 4 $- za godzinę audio 5
Zamiana tekstu na mowę Neuronowa $- za 1M znaki 6
Tworzenie długich materiałów dźwiękowych: $- za 1 mln znaków
Niestandardowe sieci neuronowe 7 Trenowanie: $- za godzinę obliczeniową, do $- za trenowanie
Synteza w czasie rzeczywistym: $- za 1 mln znaków
Hosting punktów końcowych: $- za model na godzinę
Tworzenie długich materiałów dźwiękowych: $- za 1 mln znaków
Tłumaczenie mowy Standardowa $- za godzinę audio
Rozpoznawanie osoby mówiącej Weryfikacja osoby mówiącej $- za 1,000 transakcji
Identyfikacja osoby mówiącej $- za 1,000 transakcji
Magazyn danych głosowych $- za następującą liczbę profili głosu: 1,000 (liczba bezpłatnych profili głosu miesięcznie: 10,000)

Więcej szczegółowych informacji na temat limitów przydziałów i ograniczeń dla wszystkich warstw cenowych można znaleźć w dokumentacji.

1Aby zwiększyć liczbę współbieżnych żądań, zobacz instrukcje.

2Funkcja zamiany mowy na tekst będzie teraz obejmować ocenę wymowy zarówno dla wystąpienia w warstwie Bezpłatna (np. 5 bezpłatnych godzin audio miesięcznie), jak i dla wystąpienia w warstwie Standardowa, które będzie zgodne z cenami warstwy Standardowa ($1 za godzinę audio).

3Nieużywane modele zostaną automatycznie zlikwidowane po 7 dniach.

4Na potrzeby wielokanałowej transkrypcji konwersacji zaleca się używanie macierzy mikrofonowej typu Circular Microphone Array. Więcej informacji można znaleźć w dokumentacji zestawu Microsoft Speech Device SDK.

5Są to ceny publicznej wersji zapoznawczej. Cena usługi ogólnie dostępnej zostanie podana później, po ogłoszeniu ogólnej dostępności.

6Regiony, w których jest dostępna Neuronowa zamiana tekstu na mowę, wymieniono w dokumentacji usługi neuronowej.

7Funkcja niestandardowego neuronowego modelu głosu jest funkcją z ograniczonym dostępem. Dowiedz się więcej na temat procesu ograniczonego dostępu. Sprawdź, gdzie jest dostępny niestandardowy neuronowy model głosu.

Warstwy zobowiązania

This pricing is limited access. Apply here.

Wystąpienie Kategoria Funkcje Cena (miesięcznie) Użycie nadwyżkowe
Azure — warstwa Standardowa Zamiana mowy na tekst Standardowy $- za 2,000 godz. $- za godzinę
$- za 10,000 godz. $- za godzinę
$- za 50,000 godz. $- za godzinę
Zamiana tekstu na mowę Neuronowa $- za 80 mln znaków $- na 1 mln znaków
$- za 400 mln znaków $- na 1 mln znaków
$- za 2,000 mln znaków $- na 1 mln znaków
Połączony kontener — warstwa Standardowa Zamiana mowy na tekst Standardowy $- za 2,000 godz. $- za godzinę
$- za 10,000 godz. $- za godzinę
$- za 50,000 godz. $- za godzinę
Zamiana tekstu na mowę Neuronowa $- za 80 mln znaków $- na 1 mln znaków
$- za 400 mln znaków $- na 1 mln znaków
$- za 2,000 mln znaków $- na 1 mln znaków
Disconnected container Zamiana mowy na tekst Standardowy Sign up to get access
Learn more

These features are being deprecated and only available for existing customers to use. Check details and learn how to migrate to new features.

Wystąpienie Kategoria Funkcje Cena
Bezpłatnie - Internet/kontener
Równoczesne żądania: 1
Zamiana tekstu na mowę Standardowy Bezpłatne znaki na miesiąc: 5 million
Niestandardowe Bezpłatne znaki na miesiąc: 5 million
Hosting punktów końcowych: 1 bezpłatny model na miesiąc
Standardowa — internet/kontener
100 współbieżnych żądań dla modelu podstawowego
20 współbieżnych żądań dla modelu niestandardowego
Zamiana tekstu na mowę Standardowy $- za 1 mln znaków
Niestandardowe $- za 1 mln znaków
Hosting punktów końcowych: $- za model na godzinę

Opcje cen i zakupu platformy Azure

Skontaktuj się z nami bezpośrednio

Zapoznaj się z przewodnikiem dotyczącym cen platformy Azure. Poznaj ceny rozwiązania w chmurze, dowiedz się więcej o optymalizacji kosztów i poproś o ofertę niestandardową.

Rozmowa ze specjalistą ds. sprzedaży

Zobacz sposoby zakupu

Kup usługi platformy Azure za pośrednictwem witryny internetowej platformy Azure, przedstawiciela firmy Microsoft lub partnera platformy Azure.

Poznaj swoje opcje

Dodatkowe zasoby

Szczegóły dotyczące Usługi mowy

Dowiedz się więcej o funkcjach i możliwościach produktu Usługi mowy.

Kalkulator cen

Oszacuj oczekiwane miesięczne koszty używania dowolnej kombinacji produktów platformy Azure.

Dokumentacja

Przejrzyj samouczki techniczne, materiały wideo i inne zasoby dotyczące produktu Usługi mowy.

    • Opcje Tłumaczenie mowy, Zamiana mowy na tekst i Zamiana mowy na tekst w modelu mowy niestandardowej: opłaty za użycie są naliczane z zastosowaniem jednosekundowych przyrostów.
    • W przypadku zamiany tekstu na mowę z neuronowym lub niestandardowym neuronowym modelem głosu: użycie jest rozliczane za znak. Sprawdź definicję znaku w uwagach cennika.
    • Opcja Hostowanie niestandardowego modelu mowy: opłaty za użycie są naliczane godzinowo. Opcja Hostowanie niestandardowej czcionki głosowej: opłaty za użycie są naliczane dziennie.
    • W przypadku poleceń niestandardowych: rozliczenia są śledzone jako użycie funkcji Zamiana mowy na tekst, Zamiana tekstu na mowę i Language Understanding. Polecenia niestandardowe nie wprowadzają nowych mierników rozliczeń.
    • Za trenowanie modeli mowy nie jest naliczana opłata. Jedyny koszt dotyczy hostowania modelu po wytrenowaniu, a następnie naliczane są opłaty za godzinę transkrypcji mowy.
  • Usługa mowy umożliwia użytkownikom adaptowanie modeli będących punktem odniesienia w oparciu o własne dane akustyczne i dotyczące języka, co prowadzi do opracowywania niestandardowych modeli mowy, których można używać względem opcji Zamiana mowy na tekst i Tłumaczenie mowy.

  • Model języka to rozkład prawdopodobieństwa dla sekwencji słów. Model języka pomaga systemowi wybierać między sekwencjami słów, które brzmią podobnie, na podstawie prawdopodobieństwa wystąpienia danych sekwencji. Na przykład sekwencje „rozpoznawanie mowy” i „ospo zna Wanię nowy” brzmią podobnie, ale pierwsza hipoteza jest znacznie bardziej prawdopodobna i dlatego model języka przypisze jej wyższą ocenę. Jeśli oczekujesz, że do aplikacji będą kierowane zapytania głosowe zawierające konkretne słownictwo, np. nazwy produktów lub żargon, które rzadko występują w typowej mowie, prawdopodobnie uzyskasz lepszą wydajność po dostosowaniu modelu języka. Jeśli na przykład tworzysz aplikację do głosowego przeszukiwania witryny MSDN, najprawdopodobniej terminy takie jak „obiektowe”, „przestrzeń nazw” lub „dot net” będą występować częściej niż w typowych aplikacjach głosowych. Dostosowanie modelu języka umożliwi systemowi nauczenie się tego.

  • Model akustyczny to klasyfikator oznaczający krótkie fragmenty audio jako jeden z kilku fonemów (jednostek dźwięku) w każdym języku. Te fonemy można następnie połączyć w celu utworzenia słów. Na przykład słowo „mowa” składa się z czterech fonemów: m, o, w, a. Te klasyfikacje są dokonywane z szybkością ok. 100 na sekundę. Dostosowanie modelu akustycznego może umożliwić systemowi naukę lepszego rozpoznawania mowy w nietypowych środowiskach. Na przykład w przypadku aplikacji zaprojektowanej do użycia przez pracowników magazynu lub fabryki dostosowany model akustyczny może dokładniej rozpoznawać mowę wśród hałasu typowego dla tych środowisk.

  • Usługa Mowa oferuje szeroką gamę czcionek głosowych zamiany tekstu na mowę (TTS), natomiast niestandardowy neuronowy model głosu umożliwia tworzenie własnego niestandardowego głosu, który pasuje do Twoich potrzeb i Twojej marki. Przeczytaj blog, aby uzyskać więcej informacji.

  • Istnieją scenariusze, w których osoby mówiące lub wiele osób mówiących może mówić w wielu językach za pośrednictwem tego samego pliku dźwiękowego lub prezentacji na żywo. Ciągłe wykrywanie języka umożliwia zidentyfikowanie zmiany w języku mówionym i dokładną transkrypcję mowy. Ta funkcja będzie bezpłatna w ramach prywatnej wersji zapoznawczej, a dostęp do niej będzie można uzyskać za pośrednictwem zestawu SDK usługi Mowa. Przejdź do dokumentacji, aby dowiedzieć się więcej.

Porozmawiaj ze specjalistą ds. sprzedaży, który przedstawi Ci cennik platformy Azure. Zapoznaj się z informacjami o cenach swojego rozwiązania w chmurze.

Uzyskaj bezpłatne usługi online i $200 środków na eksplorowanie platformy Azure przez 30 dni.

Dodano do oszacowania. Naciśnij klawisz „v”, aby wyświetlić w kalkulatorze