Rozpoznávání pojmenovaných entit v Analýze textu služeb Cognitive Services je teď k dispozici
Datum publikování: 06 června, 2019
Rozpoznávání pojmenovaných entit v Analýze textu služeb Cognitive Services je teď k dispozici
S radostí oznamujeme obecnou dostupnost rozpoznávání pojmenovaných entit s podporou angličtiny a španělštiny v rámci rozhraní API pro analýzu textu služeb Azure Cognitive Services. Rozpoznávání pojmenovaných entit je schopnost identifikovat ve volném textu výskyty entit, jako jsou lidé, místa, organizace a další. Rozpoznávání pojmenovaných entit v Analýze textu využívá robustní modely strojového učení k vyhledání a kategorizaci více než dvaceti typů pojmenovaných entit v jakémkoli textovém dokumentu a stačí k tomu jednoduché volání rozhraní API.
Také jsme vydali 19 nových jazykových modelů ve verzi Public Preview, čímž jsme rozšířili podporu rozpoznávání pojmenovaných entit celkem na 21 lidských jazyků. Kromě angličtiny a španělštiny jsme ve verzi Public Preview povolili kompletní sadu podporovaných typů pro další 3 jazyky – francouzštinu, němčinu a zjednodušenou čínštinu.
V současné době se podporují následující typy a odpovídající jazyky.
TYP |
PODTYP |
PŘÍKLAD |
Podporované jazyky |
Osoba |
–* |
"Jeff", "Paul G. Allen" |
|
Umístění |
–* |
"Redmond, Washington", "Paříž" |
|
Organizace |
–* |
"Microsoft" |
|
Množství |
Číslo |
"6", "šest" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Množství |
Procento |
"50 %", "padesát procent" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Množství |
Pořadí |
"2.", "druhý" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Množství |
Číselný rozsah |
"4 až 8" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Množství |
Věk |
"stáří: 90 dnů", "stáří: třicet let" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Množství |
Měna |
"10,99 USD" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Množství |
Dimenze |
"10 mil", "40 cm" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Množství |
Teplota |
"32 stupňů" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Datum a čas |
–* |
"4. února 2012 – 18:30" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Datum a čas |
Datum |
"2. května 2017", "2. 5. 2017" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Datum a čas |
Čas |
"8:00", "8:00" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Datum a čas |
Rozsah dat |
"2. května až 5. května" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Datum a čas |
Časový rozsah |
"18:00 až 19:00" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Datum a čas |
Délka |
"1 minuta a 45 sekund" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Datum a čas |
Sada |
"každé úterý" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Datum a čas |
Časové pásmo |
“UTC−7”, “CST” |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
Adresa URL |
–* |
"https://www.bing.com" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
|
–* |
"support@microsoft.com" |
Angličtina, španělština, němčina, francouzština, čínština (zjednodušená) |
* V závislosti na vstupních a extrahovaných entitách se v určitých entitách může podtyp vynechat.