Funktionen för igenkänning av namngiven entitet för Textanalys i Cognitive Services är nu tillgänglig
Publiceringsdatum: 06 juni, 2019
Funktionen för igenkänning av namngiven entitet för Textanalys i Cognitive Services är nu tillgänglig
Vi är glada över att presentera allmän tillgänglighet för funktionen för igenkänning av namngivna entiteter med stöd för engelska och spanska som en del av API:et för Textanalys i Azure Cognitive Services. Med NER (named entity recognition) kan du ta frihandstext och identifiera förekomsten av olika enheter som personer, platser, organisationer med mera. Med ett enda API-anrop använder NER i Textanalys robusta maskininlärningsmodeller för att hitta och kategorisera över 20 typer av namngivna entiteter i ett textdokument.
Dessutom har vi släppt 19 nya språkmodeller i offentlig förhandsversion och därmed utökat NER-språktäckningen till 21 språk. Utöver engelska och spanska har vi nu en fullständig uppsättning typer som stöds för ytterligare tre språk i den offentliga förhandsversionen: franska, tyska och kinesiska (förenklad).
Följande typer och deras motsvarande språk stöds nu.
TYP |
UNDERTYP |
EXEMPEL |
Språk som stöds |
Person |
GÄLLER INTE* |
”Jeff”, ”Paul G. Allen” |
|
Plats |
GÄLLER INTE* |
”Redmond, Washington”, ”Paris” |
|
Organisation |
GÄLLER INTE* |
”Microsoft” |
|
Kvantitet |
Tal |
”6”, ”sex” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
Kvantitet |
Procent |
”50 %”, ”femtio procent” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
Kvantitet |
Ordningstal |
”2:a”, ”andra” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
Kvantitet |
NumberRange |
”4 till 8” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
Kvantitet |
Ålder |
”90 dagar gammal”, ”trettio år gammal” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
Kvantitet |
Valuta |
”10,99 USD” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
Kvantitet |
Dimension |
”10 miles”, ”40 cm” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
Kvantitet |
Temperatur |
”32 grader” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
DateTime |
GÄLLER INTE* |
”18.30 den 4 februari 2012” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
DateTime |
Datum |
”2 maj 2017”, ”2017-05-02” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
DateTime |
Tid |
”08.00”, ”08.00” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
DateTime |
DateRange |
”2 maj till 5 maj” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
DateTime |
TimeRange |
”18 till 19” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
DateTime |
Längd |
”1 minut och 45 sekunder” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
DateTime |
Ange |
”varje tisdag” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
DateTime |
Tidszon |
”UTC-7”, ”CST” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
URL |
GÄLLER INTE* |
”https://www.bing.com” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
E-post |
GÄLLER INTE* |
”support@microsoft.com” |
Engelska, spanska, tyska, franska, kinesiska (förenklad) |
*Beroende på indata och extraherade entiteter kan vissa entiteter ta bort undertypen.