Tekstanalyse – Gjenkjenning av tegnenhet fra Cognitive Services er nå tilgjengelig
Publiseringsdato: 06 juni, 2019
Tekstanalyse – Gjenkjenning av tegnenhet fra Cognitive Services er nå tilgjengelig
Vi er glade for å kunngjøre at støtte for engelsk og spansk i Gjenkjenning av tegnenhet som en del av API-et Tekstanalyse for Cognitive Services nå er tilgjengelig. Gjenkjenning av tegnenhet (NER) er evnen til å ta friformstekst og identifisere forekomsten av oppføringer som personer, steder, organisasjoner og mer. Med et enkelt API-kall bruker NER i Tekstanalyse robuste maskinlæringsmodeller til å finne og kategorisere mer enn 20 typer tegnenheter i et tekstelement.
Vi har også lansert 19 nye språkmodeller for offentlig forhåndsversjon, og vi utvider derved NER-språkdekningen til 21. I tillegg til engelsk og spansk har vi gjort tilgjengelig det fullstendige settet med støttede typer for tre tilleggsspråk i offentlig forhåndsversjon: fransk, tysk og kinesisk (forenklet).
De følgende typene og de tilsvarende språkene støttes nå.
TYPE |
UNDERTYPE |
EKSEMPEL |
Språk som støttes |
Person |
I/T* |
«Jeff», «Paul G. Allen» |
|
Plassering |
I/T* |
«Redmond, Washington», «Paris» |
|
Organisasjon |
I/T* |
«Microsoft» |
|
Antall |
Tall |
«6», «seks» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antall |
Prosentdel |
«50 %», «femti prosent» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antall |
Ordenstall |
«andre» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antall |
NumberRange |
«4 til 8» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antall |
Alder |
«90 dager gammel», «tretti år gammel» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antall |
Valuta |
«$ 10,99» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antall |
Mål |
«10 mil», «40 cm» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antall |
Temperatur |
«32 grader» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DateTime |
I/T* |
«18:30 04. februar 2012» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DateTime |
Dato |
«02. mai 2017», «02.05.2017» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DateTime |
Tid |
«08:00» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DateTime |
DateRange |
«02.–05. mai» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DateTime |
TimeRange |
«18:00 til 19:00» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DateTime |
Varighet |
«1 minutt og 45 sekunder» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DateTime |
Angi |
«hver tirsdag» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DateTime |
TimeZone |
«UTC-7», «CST» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
NETTADRESSE |
I/T* |
«https://www.bing.com» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
E-post |
I/T* |
«support@microsoft.com» |
engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
*Det kan hende at enkelte enheter utelater undertypen, avhengig av inndataene og utpakkede enheter.