Named Entity Recognition i Cognitive Services Tekstanalyse er nu tilgængelig
Dato for publicering: 06 juni, 2019
Named Entity Recognition i Cognitive Services Tekstanalyse er nu tilgængelig
Vi er glade for at kunne meddele, at Named Entity Recognition nu er generelt tilgængelig og understøtter sprogene engelsk og spansk som en del af Azure Cognitive Services Tekstanalyse-API'en. NER (Named Entity Recognition) er muligheden for at tage en tekst i fri form og identificere forekomsten af enheder som personer, steder, organisationer med mere. Med et enkelt API-kald bruger NER robuste modeller til maskinel indlæring i Tekstanalyse til at finde og kategorisere mere end tyve typer af navngivne objekter i et vilkårligt tekstdokument.
Vi har også udgivet 19 nye sprogmodeller som offentlig prøveversion, hvilket udvider vores dækning af talte sprog i NER til 21 sprog. Udover engelsk og spansk har vi muliggjort et komplet sæt af understøttede typer til yderligere tre sprog i offentlig prøveversion, dvs. fransk, tysk og forenklet kinesisk.
Følgende typer og deres tilsvarende sprog understøttes nu.
TYPE |
UNDERTYPE |
EKSEMPEL |
Understøttede sprog |
Person |
I/T* |
"Jens", "Paul G. Andersen" |
|
Placering |
I/T* |
"Redmond, Washington", "Paris" |
|
Organisation |
I/T* |
"Microsoft" |
|
Antal |
Tal |
"6", "seks" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antal |
Procent |
"50 %", "halvtres procent" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antal |
Ordenstal |
"2.", "anden" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antal |
Nummerinterval |
"4 til 8" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antal |
Alder |
"90 dage gammel", "tredive år gammel" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antal |
Valuta |
"10,99 USD" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antal |
Dimension |
"10 kilometer", "40 cm" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
Antal |
Temperatur |
"32 grader" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DatoKlokkeslæt |
I/T* |
"Kl. 18:30 4. februar 2012" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DatoKlokkeslæt |
Dato |
"2. maj 2017", "02/05/2017" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DatoKlokkeslæt |
Tid |
"Kl. 08", "08:00" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DatoKlokkeslæt |
Datointerval |
"2. maj til 5. maj" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DatoKlokkeslæt |
Tidsinterval |
"Kl. 18 til kl. 19" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DatoKlokkeslæt |
Varighed |
"1 minut og 45 sekunder" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DatoKlokkeslæt |
Angivelse |
"hver tirsdag" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
DatoKlokkeslæt |
Tidszone |
"UTC-7", "CST" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
URL-adresse |
I/T* |
"https://www.bing.com" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
|
I/T* |
"support@microsoft.com" |
Engelsk, spansk, tysk, fransk, kinesisk (forenklet) |
* Visse objekttyper kan undlade undertypen afhængigt af inputtet og de udtrukne objekter.