Cognitive Services szövegelemzés: elérhető a Nevesített entitások felismerése
Közzététel dátuma: június 06, 2019
Cognitive Services szövegelemzés: elérhető a Nevesített entitások felismerése
Örömmel jelenthetjük, hogy az Azure Cognitive Services Text Analytics API-jának részeként általánosan elérhető az angol és spanyol nyelvet támogató Nevesített entitások felismerése. A Nevesített entitások felismerése (NER) képessége, hogy szabad formátumú szövegben ismeri fel entitások, például személyek, helyek, vállalatok és hasonlók előfordulásait. A Text Analytics NER egyetlen API-hívással képes robusztus gépi tanulási modelleket segítségül hívva több mint 20 nevesített entitást megkeresni és kategorizálni bármilyen szöveges dokumentumban.
A nyilvános előzetes verzióhoz 19 új nyelvi modellt is kiadtunk, ezzel összesen 21-re bővítve a NER által kezelt emberi nyelvek számát. Az angol és a spanyol nyelven kívül további három nyelv támogatott típusainak teljes készletét engedélyeztük: francia, német és kínai (egyszerűsített).
A következő típusok és a hozzájuk tartozó nyelvek bővültek támogatással.
TÍPUS |
ALTÍPUS |
PÉLDA |
Támogatott nyelvek |
Személy |
N/A* |
„Jeff”, „Paul G. Allen” |
|
Földrajzi egység |
N/A* |
„Redmond, Washington”, „Paris” |
|
Szervezet |
N/A* |
„Microsoft” |
|
Mennyiség |
Szám |
„6”, „six” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Mennyiség |
Százalék |
„50%”, „fifty percent” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Mennyiség |
Sorszám |
„2nd”, „second” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Mennyiség |
Számtartomány |
„4 to 8” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Mennyiség |
Kor |
„90 days old”, „thirty years old” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Mennyiség |
Currency (Deviza) |
„$10.99” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Mennyiség |
Dimenzió |
„10 miles”, „40 cm” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Mennyiség |
Hőmérséklet |
„32 degrees” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Dátum és idő |
N/A* |
„6:30PM February 4, 2012” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Dátum és idő |
Dátum |
„May 2nd, 2017”, „05/02/2017” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Dátum és idő |
Idő |
„8AM”, „8:00” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Dátum és idő |
Dátumtartomány |
„May 2nd to May 5th” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Dátum és idő |
Időtartomány |
„6pm to 7pm” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Dátum és idő |
Időtartam |
„1 minute and 45 seconds” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Dátum és idő |
Beállítás |
„every Tuesday” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
Dátum és idő |
Időzóna |
„UTC-7”, „CST” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
URL-cím |
N/A* |
„https://www.bing.com” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
E-mail-cím |
N/A* |
„support@microsoft.com” |
Angol, spanyol, német, francia, kínai (egyszerűsített) |
*A bemenettől és a kinyert entitásoktól függően egyes entitások kihagyhatják az altípust.