Cognitive Services szövegelemzés: elérhető a Nevesített entitások felismerése

Közzétéve: 2019. június 6., csütörtök

Cognitive Services szövegelemzés: elérhető a Nevesített entitások felismerése

Örömmel jelenthetjük, hogy az Azure Cognitive Services Text Analytics API-jának részeként általánosan elérhető az angol és spanyol nyelvet támogató Nevesített entitások felismerése. A Nevesített entitások felismerése (NER) képessége, hogy szabad formátumú szövegben ismeri fel entitások, például személyek, helyek, vállalatok és hasonlók előfordulásait. A Text Analytics NER egyetlen API-hívással képes robusztus gépi tanulási modelleket segítségül hívva több mint 20 nevesített entitást megkeresni és kategorizálni bármilyen szöveges dokumentumban. 

A nyilvános előzetes verzióhoz 19 új nyelvi modellt is kiadtunk, ezzel összesen 21-re bővítve a NER által kezelt emberi nyelvek számát.  Az angol és a spanyol nyelven kívül további három nyelv támogatott típusainak teljes készletét engedélyeztük: francia, német és kínai (egyszerűsített).  

A következő típusok és a hozzájuk tartozó nyelvek bővültek támogatással. 

TÍPUS 

ALTÍPUS 

PÉLDA 

Támogatott nyelvek 

Személy 

N/A* 

„Jeff”, „Paul G. Allen” 

Földrajzi egység 

N/A* 

„Redmond, Washington”, „Paris” 

Szervezet 

N/A* 

„Microsoft” 

Mennyiség 

Szám 

„6”, „six” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Mennyiség 

Százalék 

„50%”, „fifty percent” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Mennyiség 

Sorszám 

„2nd”, „second” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Mennyiség 

Számtartomány 

„4 to 8” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Mennyiség 

Kor 

„90 days old”, „thirty years old” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Mennyiség 

Currency (Deviza) 

„$10.99” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Mennyiség 

Dimenzió 

„10 miles”, „40 cm” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Mennyiség 

Hőmérséklet 

„32 degrees” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Dátum és idő 

N/A* 

„6:30PM February 4, 2012” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Dátum és idő 

Dátum 

„May 2nd, 2017”, „05/02/2017” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Dátum és idő 

Idő 

„8AM”, „8:00” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Dátum és idő 

Dátumtartomány 

„May 2nd to May 5th” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Dátum és idő 

Időtartomány 

„6pm to 7pm” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Dátum és idő 

Időtartam 

„1 minute and 45 seconds” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Dátum és idő 

Beállítás 

„every Tuesday” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

Dátum és idő 

Időzóna 

„UTC-7”, „CST” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

URL-cím 

N/A* 

„http://www.bing.com” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

E-mail-cím 

N/A* 

„support@microsoft.com” 

Angol, spanyol, német, francia, kínai (egyszerűsített) 

*A bemenettől és a kinyert entitásoktól függően egyes entitások kihagyhatják az altípust. 

 

 

 

  • Text Analytics
  • Cognitive Services
  • Services