Rozpoznawanie jednostek znaku w analizie tekstu usług Cognitive Services jest teraz dostępne
Data opublikowania: 06 czerwca, 2019
Rozpoznawanie jednostek znaku w analizie tekstu usług Cognitive Services jest teraz dostępne
Z radością ogłaszamy ogólną dostępność funkcji rozpoznawania jednostek znaku obsługującej języki angielski i hiszpański będącej częścią interfejsu API analizy tekstu usług Azure Cognitive Services. Funkcja rozpoznawania jednostek znaku (NER) umożliwia identyfikację wystąpień jednostek, takich jak osoby, miejsca i organizacje, w dowolnym tekście. Za pośrednictwem prostego wywołania interfejsu API funkcja rozpoznawania jednostek znaku w analizie tekstu korzysta z modeli uczenia maszynowego w celu znalezienia i skategoryzowania ponad dwudziestu typów jednostek znaku w dowolnym dokumencie tekstowym.
Udostępniliśmy też 19 nowych modeli języków w publicznej wersji zapoznawczej. Tym samym liczba języków obsługiwanych przez funkcję NER wzrosła do 21. Poza obsługą języków angielskiego i hiszpańskiego, w publicznej wersji zapoznawczej włączyliśmy pełny zestaw obsługiwanych typów dla 3 dodatkowych języków: francuskiego, niemieckiego i chińskiego uproszczonego.
Teraz obsługiwane są następujące typy i odpowiadające im języki.
TYP |
PODTYP |
PRZYKŁAD |
Obsługiwane języki |
Osoba |
Nie dotyczy* |
„Jeff”, „Paul G. Allen” |
|
Lokalizacja |
Nie dotyczy* |
„Redmond, Washington”, „Paris” |
|
Organizacja |
Nie dotyczy* |
„Microsoft” |
|
Ilość |
Liczba |
„6”, „six” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Ilość |
Wartość procentowa |
„50%”, „fifty percent” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Ilość |
Liczba porządkowa |
„2nd”, „second” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Ilość |
Zakres liczb |
„4 to 8” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Ilość |
Wiek |
„90 days old”, „thirty years old” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Ilość |
Waluta |
„$10,99” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Ilość |
Wymiar |
„10 miles”, „40 cm” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Ilość |
Temperatura |
„32 degrees” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Data i godzina |
Nie dotyczy* |
„6:30PM February 4, 2012” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Data i godzina |
Data |
„May 2nd, 2017”, „05/02/2017” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Data i godzina |
Czas |
„8AM”, „8:00” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Data i godzina |
Zakres dat |
„May 2nd to May 5th” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Data i godzina |
Zakres czasu |
„6pm to 7pm” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Data i godzina |
Czas trwania |
„1 minute and 45 seconds” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Data i godzina |
Zestaw |
„every Tuesday” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Data i godzina |
Strefa czasowa |
„UTC-7”, „CST” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Adres URL |
Nie dotyczy* |
„https://www.bing.com” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
Adres e-mail |
Nie dotyczy* |
„support@microsoft.com” |
angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) |
*W zależności od danych wejściowych i wyodrębnionych jednostek w przypadku niektórych jednostek podtyp może być pomijany.