Rozpoznawanie jednostek znaku w analizie tekstu usług Cognitive Services jest teraz dostępne

Opublikowano: czwartek, 6 czerwca 2019

Rozpoznawanie jednostek znaku w analizie tekstu usług Cognitive Services jest teraz dostępne

Z radością ogłaszamy ogólną dostępność funkcji rozpoznawania jednostek znaku obsługującej języki angielski i hiszpański będącej częścią interfejsu API analizy tekstu usług Azure Cognitive Services. Funkcja rozpoznawania jednostek znaku (NER) umożliwia identyfikację wystąpień jednostek, takich jak osoby, miejsca i organizacje, w dowolnym tekście. Za pośrednictwem prostego wywołania interfejsu API funkcja rozpoznawania jednostek znaku w analizie tekstu korzysta z modeli uczenia maszynowego w celu znalezienia i skategoryzowania ponad dwudziestu typów jednostek znaku w dowolnym dokumencie tekstowym. 

Udostępniliśmy też 19 nowych modeli języków w publicznej wersji zapoznawczej. Tym samym liczba języków obsługiwanych przez funkcję NER wzrosła do 21.  Poza obsługą języków angielskiego i hiszpańskiego, w publicznej wersji zapoznawczej włączyliśmy pełny zestaw obsługiwanych typów dla 3 dodatkowych języków: francuskiego, niemieckiego i chińskiego uproszczonego.  

Teraz obsługiwane są następujące typy i odpowiadające im języki. 

TYP 

PODTYP 

PRZYKŁAD 

Obsługiwane języki 

Osoba 

Nie dotyczy* 

„Jeff”, „Paul G. Allen” 

Lokalizacja 

Nie dotyczy* 

„Redmond, Washington”, „Paris” 

Organizacja 

Nie dotyczy* 

„Microsoft” 

Ilość 

Liczba 

„6”, „six” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Ilość 

Wartość procentowa 

„50%”, „fifty percent” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Ilość 

Liczba porządkowa 

„2nd”, „second” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Ilość 

Zakres liczb 

„4 to 8” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Ilość 

Wiek 

„90 days old”, „thirty years old” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Ilość 

Waluta 

„$10,99” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Ilość 

Wymiar 

„10 miles”, „40 cm” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Ilość 

Temperatura 

„32 degrees” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Data i godzina 

Nie dotyczy* 

„6:30PM February 4, 2012” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Data i godzina 

Data 

„May 2nd, 2017”, „05/02/2017” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Data i godzina 

Czas 

„8AM”, „8:00” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Data i godzina 

Zakres dat 

„May 2nd to May 5th” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Data i godzina 

Zakres czasu 

„6pm to 7pm” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Data i godzina 

Czas trwania 

„1 minute and 45 seconds” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Data i godzina 

Zestaw 

„every Tuesday” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Data i godzina 

Strefa czasowa 

„UTC-7”, „CST” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Adres URL 

Nie dotyczy* 

„http://www.bing.com” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

Adres e-mail 

Nie dotyczy* 

„support@microsoft.com” 

angielski, hiszpański, niemiecki, francuski, chiński (uproszczony) 

*W zależności od danych wejściowych i wyodrębnionych jednostek w przypadku niektórych jednostek podtyp może być pomijany. 

 

 

 

  • Analiza tekstu
  • Cognitive Services
  • Services