NER to technika przypisywania podmiotom odpowiednich etykiet. Przykładowo „Konrad” będzie mogło mieć etykietę „imię”, a „50 zł” będzie odpowiadało etykiecie „gotówka”. Inne często stosowane etykiety to:
– organizacje (Facebook, Google…)
– lokalizacje (Warszawa, Lublin, Londyn…)
– wartości liczbowe (1,2,3,4…)
– wartości procentowe (10%, 34%…)
Przykładowa wizualizacja możliwości biblioteki spaCy
import spacy
nlp = spacy.load('pl_core_news_lg')
dokument = nlp(u"Janek poszedł odebrać paczkę z Paczkomatu, ponieważ dostał wiadomość z Allegro, że paczka jest gotowa do odbioru")
from spacy import displacy
displacy.render(dokument, style='ent', jupyter=True)
