NER – named entity recognition

NER to technika przypisywania podmiotom odpowiednich etykiet. Przykładowo „Konrad” będzie mogło mieć etykietę „imię”, a „50 zł” będzie odpowiadało etykiecie „gotówka”. Inne często stosowane etykiety to:
– organizacje (Facebook, Google…)
– lokalizacje (Warszawa, Lublin, Londyn…)
– wartości liczbowe (1,2,3,4…)
– wartości procentowe (10%, 34%…)

Przykładowa wizualizacja możliwości biblioteki spaCy

import spacy

nlp = spacy.load('pl_core_news_lg')

dokument = nlp(u"Janek poszedł odebrać paczkę z Paczkomatu, ponieważ dostał wiadomość z Allegro, że paczka jest gotowa do odbioru")

from spacy import displacy
displacy.render(dokument, style='ent', jupyter=True)

Pozostaw komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *