Detekce jmenných entit

Named Entity Recognition (nER)

Náš software dokáže identifikovat jména osob, firem, organizací, měst, datumy, časy, sumy, měny a další typy entit v textech. Využívá sofistikované statistiké algoritmy, strojové učení a technologii zpracování přirozeného jazyka. Umožní vám analyzovat vaše data a extrahovat z nich sémantické vazby. Detekce entit je dostupná jako služba skrze API, nebo může být provozována nezávisle, na vlastním hardware zákazníka.

Typy entit

Množství a typy entit, které dokážeme detekovat jsou v podstatě neomezené. Pro ilustraci jsme vybrali několik možností:

big_img_1 img_shadow

Jméno, Příjmení, Datum narození, Název firmy, IČO, DIČ, Adresa, Telefon, Emailová adresa, Pracovní pozice, Státní instituce, Úřad, Číslo smlouvy, Číslo účtu, Banka, Citace zákona, vyhlášky, Citace soudního rozhodnutí, Soud, Soudce, Advokát

Technologie detekce entit je založena na strojovém učení a statistických modelech. Pro jejich vytvoření jsou potřebná trénovací data. Jsou to vzorky textů, ve kterých jsou již dopředu vyznačeny požadované entity. Data slouží algoritmům strojového učení jako učebnice. Na základě nich se spočítají statistické modely, které pak mohou být aplikovány na nové texty...

V Kamadu Ateliéru máme zkušenosti nejen se strojovým učením ale také s přípravou trénovacích dat. Bude nám potěšením vytvořit pro vás detektory entit šité na míru vašim potřebám a datům.

Jazyková podpora

Technologie našeho ateliéru pro detekci entit je jazykově nezávislá a může být aplikována na libovolný jazyk. Podobně, jako při přidávaní nového druhu detekovaných entit, nový jazyk je taky podmíněn existencí trénovacích dat v novém jazyce.

Technické detaily

Řešení detekce entit (nER) můžeme implementovat ve spolupráci s vašim IT oddělením, dodat jako software vaší společnosti, nebo provozovat jako službu na našich serverech. Zaručujeme, že se vaše citlivá data nedostanou do nepovolaných rukou.