Quando si parla di NER, ovvero di Named Entity Recognition, ci si riferisce a una tecnica di Natural Language Processing (NLP) finalizzata all’estrazione di informazione semantica da testi non strutturati. In altri termini, il NER è uno dei pilastri dell’Information Extraction, cioè di quel processo articolato che consente la classificazione e l’estrazione di informazioni di valore per l’azienda da documenti e testi.

Il valore del NER è indubbio, poiché non bisogna dimenticare che la maggior parte delle sorgenti testuali che fanno parte dei processi aziendali non seguono alcuna regola vincolante: a titolo d’esempio, il marketing di un’azienda può voler estrarre informazioni dai testi dei social network al fine di valutare (con un’attività di scoring) il sentiment dei propri clienti, mentre una clinica può essere interessata a valutare l’appropriatezza prescrittiva dei suoi medici classificando i dati dei referti. Le ipotesi possono essere innumerevoli, ciò che le accomuna è il fatto che le sorgenti non siano strutturate e quindi non possano essere usate in forma diretta per attività di identificazione, ricerca e analisi approfondita a supporto dei processi decisionali.

 

Come funziona il NER e il valore di Explora Text

All’interno del macrocosmo dell’NLP, il NER è un pilastro dell’estrazione automatica di conoscenza ed evita all’azienda di dover ricorrere a un’attività di tipo manuale: se infatti per le persone è semplice classificare in “entità” il contenuto di testi non strutturati, in moltissime circostanze l’automazione è l’unica strada percorribile per mantenere tale attività economicamente sostenibile.

Con la tecnica di Named Entity Recognition viene effettuata un’individuazione automatica delle entità presenti all’interno del testo, partendo ovviamente da una KB (Knowledge Base) che può essere generica oppure specialistica, ovvero basata sui cosiddetti dizionari di dominio. Alcune entità comunemente classificate con questa tecnica sono: nomi personali, luoghi, organizzazioni, competenze professionali e date. Non si commetta però l’errore di pensare a un semplice riconoscimento di keyword presenti nel testo: le grandi potenzialità del NER (motivo per cui fa parte dell’ambito NLP) sono la capacità di districarsi tra complesse caratteristiche sintattiche e lessicali del linguaggio naturale e di tenere conto del contesto al fine di classificare in modo accurato il testo e permetterne così ricerca e ulteriori analisi. Il tutto, rigorosamente sorretto da tecniche di apprendimento automatico finalizzate a migliorare costantemente le performance dell’intero sistema.

Da anni, Integris si occupa di Information Extraction mediante tecniche NER e mette a disposizione delle aziende soluzioni innovative che, grazie all’estrazione di conoscenza da dati testuali non strutturati, permettono di sviluppare strategie di business efficaci e processi decisionali più rapidi e snelli. L'utilizzo del proprio framework Explora Text consente ad Integris di ridurre i tempi di realizzazione di soluzioni personalizzate in risposta alle specifiche esigenze del cliente, al fine di - a seconda dei casi concreti - monitorare il sentiment delle conversazioni, valutare la brand reputation, l’efficacia delle strategie di marketing e classificare le informazioni non strutturate presenti nei documenti interni all’azienda. In questo modo è possibile ottenere informazioni di valore con cui rendere l’azienda più efficiente, ma anche efficace nei confronti delle richieste del mercato e aperta verso nuove opportunità di business.

 

Alcuni ambiti di applicazione del NER

Come anticipato, il NER fa parte del macrocosmo NLP e quindi può essere impiegata in tutte quelle fattispecie che richiedono una interpretazione e classificazione di informazioni espresse in linguaggio naturale. A titolo d’esempio, il NER può essere utile per la classificazione automatica dei ticket del Customer Service, da cui lo smistamento rapido verso l’operatore più indicato, ma anche – come riportato in apertura – per la valutazione dell’appropriatezza prescrittiva del personale medico a partire da referti scritti il linguaggio naturale, oppure ancora per valutare il sentiment dei clienti in relazione a un prodotto, eventualmente comparandolo con quello dei competitor. In ambito HR, la capacità di estrarre conoscenza dai curricula – che quasi mai rispettano uno standard predefinito – permette di accelerare moltissimo le prime operazioni di selezione, mentre la classificazione automatica di svariati tipi di documento (come le note integrative dei bilanci) consente alle aziende di trovare rapidamente informazioni di valore e, tramite tecniche avanzate di analisi, di migliorare i risultati di business.

Infografica - estrarre valore dai dati