L’estrazione delle informazioni (IE) è il compito di estrarre automaticamente informazioni strutturate da documenti non strutturati e/o semistrutturati leggibili meccanicamente. Nella maggior parte dei casi questa attività riguarda l’elaborazione di testi in linguaggio umano mediante l’elaborazione del linguaggio naturale (NLP).

Le attività recenti nell’elaborazione di documenti multimediali come l’annotazione automatica e l’estrazione di contenuti da immagini, audio, video, documenti potrebbero essere viste come estrazione di informazioni