TF-IDF è l'acronimo di "Term Frequency"–"Inverse Document Frequency" (Frequenza del Termine - Inverso della Frequenza nei Documenti) ed è una funzione utilizzata nell'analisi del testo per misurare l'importanza di un termine rispetto ad un insieme di documenti. Tale funzione aumenta proporzionalmente al numero di volte che il termine è contenuto nel documento, ma cresce in maniera inversamente proporzionale con la frequenza del termine nella collezione di documenti. Viene spesso utilizzata come fattore di ponderazione nelle ricerche di recupero di informazioni o estrazione di testo.
