TF.IDF (term frequency – inverse document frequency) je číselná statistika, která udává, jak důležité je slovo nebo fráze pro dokument v rámci souboru dokumentů.
Tf-idf, celý pojem term frequency–inverse document frequency, je metodika hodnocení relevance při vyhledávání textu. Jde o číselnou statistiku, která má odrážet důležitost slova pro dokument v datasetu nebo korpusu. Název je spojením zkratek dvou termínů: Term Frequency – četnost slova v dokumentu Inverse document frequency – převrácená četnost slova ve všech dokumentech Wikipedie
© 1996–2025 Seznam.cz, a.s.