Zurück zum Glossar

TF-IDF

TF-IDF (Term Frequency – Inverse Document Frequency) ist eine Methode zur Textanalyse, die misst, wie bedeutsam ein Begriff für ein bestimmtes Dokument im

TF-IDF (Term Frequency – Inverse Document Frequency) ist eine Methode zur Textanalyse, die misst, wie bedeutsam ein Begriff für ein bestimmtes Dokument im Vergleich zu anderen Dokumenten ist. Die Formel kombiniert zwei Größen: Wie oft ein Wort in einem Text vorkommt (Term Frequency) und wie selten es in anderen Dokumenten auftaucht (Inverse Document Frequency). Im SEO wird TF-IDF genutzt, um zu verstehen, welche Begriffe einen Text charakterisieren und wie relevant er für bestimmte Suchbegriffe ist.

Der Mechanismus funktioniert so: Ein Wort, das in vielen Dokumenten vorkommt (z.B. „und”, „der”), erhält einen niedrigen IDF-Wert und ist für die Differenzierung unwichtig. Ein Wort, das häufig im aktuellen Text vorkommt, aber selten in anderen (z.B. „maschinelles Lernen” bei einem AI-Artikel), erhält einen hohen TF-IDF-Wert und ist ein starker Indikator für das Thema. Google nutzt ähnliche Konzepte intern – BM25 ist eine moderne Variante dieses Ansatzes.

Für die SEO-Praxis bedeutet das: Bei der Content-Erstellung sollten relevante Fachbegriffe und Synonyme ausreichend häufig vorkommen, um dem Text Klarheit zu geben. Allerdings sollte man nicht zu simpel nach hohen TF-IDF-Werten optimieren – das führt zu unnatürlichem Textklingeln. Stattdessen hilft TF-IDF als diagnostisches Tool, um zu prüfen, ob wichtige Themenbegriffe angemessen vertreten sind. Mit SEO-Tools wie Surfer SEO oder Semrush lassen sich TF-IDF-Werte überwachen und mit Ranking-Seiten vergleichen.

Christian Synoradzki

Über den Autor

Christian Synoradzki

SEO-Freelancer

Mehr als 20 Jahre Erfahrung im digitalen Marketing. Fairer Stundensatz, keine Vertragsbindung, direkter Ansprechpartner.

Alle Begriffe finden Sie im SEO-Glossar.