Exercices Projets guidés Calcul TF (Term Frequency)
🎉

Bravo!

Intermédiaire 🧠 Fondamentaux 20 XP 0 personnes ont réussi

Calcul TF (Term Frequency)

Quatrieme étape : mesurer l'importance d'un mot dans un document avec le TF (Term Frequency).

Le TF, c'est simplement le nombre de fois qu'un mot apparait dans un document, divise par le nombre total de mots du document. Ca normalise la frequence : un mot qui apparait 5 fois dans un document de 10 mots est plus important qu'un mot qui apparait 5 fois dans un document de 1000 mots.

Formule : TF(mot, document) = occurrences du mot / nombre total de mots

Exemple :
calculer_tf('python python est simple')
renvoie {'python': 0.5, 'est': 0.25, 'simple': 0.25}
(python apparait 2 fois sur 4 mots = 0.5)

Écris une fonction calculer_tf(document) qui retourne un dictionnaire {mot: tf}.

Tests (2/4)

TF simple
tf = calculer_tf('python python est simple')
assert abs(tf['python'] - 0.5) < 0.01
Somme = 1
tf = calculer_tf('python est simple')
assert abs(sum(tf.values()) - 1.0) < 0.01

+ 0 tests cachés

Indices (3 disponibles)

solution.py