Lenetsurfer.fr Clustering, cartographie des thématiques

Écrit par Brandon Gauttier. Publié dans Analyse automatisée d'articles de presse

Les articles traités par Lenetsurfer.fr Clustering sont automatiquement classés en groupes thématiques. Pour favoriser une vision synthétique et claire du contenu de ces articles, Lenetsurfer.fr Viewer représente chaque groupe thématique par un de ses termes appelé terme-attracteur.
Les termes attracteurs sont automatiquement placés sur une carte appelée carte-index. Leur position est le reflet d'un classement hiérarchisé : plus un groupe est placé en haut de la carte-index, plus la thématique qu'il représente est homogène, structurée et précise, comme par exemple PHARMACIE CENTRALE DES HOPITAUX. A l'inverse, plus un groupe est placé en bas de la carte, plus la thématique qu'il représente est vague et peu homogène.

Exemple :
En cliquant sur le terme-attracteur "PHARMACIE CENTRALE DES HOPITAUX", vous avez le détail de la thématique sous forme d'un graphe-lexical centré sur le terme-attracteur. Les autres termes de ce graphe-lexical sont appelés termes-satellites.


Un segment reliant deux termes du graphe-lexical est appelé lien interne. Plus il est épais, plus le couple de mots reliés conccurrent fréquemment dans les articles analysés. Plus le nombre d'interconnexions est grand, plus le concept représenté par ce graphe-lexical est homogène et précis. De fait, dans cet exemple, on peut dire sans avoir lu tous les articles de cette période, que le scandale des hormones de croissance représenté par le groupe "Pharmacie centrale des hôpitaux", a occupé le devant de l'actualité aux débuts de l'année 1997.