Filtres Bayesiens ou méthode Bayésienne

Glossaire Filtres bayésiens

Analyse heuristique | Anti-relais | Botnet / Zombie | Bounce | Déni de service | DKIM | Faux-négatifs | Faux-positifs | Filtres bayésiens | FOVI - Arnaque au président | FQDN | Greylisting | Listes blanches | Listes noires / DNSBL | MTA / MDA | Opt-in | Opt-out | Phishing | Ransomware | Scam / Nigérian419 | SMTP | Spam | SPF | Teergrubing | Test de Turing | Virus

Filtres Bayesiens

Définition de FILTRES BAYESIENS : Méthode probabiliste de filtrage des courriers électroniques fonctionnant par apprentissage et se basant sur la distribution statistique de mots-clés dans les mails. Ce type d’algorithme utilise une base la plus hétérogène possible de spams et de hams (messages légitimes) afin d’être capable par la suite de reconnaître le type de message reçu.

 

Exemples :
Deux bases sont créées, une de spams et une de hams (messages légitimes). Par une phase d'apprentissage, un dictionnaire de mots-clés est créé dans lequel chaque terme est associé avec une probabilité. Par exemple : viagra 100%, sécurité 20%, messagerie 10% et gratuit 60%.Ensuite lors de l'analyse d'un email, si les mots du lexique existent, la somme des probabilités de chaque mot-clé retrouvé est affectée au mail. En suivant notre exemple, si un email contient les mots "sécurité serveur messagerie gratuit", le mail obtiendra une note de: (20% + 10% + 60%) / 3, soit : 30%. Il s'agit donc d'un message légitime puisque la note est inférieure à 50%. Avec un grand nombre de spams et de hams, cette technique permet d'obtenir des résultats d'analyse très intéressants.

Applications :
La plupart des clients de messagerie intégrant un antispam (Thunderbird, Outlook,...) utilisent quasi exclusivement les filtres bayésiens. Dans ALTOSPAM, les filtres bayésiens font partie des 15 technologies utilisées. Suivant la note obtenue (entre 0 et 100%), le mail sera classé plus probablement comme un spam ou un ham.

Informations complémentaires :
- Article Wikipédia sur les filtres bayésiens
- Article original de popularisation des méthodes Bayésiennes dans le filtrage antispam
- Panorama des technologies antispam

Articles en rapport avec bayesien :
- Halte aux Spams : contexte, techniques et solutions
- Comment un spam est détecté ?
- Analyse détaillée des technologies anti-spams
- Le manifeste de la lutte anti spam