Analyse heuristique basée sur des expressions régulières

Glossaire Analyse heuristique

Analyse heuristique | Anti-relais | Botnet / Zombie | Bounce | Déni de service | DKIM | Faux-négatifs | Faux-positifs | Filtres bayésiens | FOVI - Arnaque au président | FQDN | Greylisting | Listes blanches | Listes noires / DNSBL | MTA / MDA | Opt-in | Opt-out | Phishing | Ransomware | Scam / Nigérian419 | SMTP | Spam | SPF | Teergrubing | Test de Turing | Virus

Analyse heuristique

Définition de ANALYSE HEURISTIQUE : L’analyse heuristique constitue un ensemble de règles représentées sous forme d’expressions régulières. Elle permet de rechercher les mails dont les entêtes et les corps correspondent à des caractéristiques très particulières connues pour avoir une forte probabilité d’être un spam. ALTOSPAM utilise une base de plus de 3000 règles pour identifier les spams aussi bien américains que français.

 

Exemples :
/\b(dollard?s?|(e|€)uros?|pound|USD|sterling)\b/
Dans l'exemple ci-dessus, on recherche la présence de mots-clés seuls spécifiant une monnaie, les pluriels sont prévus, ainsi que l'utilisation du symbole € à la place du 'e' de "euro".

Applications :
Dans le cas classique du "Viagra", il est beaucoup plus intéressant de détecter la présence du mot Viagra volontairement mal orthographié (par exemple: "V|agra"), plutôt que le terme réel qui peut très bien être utilisé dans une discussion courante entre pharmaciens.

Informations complémentaires :
- Article Wikipédia sur les expressions régulières
- Panorama des technologies antispams

Articles en rapport avec heuristique :
- Halte aux Spams : contexte, techniques et solutions
- Analyse détaillée des technologies anti-spams
- Le manifeste de la lutte anti spam