Trouver le spam dans un texte

    08 Nov 2008  

      Trouver le spam dans un texte

Ce code va trouver le spam en regardant si trop de voyelles ou de consonnes se suivent. Dans la langues francaises, à de rare exception pret il n'existe pas de mot avec 4 consonnes qui se suivent. Idem avec les voyelles. Par contre dans une phrase il y a souvent des expressions tel que "haaaaa !! bouuuuuu".
J'ai donc tenue compte de ce problème et j'ai ajouté un tableau pour les exceptions.

A savoir:
Le nombre de caractere des exceptions dépend du nombre de lette maximum.
Si vous mettez le nombre de lettes max à 3
alors mettez des mots (chaine de caratères) de 3 lettres dans le tableau des exceptions.
Fabrice Piget 08 Nov 2008
# Catégorie Compatibilité Nombre de vues Site Archive
   Securite PHP 4, PHP 5, PHP 7 5 211  

       Code Source PHP


 
 01    
 02    
 03    
 04    
 05    
 06    
 07    
 08    
 09    
 10    
 11    
 12    
 13    
 14    
 15    
 16    
 17    
 18    
 19    
 20    
 21    
 22    
 23    
 24    
 25    
 26    
 27    
 28    
 29    
 30    
 31    
 32    
 33    
 34    
 35    
 36    
 37    
 38    
 39    
 40    
 41    
 42    
 43    
 44    
 45    
 46    
 47    
 48    
 49    
 50    
 51    
 52    
 53    
 54    
 55    
 56    
 57    
 58    
 59    
 60    
 61    
 62    
 63    
 64    
                               
<?php
/**************************************************************************************/
/*
     Titre  : Trouver le spam dans un texte                                                                               
                                                                                                                          
     URL    :  
     https://phpsources.net/code/php/securite/465_trouver-le-spam-dans-un-texte
     Auteur         : Fabrice Piget                                                                                       
     Date edition   : 08 Nov 2008                                                                                         
*/
/**************************************************************************************/
    $nombres_de_lettes_max 4;
    // les consonnes
    $consonnes = array("b","c","d","f","g","h","j","k","m","n",
                       "p","q","r","s","t","v","w","x","z");
    // les voyelles
    $voyelles  = array("a","e","i","o","u","y");
    // les exceptions en 4 lettres (comme le $nombres_de_lettes_max)
    $exceptions = array("http","aaaa","uuuu");
    // votre texte
    $texte "hello worrrrrdddd come to seeeee myyyy webtrhdtgrbvx
              aaaaaat  http://www.helloword.com siiiiite";
    // variables
    $i=0$v=0$c=0$stock_consonne='';$stock_voyelle='';
    while ($i<=strlen($texte)) {
    // on sauvegarde le contenu de last_var pour refaire une comparaison
    $last_var_sub $last_var;
    // on gere les consonnes
    if (in_array($texte[$i],$consonnes))
        {$stock_consonne .= $texte[$i]; $i++;$c++;$last_var='consonne';}
    // on gere les voyelles
    elseif (in_array($texte[$i],$voyelles))
            {$stock_voyelle .= $texte[$i]; $i++; $v++; $last_var='voyelles';}
    // si c'est un caratere autre on met tout a zero
    else{$v=0;$c=0;$i++;$stock_consonne=''$stock_voyelle='';}
    // test sur les egalités
    if ($c==$nombres_de_lettes_max) {
                                    if (!in_array($stock_consonne,$exceptions))
                                    echo 'spam consonne -> '.$stock_consonne.
'<br />';
                                    $v=0;$c=0;$stock_consonne='';
                                         }
    if ($v==$nombres_de_lettes_max) {
                                    if (!in_array($stock_voyelle,$exceptions))
                                    echo 'spam voyelle -> '.$stock_voyelle.
'<br />';
                                    $v=0;$c=0;$stock_voyelle='';
                                          }
    // si la lettre est differente on reinitialise
    if ($last_var_sub != $last_var)
    {$v=0;$c=0$stock_consonne=''$stock_voyelle='';}
    }
/*
Affiche:
spam consonne -> rrrr
spam consonne -> dddd
spam voyelle -> eeee
spam consonne -> trhd
spam consonne -> tgrb
spam voyelle -> iiii
*/
?>

...  Manuel PHP - Fonctions du code source

   php.net  Description Versions PHP OUTIL
   array Crée un tableau PHP 4, PHP 5, PHP 7
   echo Affiche une chaîne de caractères PHP 4, PHP 5, PHP 7
   in_array Indique si une valeur appartient à un tableau PHP 4, PHP 5, PHP 7
   strlen Calcule la taille d'une chaîne PHP 4, PHP 5, PHP 7


  • L'ajout de commentaire est libre et ne demande pas d'inscription,
  •   invité

nous vous encourageons à contribuer à l'utilisation de PHP en ajoutant vos remarques.