Trouve le spam dans un texte

  Information

Ce code va trouver le spam en regardant si trop de voyelles ou de consonnes se suivent.

Dans la langues françaises, à de rare exception prêt il n'existe pas de mot avec 4 consonnes qui se suivent. Idem avec les voyelles. Par contre dans une phrase il y a souvent des expressions tel que "haaaaa !! bouuuuuu".
J'ai donc tenue compte de ce problème et j'ai ajouté un tableau pour les exceptions.

A savoir:
Le nombre de caractère des exceptions dépend du nombre de lettre maximum.
Si vous mettez le nombre de lettres max à 3
alors mettez des mots (chaine de caractères) de 3 lettres dans le tableau des exceptions.

  code source classé dans  Sécurité

 
 01    
 02    
 03    
 04    
 05    
 06    
 07    
 08    
 09    
 10    
 11    
 12    
 13    
 14    
 15    
 16    
 17    
 18    
 19    
 20    
 21    
 22    
 23    
 24    
 25    
 26    
 27    
 28    
 29    
 30    
 31    
 32    
 33    
 34    
 35    
 36    
 37    
 38    
 39    
 40    
 41    
 42    
 43    
 44    
 45    
 46    
 47    
 48    
 49    
 50    
 51    
 52    
 53    
 54    
 55    
 56    
 57    
 58    
 59    
 60    
 61    
                               
/*---------------------------------------------------------------*/
/*
Titre : Trouve le spam dans un texte

URL : https://phpsources.net/code_s.php?id=465
Date édition : 08 Nov 2008
Date mise a jour : 29 Aout 2019

Rapport de la maj:
- fonctionnement du code vérifié
*/
/*---------------------------------------------------------------*/

function checkchaine ($texte, $nombres_de_lettes_max) {

// les consonnes
$consonnes = array("b","c","d","f","g","h","j","k","m","n",
"p","q","r","s","t","v","w","x","z");
// les voyelles
$voyelles = array("a","e","i","o","u","y");
// les exceptions en 4 lettres (comme le $nombres_de_lettes_max)
$exceptions = array("http","aaaa","uuuu");



// variables
$i=0; $v=0; $c=0; $stock_consonne='';$stock_voyelle='';

$last_var = '';
while ($i<=strlen($texte)) {
// on sauvegarde le contenu de last_var pour refaire une comparaison
$last_var_sub = $last_var;
// on gere les consonnes
if (in_array($texte[$i],$consonnes))
{$stock_consonne .= $texte[$i]; $i++;$c++;$last_var='consonne';}
// on gere les voyelles
elseif (in_array($texte[$i],$voyelles))
{$stock_voyelle .= $texte[$i]; $i++; $v++; $last_var='voyelles';}
// si c'est un caratere autre on met tout a zero
else{$v=0;$c=0;$i++;$stock_consonne=''; $stock_voyelle='';}
// test sur les egalités
if ($c==$nombres_de_lettes_max) {
if (!in_array($stock_consonne,$exceptions))
$tab[] = 'spam consonne -> '.$stock_consonne
.
'<br />';
$v=0;$c=0;$stock_consonne='';
}
if ($v==$nombres_de_lettes_max) {
if (!in_array($stock_voyelle,$exceptions))
$tab[] = 'spam voyelle -> '.$stock_voyelle.
'<br />';
$v=0;$c=0;$stock_voyelle='';
}
// si la lettre est differente on reinitialise
if ($last_var_sub != $last_var)
{$v=0;$c=0; $stock_consonne=''; $stock_voyelle='';}
}
return $tab;
}
?>

Exemple :

 
 01    
 02    
 03    
 04    
 05    
 06    
 07    
 08    
 09    
 10    
 11    
 12    
 13    
 14    
 15    
 16    
 17    
 18    
 19    
 20    
 21    
 22    
 23    
                                

// votre texte
$texte = "hello worrrrrdddd come to seeeee myyyy webtrhdtgrbvx
aaaaaat http://www.helloword.com siiiiite";
// nombre de voyelles ou consonnes consécutive autorisés
$nombres_de_lettes_max = 4;

// Appel la fonction
$out = checkchaine($texte,$nombres_de_lettes_max );

// On imprime
print_r($out);
/*
Affiche:
Array ( [0] => spam consonne -> rrrr
[1] => spam consonne -> dddd
[2] => spam voyelle -> eeee
[3] => spam consonne -> trhd
[4] => spam consonne -> tgrb
[5] => spam voyelle -> iiii
)
*/
?>

      Fonctions du code - Doc officielle PHP

Détail    php.net  
Description
Versions PHP
   array
Crée un tableau
PHP 4, 5, 7 et 8
   in_array
Indique si une valeur appartient à un tableau
PHP 4, 5, 7 et 8
   print_r
Affiche des informations lisibles pour une variable
PHP 4, 5, 7 et 8
   return
Retourne le controle du programme au module appelant.
PHP 4, 5, 7 et 8
   strlen
Calcule la taille d'une chaîne
PHP 4, 5, 7 et 8

   Dites merci aux auteurs pour leurs travail, ça ne coûte rien et ça fait toujours plaisir wink

 Autres snippets qui pourraient vous intéressez

Trouve la langue d'un texte

Compatibilité : PHP 5, PHP 7, PHP 8

Cette fonction trouve la langue d'un texte (compris la ponctuation), parmi 10 langues européennes : Français, anglais, danois...

Cherche et trouve les mots trop long d'1 texte

Compatibilité : PHP 5, PHP 7, PHP 8

Si dans votre texte il existe un mot qui dépasse une longueur que vous définissez, la fonction retourne FALSE.

Filtrer les messages d'insultes dans 1 chaine

Compatibilité : PHP 5, PHP 7, PHP 8

Contre les messages d'insulte. Nettoie automatiquement le message. Filtrer les messages d'insultes dans une chaine.

Trouver un caractère dans une chaine

Compatibilité : PHP 5, PHP 7, PHP 8

Trouver un caractère numérique ou alphanumérique dans une chaine. Attention au signe d'égalité, voir script.

Trouve toutes les URL dans une base SQL

Compatibilité : PHP 5, PHP 7, PHP 8

Requêtes pour trouver des URLs dans des tables MySQL. Utile pour nettoyer une base de sites web dans une BDD MYSQL.

* Requêtes exécutées avec Recherche Contextuelle

  08 Nov 2008

Information sur les mises à jour

Dernière mise à jour :

    29 Aout 2019
    fonctionnement du code vérifié

7 092 Vues
Compatibilité du code
PHP 5, 7 et 8+