Devine la langue d'un texte

    15 Fév 2019  

      Devine la langue d'un texte

Cette fonction devine la langue d'un texte (texte pur, y compris la ponctuation), parmi 10 langues européennes : Français, anglais, allemand, espagnol, portugais, italien, hollandais, norvégien, danois, suédois.

Auteur : Damien Seguy (Nexen)
administrateur 15 Fév 2019
# Catégorie Compatibilité Nombre de vues Site Archive
   Divers PHP 4, PHP 5, PHP 7 122  

       Code Source PHP


 
 01    
 02    
 03    
 04    
 05    
 06    
 07    
 08    
 09    
 10    
 11    
 12    
 13    
 14    
 15    
 16    
 17    
 18    
 19    
 20    
 21    
 22    
 23    
 24    
 25    
 26    
 27    
 28    
 29    
 30    
 31    
 32    
 33    
 34    
 35    
 36    
 37    
 38    
 39    
 40    
 41    
 42    
 43    
 44    
 45    
 46    
 47    
 48    
 49    
 50    
 51    
 52    
 53    
 54    
 55    
 56    
 57    
 58    
 59    
 60    
 61    
                               
<?php
/**************************************************************************************/
/*
     Titre  : Devine la langue d'un texte                                                                                 
                                                                                                                          
     URL    :  
     https://phpsources.net/code/php/divers/1012_devine-lelangue-d-un-texte
     Auteur         : administrateur                                                                                      
     Date edition   : 15 Fév 2019                                                                                         
*/
/**************************************************************************************/
 function guess_lg_trig($text){
 $text strtolower($text); 
  
 //Utilise la méthode des trigrammes 
 // note : bien sur, ce n'est pas sur à  100%.! 
 $trigramme['dk'] = array('er\b''en\b''for''et\b''ing''\bfo''\baf'
'\bde''nde''els''les''ret''\bsa''de''\bi\b');
 $trigramme['nl'] = array('en\b''de\b''\bde''et\b''an\b''n\bd''\bhe'
'er\b''\bva''van''een''ver''aar''\bee''het');
 $trigramme['en'] = array('\bth''he\b''the''\b, \b''nd\b''ed\b'
'\ban''and''\b.\b''\bto''ing''to\b''ng\b''er\b''\bof');
 $trigramme['fr'] = array('\bde''es\b''de\b''ent''nt\b''\ble'
'e\b.\bd''le\b''ion''s\b.\bd''e\b.\bl''\bla''la\b''re\b''on\b');
 $trigramme['de'] = array('en\b''er\b''\bde''der''ie\b''ich''sch',  
'ein''che''die''ch\b''den''nd\b''\bdi''ung');
 $trigramme['it'] = array('\bdi''to\b''\bde''di\b''\bco''la\b''re\b'
'ion''ent''e\b.\bd''le\b''o\b.\bd''ne\b''no\b''\bin');
 $trigramme['no'] = array('et\b''\b.\b''en\b''er\b''\bde''\bha'
'an\b''de\b''\b, \b''det''ar\b''\bog''og\b''te\b''han');
 $trigramme['pt'] = array('\bde''de\b''os\b''do\b''que''\bqu''\bco',
'as\b''ent''o\b''ue\b''\ba\b''o\b.\bd''\bse''\bo\b');
 $trigramme['es'] = array('\bde''de\b''os\b''\bla''el\b''la\b''que',
 'as\b''ue\b''\bqu''\bco''\ben''en\b''ent''es\b');
 $trigramme['se'] = array('en\b''\b.\b''er\b''et\b''tt\b''\bde'
'ar\b''\b, \b''fr''om\b''\boc''ch\b''de\b''och''an_');
 $nb 15
  
 $resultat = array(); 
 foreach($trigramme as $langue => $trigs) { 
   $resultat[$langue] = 0
   for($i 0$i$nb$i++){ 
   $trouve preg_match_all("/$trigs[$i]/"$text$x); 
   if ($trouve 0){ 
   $resultat[$langue]++; 
   } 
   } 
 } 
  
 $max max($resultat); 
 $retour = array(); 
 foreach($resultat as $langue => $valeur) { 
   if ($valeur == $max) { 
   $retour[] = $langue
   } 
 } 
 return $retour
}
?>

...  Manuel PHP - Fonctions du code source

   php.net  Description Versions PHP OUTIL
   array Crée un tableau PHP 4, PHP 5, PHP 7
   max La plus grande valeur PHP 4, PHP 5, PHP 7
   preg_match_all Expression rationnelle globale PHP 4, PHP 5, PHP 7
   return Retourne le controle du programme au module appelant. PHP 4, PHP 5, PHP 7
   strtolower Renvoie une chaîne en minuscules PHP 4, PHP 5, PHP 7
Logiciels PHP  

    Les dernières parutions de scripts PHP

PrestaShop 1.7.6.0

 
Langue drapeau fr
Date  aujourd'hui
Taille 59 Mo
Catégorie Ecommerce

PhpList 3.4.4

 
Langue drapeau us
Date 12 Juil
Taille 27 Mo
Catégorie Emailing

Joomla 3.9.10

 
Langue drapeau fr
Date 12 Juil
Taille 13 Mo
Catégorie CMS

TYPO3 9.5.8

 
Langue drapeau da
Date 10 Juil
Taille 35 Mo
Catégorie CMS


  • L'ajout de commentaire est libre et ne demande pas d'inscription,
  •   invité

nous vous encourageons à contribuer à l'utilisation de PHP en ajoutant vos remarques.