Les PCRE... mise en pratique !
Pour rappel, les motifs sont réalisés au moyen de symboles spécifiques :
[ Symboles ]
Cette partie de cours est identique à celle sur les POSIX en pratique sauf que je vais travailler ici avec la/les
fonction(s) PCRE preg_match, preg_replace
La grande différence réside dans les motifs de recherche qui doivent impérativement être encadrés, délimités.
Voir :
PCRE et
Le délimiteur et les PCRE
Je vais employer l'accent grave `comme délimiteur
Je ne vais pas retaper le blabla de l'autre tuto et on va aller directement à l'essentiel.
Nous utiliserons la fonction
Cf-> preg_match()
1) Un motif simple, une chaîne
<?php
preg_match('`chien`','Mon animal favori est le chien');
?>
Cet exemple renvoie
VRAI (true) car le
motif 'chien' est présent dans la chaîne sujet.
Cet exemple aurait également pu être formulé de cette façon :
<?php
$chaine='Mon animal favori est le chien';
$motif='`chien`';
preg_match($motif,$chaine);
?>
Un autre exemple :
<?php
$chaine='Les Regex par la pratique';
$motif='`regex`';
preg_match($motif,$chaine);
?>
Cet exemple renvoie
FAUX (false) car le
motif 'regex' n'a pas été trouvé dans la chaîne.
Mais si, me direz-vous, il est bien dans la chaîne !
En effet, il est bien là mais l'expression ne l'a pas reconnu.
D'où vient le problème alors ?
Simple... les expressions régulières sont sensibles à la casse.
Regex et regex bien qu'identique dans leur sens littéral sont pourtant deux mots différents dans leur mode d'écriture.
Les fonction PCRE possèdent une série d'option qui permet de gérer différentes situations particulières.
Donc, pour que notre exemple précédent renvoi
VRAI il fallait écrire l'expression, en ajoutant l'option i, comme ceci :
<?php
$chaine='Les Regex par la pratique';
$motif='`regex`i';
preg_match($motif,$chaine);
?>
Vous comprenez que cela dépend effectivement de ce que l'on recherche au niveau de la chaîne de caractères.
En gardant toujours le même exemple, on peut également arriver au même résultat en créant une
alternative (un
OU si vous préférez)
2) L'alternative dans le motif
<?php
$chaine='Les Regex par la pratique';
$motif='`(regex|Regex|REGEX)`';
preg_match($motif,$chaine);
?>
Cette méthode renvoi
VRAI car l'expression trouvera au moins un des éléments donnés au niveau du motif, soit
regex ou
Regex ou
REGEX
Voilà, on garde notre exemple, mais en plus, on veut
afficher le terme trouvé
Les fonctions PCRE permettent d'adjoindre un argument optionnel
Exemple :
<?php
$chaine='La REGEX est un outil formidable';
$motif='`(regex|Regex|REGEX)`';
preg_match($motif,$chaine,$out);
print_r($out);
// affichera : Array ( [0] => REGEX [1] => REGEX )
?>
Cette recherche affichera le mot trouvé soit :
REGEX
3) Etendons la plage de recherche
Rechercher et trouver un terme spécifique comme ci-dessus est utile mais l'utilité des regex serait bien pauvre si elle ne se limitait qu'à ça.
Nous allons créer des motifs qui permettent des recherches tant générale que spécifique en utilisant les symboles de classes, les parenthèses, etc...
Pour rappel :
[ Symboles ]
Exemple : rechercher les voyelles dans une chaine
<?php
$chaine='Les Regex par la pratique';
$motif='`[aeiouy]`';
preg_match($motif,$chaine);
?>
Cet exemple renvoi
VRAI puisque la chaine contient au moins une des voyelles définies dans le motif.
Exemple : toujours avec des lettres on va créer une classe (une plage de caractères)
<?php
$chaine='Les Regex... une merveille !';
$motif='`[a-d]`';
preg_match($motif,$chaine);
?>
Cet exemple renvoi
FAUX puisque la chaine ne contient aucune de lettres définies dans le motif, alphabet de
'a' à
'd'
Exemple : toujours dans la même logique, on va chercher des chiffres
<?php
$chaine='Les Regex... une merveille !';
$motif='`[0-9]`';
preg_match($motif,$chaine);
?>
Cet exemple renvoi
FAUX puisque la chaine ne contient aucun chiffres défini dans le motif, chiffre de
'0' à
'9'
Exemple : on garde nos chiffres, mais on inverse la logique, on va demander de vérifier que la chaîne ne contient pas de chiffres, on demande une négation en somme.
pour créer la négation en utilisant le symbole ^ à l'intérieur de la classe.
<?php
$chaine='Les Regex... une merveille !';
$motif='`[^0-9]`';
preg_match($motif,$chaine);
?>
Cet exemple renvoi
VRAI puisque, effectivement, la chaine ne contient aucun chiffres défini dans le motif.
Exemple : ci-dessous, on demande au motif de ne pas trouver de lettres, tant minuscules que majuscules, dans la chaîne
<?php
$chaine='Les Regex... une merveille !';
$motif='`[^a-zA-Z]`';
preg_match($motif,$chaine);
?>
Cet exemple renvoi
FAUX puisque, effectivement, la chaine contient des lettres définies dans le motif.
4) Parenthèses capturantes
Pour illustrer cet exemple, on va convertir une date MYSQL au format YYYY-MM-DD
Il est bien entendu que ceci n'est qu'un simple test car Mysql est bien capable de reproduire une date au format souhaité sans faire la moindre regex.
Date exemple : 2003-12-25 convertie en 25/12/2003.
<?php
$date='2003-12-25';
$date=preg_replace('`([[:digit:]]{4})-([[:digit:]]{2})-([[:digit:]]{2})`' ,'$3/$2/$1',$date);
echo $date;
// cette fonction affichera 25/12/2003.
?>
Comme vous le constatez, les possibilités sont multiples et il convient de créer son motif selon ce que l'on souhaite et/ou ce que l'on ne souhaite pas.
L'habitude fera que vous sentirez la direction que vous devrez prendre dans la mise en place de votre motif de recherche.
Le même tuto avec les POSIX :
Cf-> POSIX en pratique
Rédaction Yves Maistriaux :: Mai 2003
Dernière mise à jour :: Décembre 2005