Général

Les PCRE

Les POSIX

Pratique

Linux

Spécial php

Les billets de fred

Les fonctions POSIX


Rappel des expressions régulières POSIX

Dans cette partie de cours, nous allons survoler par quelques exemples les fonctions POSIX. Vous trouverez des exemples plus concrets et plus complets dans les pages des fonctions elles-mêmes.

POSIX est l'acronyme de Portable Operating System Interface dont le X exprime l'héritage UNIX.

Les fonctions POSIX
  • ereg
  • eregi
  • ereg_replace
  • eregi_replace
  • split
  • spliti
Voilà nous allons travailler directement par l'exemple avec les fonctions POSIX

Les POSIX par l'exemple

Exemple :
Je veux vérifier que ma variable ne contient qu'un chiffre et un seul compris entre 0 et 9

<?php
$chiffre=1;
if(ereg("^[0-9]$",$chiffre))
{
echo'Bon !';
}
else
{
echo'Bouuuuh... pas bon !';
}
?>

Explication de la procédure :

Définition du motif :

- on ne veut dans la chaîne que un seul chiffre, ce qui veut dire que notre chaîne commence et se termine par ce chiffre.
Rappel des caractères de début et fin de chaîne :
- on marque le début de la chaîne grâce à l'accent circonflexe ^ et la fin grâce au symbole dollar $
soit : ^ notre_chiffre $
Si cétait un seul chiffre bien précis, exemple 5, cela aurait pu s'écrire comme ceci :
ereg("^5$",$chifre);

Oui mais nous, on veut vérifier la série de chiffre qui va de 0 à 9.

Nous devons donc créer une plage de recherche de 0 à 9 ; cela s'appelle une classe et s'écrit entre crochet [..-..] ==> voir la page [ Symboles ]

on finalise donc notre motif de recherche comme ceci :

<?php
ereg("^[0-9]$",$chiffre);
?>

Et voilà, votre premier motif est réalisé.
Le résultat de cette regex affichera Bon !

Oui bon..., j'avoue que cet exemple est enfantin, mais... il faut bien commencer !

On va maintenant créer un motif un peu plus complet.

Exemple :

on souhaite que notre chaîne soit composée d'une série de trois chiffres obligatoires.
Vous avez une petite idée en reprenant notre regex ci-dessus ?

<?php
ereg("^[0-9]$",$chiffre);
?>
Rappellez-vous les symboles et notamment les intervalles de reconnaissance :
[ Symboles ]

Vous avez trouvé comment écrire votre nouvelle regex ?

Simple :
$chiffre="000";
if(ereg("^[0-9]{3}$",$chiffre))
{
echo$chiffre,' est bien compris entre 000 et 999';
}
else
{
echo"$chiffre... bouuuuh, c'est pas bon !";
}
?>

Et voilà, trois chiffres obligatoires !

Utilisation de l'intervalle de reconnaissance {3}, ce qui signifie 3 chiffres minimum à 3 chiffres maximum. Lorsque l'intervalle ne contient qu'une valeur, il est interprété comme valeur imposée. Si l'on avait voulu permettre une écriture +/- normale des nombres de 0 à 999 notre regex aurait été :

<?php
$chiffre=1;
if(ereg("^[0-9]{1,3}$",$chiffre))
{
echo$chiffre,' est bien compris entre 0 et 999';
}
else
{
echo$chiffre,' bouuuuh... pas bon !';
}
?>

Mais ce n'est pas suffisant et le masque n'est pas assez restrictif pour cela, car il permet encore des valeurs comme 001 ou 058.

Si on veut vraiment le rendre efficace dans la notation chiffrée, il convient de restreindre encore les possibilités, comme ceci :

<?php
$chiffre="582";
if(ereg("^([0-9]{1}|[1-9][0-9]|[1-9][0-9]{2})$",$chiffre))
{
echo$chiffre,' est bien compris entre 0 et 999';
}
else
{
echo$chiffre,' bouuuuh..., pas bon !';
}
?>

Et voilà ! Faites un test avec cette regex et essayez de donner des valeurs comme 05 ou 063 dans la variable $chiffre.

Impossible, les valeurs sont refusées !

Si vous observez bien cette regex, vous constaterez que j'ai utilisé la barre verticale |
Pour rappel, cette barre verticale | sert à marquer une alternative (| == OU). Dans l'exemple ci-dessus elle s'interprète comme ceci :

[0-9]{1} ==> chiffre de 0 à 9 OU
[1-9][0-9] ==> chiffre de 10 à 99 OU
[1-9][0-9]{2} ==> chiffre de 100 à 999

Les POSIX... mise en pratique !

Pour rappel, les motifs sont réalisés au moyen de symboles spécifiques : [ Symboles ]

Dans cette partie de cours je vais vous présenter en détail les éléments vous permettant de comprendre la création d'un motif de recherche. Je vais travailler ici avec les fonction POSIX ereg et eregi.

Description des motifs
Ces exemples sont complémentaires de ceux utilisés sur la page POSIX.

On peut décrire la composition d'un motif selon le schéma suivant :
  • les éléments tels que caractères, chaînes et classes.
  • le nombre d'apparition
  • la position dans le motif
  • les alternatives
Comme cela est dit dans le cours précédent, création d'un motif, nous allons ici détailler les étapes et les possibilités d'analyse sur une chaîne.
Nous utiliserons la fonction ereg()

1) Un motif simple, une chaîne

Exemple :

ereg('chien','Mon animal favori est le chien');

Cet exemple renvoie VRAI (true) car le motif 'chien' est présent dans la chaîne sujet.
Cet exemple aurait également pu être formulé de cette façon :

$chaine='Mon animal favori est le chien';
$motif='chien';
ereg($motif,$chaine);
?>

Un autre exemple :
$chaine='Les Regex par la pratique';
$motif='regex';
ereg($motif,$chaine);
?>


Cet exemple renvoie FAUX (false) car le motif 'regex' n'a pas été trouvé dans la chaîne.
Mais si, me direz-vous, il est bien dans la chaîne !
En effet, il est bien là mais l'expression ne l'a pas reconnu.

D'où vient le problème alors ?

Simple... les expressions régulières sont sensibles à la casse.
Regex et regex bien qu'identique dans leur sens littéral sont pourtant deux mots différents dans leur mode d'écriture.

Les fonction ereg, ereg_replace et split ont un équivalent qui les rend insensibles à la casse : eregi, eregi_replace et spliti.

Donc, pour que notre exemple précédent renvoi VRAI il fallait écrire l'expression comme ceci :

$chaine='Les Regex par la pratique';
$motif='regex';
eregi($motif,$chaine);

Vous comprenez que cela dépend effectivement de ce que l'on recherche au niveau de la chaîne de caractères.

En gardant toujours le même exemple, on peut également arriver au même résultat en créant une alternative (un OU si vous préférez)

2) L'alternative dans le motif

$chaine='Les Regex par la pratique';
$motif='regex|Regex|REGEX';
ereg($motif,$chaine);

Cette méthode renvoie VRAI car l'expression trouvera au moins un des éléments donnés au niveau du motif, soit regex ou Regex ou REGEX

Voilà, on garde notre exemple, mais en plus, on veut afficher le terme trouvé
Les fonctions de regex permettent d'y adjoindre un argument optionnel tel qu'un tableau

Exemple :

$chaine='La REGEX est un outil formidable';
$motif='regex|Regex|REGEX';
ereg($motif,$chaine,$regs);

foreach($regs as $terme)
{
echo$terme.'
';
}
?>
Cette recherche affichera le mot trouvé soit : REGEX

3) Etendons la plage de recherche

Rechercher et trouver un terme spécifique comme ci-dessus est utile mais l'utilité des regex serait bien pauvre si elle ne se limitait qu'à ça.
Nous allons créer des motifs qui permettent des recherches tant générale que spécifique en utilisant les symboles de classes, les parenthèses, etc...
Pour rappel : [ Symboles ]

Exemple : rechercher les voyelles dans une chaîne
$chaine='Les Regex par la pratique';
$motif='[aeiouy]';
ereg($motif,$chaine);


Cet exemple renvoie VRAI puisque la chaîne contient au moins une des voyelles définies dans le motif.


Exemple : toujours avec des lettres on va créer une classe (une plage de caractères)
$chaine='Les Regex... une merveille !';
$motif='[a-d]';
ereg($motif,$chaine);
?>
Cet exemple renvoie FAUX puisque la chaîne ne contient aucune des lettres définies dans le motif, alphabet de 'a' à 'd'.

Exemple : toujours dans la même logique, on va chercher des chiffres
$chaine='Les Regex... une merveille !';
$motif='[0-9]';
ereg($motif,$chaine);

Cet exemple renvoie FAUX puisque la chaîne ne contient aucun des chiffres définis dans le motif, chiffre de '0' à '9'.

Exemple : on garde nos chiffres, mais on inverse la logique, on va demander de vérifier que la chaîne ne contienne pas de chiffres, on demande une négation en somme.
pour créer la négation en utilisant le symbole ^ à l'intérieur de la classe.

$chaine='Les Regex... une merveille !';
$motif='[^0-9]';
ereg($motif,$chaine);

Cet exemple renvoie VRAI puisque, effectivement, la chaîne ne contient aucun chiffre défini dans le motif.

Exemple : ci-dessous, on demande au motif de ne pas trouver de lettres, tant minuscules que majuscules, dans la chaîne

$chaine='Les Regex... une merveille !';
$motif='[^a-zA-Z]';
ereg($motif,$chaine);

Cet exemple renvoie FAUX puisque, effectivement, la chaîne contient des lettres définies dans le motif.

4) Parenthèses capturantes

Pour illustrer cet exemple, on va convertir une date MYSQL au format YYYY-MM-DD
Il est bien entendu que ceci n'est qu'un simple test car Mysql est bien capable de reproduire une date au format souhaité sans faire la moindre regex.

Date exemple : 2003-12-25 convertie en 25/12/2003.
$date='2003-12-25';
$date=ereg_replace("([[:digit:]]{4})-([[:digit:]]{2})-([[:digit:]]{2})","$3/$2/$1",$date);
echo$date;
// cette fonction affichera 25/12/2003.


Comme vous le constatez, les possibilités sont multiples et il convient de créer son motif selon ce que l'on souhaite et/ou ce que l'on ne souhaite pas.
L'habitude fera que vous sentirez la direction que vous devrez prendre dans la mise en place de votre motif de recherche.

Vous avez remarqué que dans ce tuto j'ai employé les fonctions POSIX et pas les PCRE.
Il ne s'agit bien évidement que d'un choix didactique et pas d'un choix de performance.

Le même tuto avec les PCRE : Cf-> PCRE en pratique

ADAM Benjamin 2008 | Admin