Article paru dans Programmez
Sommaire
- Qu’est-ce qu’XPath ?
- Comment l’utiliser en PHP5 ?
- Comment accéder aux éléments ?
- La syntaxe XPath appliquée à la recherche d’éléments
- Notation complète :
- Notation abrégée :
- Arborescence des noeuds :
- Désigner plusieurs noeuds à la fois :
- La syntaxe XPath appliquée à la recherche d’attributs
- La syntaxe XPath appliquée à la recherche de texte
- Syntaxe d’un flux RSS 2.0 dans du XML
- Exemple : afficher les titres de flux RSS contenant le mot PHP
- La syntaxe XPath appliquée à la recherche d’éléments
- Sources
- En savoir plus
-
Qu’est-ce qu’XPath ?
XPath
est un langage pour désigner une portion d’un document
XML
.
Au départ, XPath a été créé pour uniformiser une syntaxe entre XSL (feuilles de style pour documents XML) et XPointer (désigneurs de documents XML à distance). Donc XPath permet d’accéder précisément à un élément d’un document XML.
XPath est utilisé par les développeurs comme une syntaxe de tri et de recherche dans les documents XML, grâce à ses expressions régulières. En effet, couplé à un langage de programmation, par les boucles, on peut donc extraire des données précises d’un document XML. Une utilisation, par exemple pourrait être de trier des titres de nouvelles arrivant dans un flux RSS, par un mot-clef. -
Comment l’utiliser en PHP5 ?En PHP5, les fonctions DOMDocument ont été complétées par l’extension simpleXML qui ajoute une manière simple et orientée objet d’accéder à des arbres DOM, donc à tout document XML, ou XHTML.
-
Comment accéder aux éléments ?Nous nous intéresserons aux noeuds de trois types :
-
les noeuds d’éléments, c’est-à-dire les balises XML
-
les noeuds d’attributs, qui ajoutent des informations aux balises
-
les noeuds de texte, les données du document
Notez que simpleXML propose déjà des méthodes pour accéder aux éléments et attributs.
-
La syntaxe XPath appliquée à la recherche d’élémentsIl existe deux syntaxes pour noter le chemin à travers les éléments du DOM XML : la méthode complète, qui garantit le moins d’erreurs possibles et le plus de précision, et la méthode abrégée qui est plus rapide à écrire.
Soient des balises, et je veux désigner l’élément c:<a>
<b>
<c></c>
<c></c>
<c></c>
</b>
</a>
-
Notation complète :a/child::b/child::c
-
Notation abrégée :a/b/c
A retenir : on sépare les éléments par un slash, comme les répertoires Unix.
On sépare les mots-clés de désignation du nom de l’élément par :: -
Arborescence des noeuds :Pour accéder au noeud racine, on peut utiliser le signe /
Pour désigner le noeud sur lequel on travaille, on utilise la notation ./
Pour désigner le noeud parent, on utilise la notation ../
-
Désigner plusieurs noeuds à la fois :Les caractères spéciaux permettent de choisir plusieurs éléments en une seule notation. On utilise l’étoile * comme caractère joker, et // pour outrepasser la désignation de l’arborescence.
Exemples :
Soit le XML<a>
<b>
<c></c>
<c></c>
<c></c>
</b>
</a>
<a>
<b>
<c></c>
<c></c>
<c></c>
</b>
</a>
<a>
<b>
<c></c>
<c></c>
<c></c>
</b>
<c></c>
<c></c>
</a>
Je désigne tous les noeuds enfants de a par a/* (je récupère donc les noeuds b et c).
Je désigne tous les c contenus dans un élément b par b//c, si je souhaite au contraire tous les éléments c
quel que soit le noeud parent, je ferais //c
Attention, on postule que la DTD autorise des éléments c
qui ne seraient pas dans <b>
On peut également combiner les choix dans les fonctions par le caractère | (pipe).
-
-
La syntaxe XPath appliquée à la recherche d’attributsLa notation longue des attributs se fait par le mot clef attribute, et la notation abrégée par le caractère @.
<personne>
<yeux couleur =”bleu”>
</yeux>
<cheveux couleur=”blond”>longs</cheveux>
</personne>
<personne>
<yeux couleur =”gris”>
</yeux>
<cheveux couleur=”blond”>en brosse</cheveux>
</personne>
<personne>
<yeux couleur =”brun”>
</yeux>
<cheveux couleur=”noir”>courts</cheveux>
</personne>
Pour désigner les attributs de couleurs d’yeux, je note :
/child::personne/child::yeux/attribute::couleur (complète)
/personne/yeux/@couleur (abrégée) -
La syntaxe XPath appliquée à la recherche de texteOn utilise la fonction contains(chaine, motif). Depuis PHP, notre chaîne sera le titre de la nouvelle qu’on souhaite examiner. On peut examiner aussi bien les noeuds que leurs attributs, que le texte contenu dans le noeud élément.
Syntaxe d’un flux RSS 2.0 dans du XML<rss version=”2.0″>
<channel>
<title>Titre du channel</title>
<link>http://www.monsite.com</link>
<description>Description du channel</description>
items…
</channel>
</rss>
Exemple : afficher les titres de flux RSS contenant le mot PHP//On spécifie les sources RSS
$tablo_flux[0] = ‘http://afup.org/backend.php3′;
$tablo_flux[1] = ‘http://www.nexen.net/index2.php?option=com_rss&feed=RSS0.91&no_html=1′;
$tablo_flux[2] = ‘http://news.google.fr/news?oe=utf-8&client=firefox-a&rls=org.mozilla:fr:official&tab=dn&ned=fr&topic=t&output=rss’;
// Nous connaissons l’arborescence de ces flux, car c’est spécifié
for($i=0;$i < count($tablo_flux);$i++)
{
$racine[$i] = simplexml_load_file($tablo_flux[$i]);
//sensible à la casse
$recherche = ‘/rss/channel/item[contains(title,"PHP")]/title’;
$titres = $racine[$i]->xpath($recherche);
// Quand il n’y a pas de résultat, $titres vaut FALSE
if($titres)
{
foreach($titres as $actu)
{
echo ‘<a href=”‘.htmlentities((string)$actu->link).’”>’.utf8_decode($actu).”</a><br />”;
}
}
}
-
-
Sources
http://fr.wikipedia.org/wiki/XPath
http://xmlfr.org/w3c/TR/xpath/
http://www.w3.org/TR/xpath20/
http://fr.selfhtml.org/xml/representation/syntaxexpath.htm
http://jerome.developpez.com/xmlxsl/xpath/?lpage=&rpage=1
http://www.oreilly.com/catalog/xmlnut/chapter/ch09.html
http://www.stervinou.com/projets/rss/ -
En savoir plusArticle de Wikipedia sur Xpath
http://fr.wikipedia.org/wiki/XPath
Norme du W3C sur XPath
http://www.w3.org/TR/xpath
Manuel PHP sur SimpleXML
http://fr2.php.net/manual/fr/ref.simplexml.phpExtrait d’un ouvrage O’Reilly (XML in a Nutshell
By Elliotte Rusty Harold & W. Scott Means
)
http://www.oreilly.com/catalog/xmlnut/chapter/ch09.html
Les fonctions Xpathhttp://fr.selfhtml.org/xml/representation/fonctionsxpath.htm
Former des flux RSS 2.0 http://ghostdogpr.developpez.com/articles/rss/
Le contexte : une application PHP/MySQL, un champ BLOB dans l’application avec Symfony. Par défaut, nous avions laissé Propel pour faire nos tests.
Le souci d’un champ BLOB est sa contenance. Lorsque je veux lister tous mes enregistrements, si un des champs est BLOB, il est difficile de l’afficher directement dans le listing. Au niveau de la modélisation, j’ai donc intérêt à prévoir que ce champ sera ramené plus tard.
Symfony-Propel me propose une technique : préciser dans le YAML que ce champ sera rapporté à la demande.
commentaires_longs: {type: blob, lazyLoad: true}
Ensuite, lors de la récupération, j’ai tout intérêt à proposer un lien vers le contenu long (en saupoudrant éventuellement d’Ajax pour fournir à l’utilisateur une prévisualisation au survol). Il serait en effet trop coûteux de rapporter ce champ, en performance et en place sur la page web.
Au moment où je souhaite obtenir le commentaire, je pourrais faire :
$criteria->clearSelectColumns();
$criteria->addSelectColumn(ObjetPeer::COMMENTAIRES_LONG);
$rs =ObjetPeer::doSelectStmt($criteria);
Attention : actuellement, la méthode est doSelectStmt() et plus doSelectRS(), ne vous faites pas avoir.
Ensuite, vous récupérez un objet de la classe PDOStatement, il faut ensuite l’exploiter avec un fetch().
Au niveau de la conception de l’application, on peut imaginer mettre ces champs longs dans des tables séparées, puisqu’il sera rare qu’on les reprenne en même temps que les autres.
Petit aide-mémoire que je complète au fur et à mesure.
Les nouvelles commandes sont bien plus agréables et bien plus logiques. Elles ont été regroupées en espaces de noms.
symfony generate:module nomprojet nommodule
symfony propel:build-all
Enfin l’information que je cherchais depuis une heure, à savoir, comment supprimer le champ created_at de mon formulaire (généré automatiquement) de création d’item :
Pour supprimer un champ, il est nécessaire de supprimer son validateur et son widget.
Une autre façon, qui n’est pas nouvelle, mais qui rejoint les difficultés de symfony : il ne faut pas mettre de else aux if isValid(), car sinon le flux de validation du formulaire ne s’effectue pas.
if($request->isMethod('post'))
{
$this->form->bind($request->getParameter('unbug'));
if($form->isValid())
{
$form->save();
$this->redirect('bugs/lister');
}
}
Et ce qu’il y a de bon à savoir avec les formulaires, c’est que les classes liées (relation 1-N) doivent avoir une méthode toString() pour pouvoir être utilisable via la génération automatique de CRUD.
En mode dev (appli_dev.php/module/action) le message s’affiche clairement.
Le résultat est toujours retourné tronqué de ses décimales.
Sub FormaterCorrectement()
rem question : Comment formater
Const EURO As Double = 6.55957
Dim mesFrancs As Double
Dim Resultat As Double
mesFrancs = InputBox("Saisissez la somme en francs")
Resultat = CDbl(Format(mesFrancs / EURO, "##.00"))
' Je convertis en Double le formatage à deux décimales du résultat
' sinon le résultat avant l'affichage est casté et la partie décimale tombe
MsgBox(Resultat, 64 , "Résultat de la conversion")
End Sub
J’ai une liste de valeur, une par ligne, et je souhaite déclarer un tableau PHP contenant ces valeurs.
Voici comment procéder (j’ai utilisé Scintilla, donc je mets les options que j’ai utilisées, mais c’est transposable à n’importe quel outil).
- Lancer le Rechercher/Remplacer avec CTRL + H
- Inscrire \n et cocher ‘Transform backslah expressions’
- Remplacer par ‘,’
- \r et laisser coché ‘Transform backslah expressions’
- Remplacer par chaîne vide
- Ajouter la quote du début, et celle de fin
Malgré les faibles mises à jour sur ce blog, il y a encore quelques visites, et parfois de gens plutôt calés. Je me propose donc de publier les questions sans réponse explicite (avec tests, code qui le prouve) que j’ai en stock.
Si vous avez de l’aide à apporter pour répondre à ces données, manifestez vous, via les commentaires ou en me contactant : sarah (point) haim (at) anaska (point) com.
PHP
- Pourquoi avoir choisi __construct() et ne pas avoir gardé la manière PHP4 ?
- Vaut-il mieux utiliser __FILE__ ou la variable d’environnemet ($_SERVER) ?
- Désactiver var_dump pour gérer des contextes
- Est-ce que je devrais ré-écrire tous mes scripts pour passer à PHP6 ?
- Puis-je utiliser une classe abstraite, pour des méthodes statiques ?
- Flux et sockets : dois-je refaire mon wrapper pour utiliser les sockets ?
Talend
- Faire un diff sur des fichiers
- Transformer des fichiers : plusieurs lignes à partir d’une seule
Javascript
- Est-ce que continue sert dans les boucles labellisées ?
- Peut-on utiliser AND au lieu de && et OR au lieu de || en Javascript ?
- Eclipse existe-t-il en français ?
OpenOffice
- Comment paramétrer OpenOffice pour qu’il ressemble à MS Word ?
- Comment voir le contrôle de repérage dans OpenOffice ?
- Comment organiser ses modèles dans OpenOffice ?
Quand je force un tableau associatif en objet, il devient un objet ayant les propriétés qui étaient les clefs du tableau.
Quand je caste un objet en tableau, le nom des propriétés deviennent des clés du tableau, prenant leur valeur.
On connaît la fonction count() en PHP, qui permet de connaître le nombre d’éléments d’un tableau. Mais si je veux savoir à quelle profondeur je risque d’être conduit en parcourant récursivement mon tableau, comment faire ?
J’en profite pour vous faire découvrir le deuxième argument de la fonction count(), qui mis à la valeur COUNT_RECURSIVE prendra en compte les éléments internes du tableau.
Je reprends l’exemple de la doc PHP pour éclairer mon propos.
$food = array(
'fruits' => array(
'orange', 'banana', 'apple' => array('verte', 'jaune', 'rouge')
),
'veggie' => array(
'carrot', 'collard', 'pea'
)
);
// count récursif
echo count($food, COUNT_RECURSIVE); // affiche 11 et non 8
Parmi les fonctions de tableau, il n’en existe aucune qui permet de juste obtenir la profondeur d’un tableau.
La raison, à mon avis, est qu’un tableau peut-être multi-dimensionnel de manière inégale, comme dans mon exemple ci-dessus.
Oui, on peut aussi demander à ce que les index des tableaux commencent à 1 au lieu de 0 (par défaut, c’est 0) avec l’instruction :
Option Base
Sous Windows, quand le logiciel a été installé, peut-on lancer une mise à jour sans que l’utilisateur ait les droits d’administration ?
Ce n’est pas possible, c’est écrit dans l’aide, d’ailleurs, à la page “Vérifier les mises à jour en ligne”
Vous devez avoir les droits administrateur pour mettre à jour OpenOffice.org.
