Présentation
Motreche est une petite application PHP basique et non optimisé pour avoir
un moteur de recherche "de plein texte" sur son site web.
Il est placé sous licence GNU GPL version 3. Non optimisé car elle n'est pas
encore terminée au niveau de ses options. Elle est toutefois fonctionnelle.
Motreche est à l'origine inspirée de cet exemple :
http://www.commentcamarche.net/contents/php/phpmoteur.php3. Ensuite,
l'application a évolué.
L'application est, pour l'heure, destinée aux sites relativement simples.
Fonctionnalités
Comme écrit ci-dessus, Motreche n'est pas encore achevée. Voici ce qui est déjà codé :
- Généralités :
- Aucune utilisation de JavaScript;
- Les pages affichées sont conformes aux recommandations du W3C.
Indexation :
L'indexation consiste à récupérer le contenu du site afin de le stocker pour
répondre aux requêtes ultérieures des visiteurs.
- Restriction de l'indexation à certains répertoires et certaines
exensions de fichiers (= "fichiers valides");
- Chaque fichier valide est alors scanné pour y récupérer les
meta tags éventuels, si l'indexation par les robots a toutefois
été autorisé;
- Le contenu de chaque fichier valide est purgé des balises HTML
et PHP, des mots inférieurs à une certaine longueur, des urls et des
caractères indésirables;
- Selon la configuration demandée, certains types de medias
peuvent être pris en compte au niveau de leur extension uniquement
(leur contenu n'est pas évalué, il s'agit des documents joints à la
page en cours de scan) : images (png, jpeg et gif), textes
(pdf odt doc txt rtf), medias (ogg flv swf dxr wvm). La taille
minimale des images à considérer peut être fixée;
- Autoriser ou non les medias ci-dessus extérieurs au domaine;
- Enregistrer l'indexation dans un fichier PHP ou dans une base
de données. Le choix du fichier PHP peut être judicieux si votre
site n'est pas très gros (quelques dizaines de pages environ) et
que vous ne désirez pas utiliser une DB pour des requêtes limitées.
Enfin, pour les hébergements sans DB, ce peut être une solution.
Attention toutefois, le fichier généré peut devenir gros.
Requêtes et résultats :
Les réquêtes sont les demandes formulées par les visiteurs, les résultas
sont les réponses fournies par l'application aux requêtes.
- Les requêtes peuvent comporter plusieurs mots clés, avec les
opérateurs ET et OU;
- Les requêtes peuvent porter, suivant la configuration, sur la
partie web uniquement (meta tags et contenu textuel des pages) ou
sur les medias contenus dans chaque page (images, medias,...);
- Les résultats sont listés sur une page. Pour des résultats web,
ceux-ci comportent le nom de la page et une description éventuellement
tronquée selon sa longueur. Pour les images, elles sont affichées
en ligne et colonnes, leur nombre variant suivant la configuration;
- Pour les images, leur affichage se fait sous forme de miniatures :
un clic sur ces dernières ouvrent directement l'image, un clic sur leur
titre ouvre la page qui les contient;
- La page de résultats est configurable (ajouts HTML, en-têtes,
css, ...).
Démonstration
Une version de démonstration de Motreche peut être trouvée ici : démo.
Notez qu'il s'agit d'une version de travail et de tests
Téléchargments
Motreche n'est pas encore téléchargeable. Si vous êtes néanmoins intéressé,
n'hésitez pas à me contacter en motivant par quelques mots votre demande. Merci
par avance de l'intérêt que vous portez à cette application.
Installation
Ouvrez le fichier README contenu dans l'archive (français et anglais).
La procédure, simple, et la configuration y sont détaillées.