Pages: 1
Bonjour,
J'ai remarqué qu'un site avec une gallerie piwigo (j'héberge et file un occasionnel coup de main, mais je n'administre pas) a un problème à cause de Piwigo : les pages d'image individuelles sont indexées au même titre que les pages d'accueil de chaque gallerie photo, et au même titre que les différentes pages du site.
Cela risque de faire concurrence, je trouve. Noyer les pages pertinentes au milieu de centaines de résultats moins pertinents. Imaginer que Google mentionne une photo individuelle au lieu de la page d'accueil de la gallerie, ou, mieux, que les pages du site web qui contiennent les liens vers les galleries, ça serait dommage.
Bon, question de point de vue sans doute.
J'en viens à la question que je me pose : s'il vous plaît, comment puis-je configurer Piwigo pour refuser l'indexation des pages image individuelles ?
Je n'ai pas vu de robots.txt à la base des piwigo, faut-il simplement ajouter "disallow /piwigo/picture.php" dans le robots.txt à la racine du site ? Ou c'est plus compliqué que ça ?
Merci beaucoup si vous pouvez me dire !
Bonne journée.
Dernière modification par oliverfr (2016-10-15 01:02:29)
Hors ligne
Bonjour,
qu'est-ce qu'une page pertinente ?
Celle que vous avez choisie ?
J'ai plus de 20 000 photos indexées dans Google actuellement contre 30 000, il y a un an ?? (sur 50 000), Comment le choix est-il fait ?
Une centaine sur Bing pour 2200 albums. Même question : Comment le choix est-il fait ?
==> vous n'avez pas la main !
J'ai des visiteurs nombreux qui viennent de Google et Google image (100 IP différentes/jour hors maj moteurs de recherche), jamais de Bing (1 fois / mois ?)...
Maintenant en terme de nombre d'accès de mise à jour Bing est le roi, capable de saturer un petit serveur !
Voir une ancienne analyse postée sur ce forum.
Rajoutez à ça que certains moteurs chinois ou russes - et la BnF en France - se foutent éperdument des consignes de robot.txt...
Le plus simple est encore de laisser faire sauf si cela consomme trop de bande passante.
Bonne soirée
Hors ligne
Vous pouvez bloquer certains bots avec le htaccess, pour les images, Google fait le choix, vous pouvez aussi mettre en place des regex dans le robot.txt, de toute façon 60% du web est dupliqué...
Hors ligne
Pages: 1