Eric B a écrit:
j ai commencé par re activer le plugin AntiAspi
Ce plugin n'est plus maintenu, car il n'a jamais prouvé quoi que ce soit.
En ce qui concerne "mon" robot.txt
j'ai
UserAgent: *
Disallow: /Prive/
Disallow: /Blogprive/
Disallow: /Piwik/
et ça à l'air de plaire, en tout cas à Google, au vu de mon pagerank,
mais pas d'illusions entre Google, Msnbot, les chinois, les russes, l'Ukraine, c'est 70% à 90% du trafic total du serveur.
Je mets à jour sitemap à chaque mise à jour, soit 2 à 4 fois par semaine.
Contrepartie positive, les photos de la veille sont visibles sur Google dès le lendemain.
Et en réfléchissant : 34 498 photos (plus de 34 000 pages donc !), 1294 albums, comment voulez-vous que les moteurs de recherche procèdent autrement qu'en passant leur vie à scanner les sites.
Alors imposer un délais entre deux recherches, certainement pas ! C'est pas cohérent, soit on fait un site pour un un nombre limité de personnes - et on bloque totalement les moteurs de recherche, soit on l'ouvre, on documente ses photos par des commentaires pertinents et détaillés, et on laisse travailler à leur guise ceux qui permettront aux internautes inconnus d'accéder à votre site.
Bonne soirée
Eric B a écrit:
Ou le plus simple fichier est il encore pertinent?:
Code:
# robots.txt User-agent: * Disallow: Crawl-delay: 300Imposer 5min d intervalle entre 2 recherches, c est un poil bourrin, non?
Pourquoi ne le serait-il pas ? Dans ce cas précis, il n'y a aucune exclusion d'indexation. Donc, avant ou après la version 2.4 de Piwigo, il n'y a aucun changement.
En quoi serait-il "bourrin" d'imposer un intervalle de 5 minutes ? Bourrin dans quel sens : Pas assez ou trop ?
Il y a des moteurs d'indexation (chinois notamment) qui ne respectent rien et vienne "toquer" à la porte des sites toutes les minutes. Bonjour l'historique des visites...
Eric B a écrit:
Sur ma galerie, j avais 6 milions d evenements ds l historique, j ai commencé par re activer le plugin AntiAspi, puis fait un gros menage de l historique en supprimant direct en SQL tous les lignes non liées à une catégorie. Je ne sais pas si c est vraiment pertinent, mais cela a supprimé 5.9 Millions de lignes!
Code:
DELETE FROM `phpwebgallery_history` WHERE `category_id` IS NULL AND `user_id` = 2(user_id=2 étant le guest chez moi)
Avez-vous essayé extension:604 ? Cela pourrait aider un peu au lieu de tripatouiller directement dans la base de données.
C est quoi au final les recommandations pour le fichier robots.txt?
Avec la v2.4 et les images ds _data\i, il y a ptet du changement, non?
Ou le plus simple fichier est il encore pertinent?:
# robots.txt User-agent: * Disallow: Crawl-delay: 300
Imposer 5min d intervalle entre 2 recherches, c est un poil bourrin, non?
Sur ma galerie, j avais 6 milions d evenements ds l historique, j ai commencé par re activer le plugin AntiAspi, puis fait un gros menage de l historique en supprimant direct en SQL tous les lignes non liées à une catégorie. Je ne sais pas si c est vraiment pertinent, mais cela a supprimé 5.9 Millions de lignes!
DELETE FROM `phpwebgallery_history` WHERE `category_id` IS NULL AND `user_id` = 2
(user_id=2 étant le guest chez moi)
l'affichage de la page contenant /upload/... ne contient que la photo et ne permet pas de naviguer sur d'autres pages de la galerie. ce que je trouve dommage.
Bien observé.
Google ne référence pas encore correctement les images de nos galerie. C'est une autre débat.
Du coup, pourquoi vouloir bloquer le robot de Google dans le répertoire "upload" ? Quel serait le bénéfice ??
oui je ne veux pas indisposer google, d'où ma question :-)
on retrouve par exemple cette image http://www.photos-concert.fr/upload/201 … 4a19e7.jpg
mais je pense que c'est surtout parce que je l'ai utilisée pour illustrer un article de mon blog.
sinon dans google image, je retrouve pas mal de thumbnails http://www.photos-concert.fr/upload/201 … 4a19e7.jpg (aussi présent dans le dossier upload). c'est d'ailleurs la même image.
Possible...
Bien que Google référence d'un coté la page et de l'autre l'image, je ne sais pas si en bloquant certains éléments de construction de la page, on ne va pas l'indisposer au point qu'il ne référence pas la page.
Auriez vous un exemple de photos référencées ?
bonjour,
petite question concernant le fichier robot.txt. je me suis aperçu que je retrouvais après une recherche google des photos avec l'adresse h**p://www.photos-concert.fr/upload/2010/04/07/blabla.jpg alors que je préférai trouver h**p://www.photos-concert.fr/picture.php?/410/category/blabla
si je rajoute le dossier /upload dans mon fichier robot.txt, les robots n'auront plus accès à ce dossier. est-ce que ça ne va gêner la prise en compte de la dernière page mentionnée ?
merci de vos lumières.
bg62 a écrit:
voilà j'ai corrigé et cité ...
Non seulement il y a des règles sur un forum,
mais plus précisément je ne désirai pas une correction de ta part,
plus simplement il me semblait indispensable que tu évites l'usage de !?! à l'avenir.
bg62 a écrit:
tosca a écrit:
(ça devient vraiment difficile de suivre ...)
4 posts au dessus ...
Extrait des Règles du Forum :
5 Evitez de modifier un message déjà posté
Réservez la fonction "Modifier" à la correction de coquilles ou pour préciser immédiatement des détails mineurs. Pour ajouter du contenu, créez plutôt un nouveau message, afin de préserver la cohérence de la discussion et de rester clair pour les lecteurs.
tosca a écrit:
bg62 a écrit:
voilà j'ai corrigé et cité ...
Quoi et où ?
(ça devient vraiment difficile de suivre ...)
4 posts au dessus ...
bg62 a écrit:
voilà j'ai corrigé et cité ...
Quoi et où ?
(ça devient vraiment difficile de suivre ...)
VDigital a écrit:
bg62 a écrit:
nicolas a écrit:
!?!
bg62, pour nous aider à suivre les discussions, quand tu cites quelqu'un cela serait souhaitable que son écrit soit bien dans le topic.
!?! cela ne parle pas à tout le monde.
Merci.
Quelqu'un pourrait-il se dévouer pour nous faire une synthèse de ce qu'il faut retenir ou pas de l'applicable à propos des robot.txt ?
Merci d'avance.
voilà j'ai corrigé et cité ... vois pas du tout l'intérêt dans ce cas mais bon ...
- ressortir un vieux truc pour dire des choses pareilles, habituellement j'aurais laissé tomber, mais là il me fallait quand même y répondre, tant c'est énorme ...
- pour le fichier robots.txt, tout à fait d'accord avec toi, il serait bien temps de nous mettre au moins le minimum que cela puisse servir à tous :-)
(et ceux qui n'en verraient pas l'utilité, personne ne les oblige !)
VDigital a écrit:
Quelqu'un pourrait-il se dévouer pour nous faire une synthèse de ce qu'il faut retenir ou pas de l'applicable à propos des robot.txt ?
En effet, car le message précédent mélange tout entre le robots.txt et le sitemap. Pas terrible pour suivre... :-(
bg62 a écrit:
nicolas a écrit:
!?!
bg62, pour nous aider à suivre les discussions, quand tu cites quelqu'un cela serait souhaitable que son écrit soit bien dans le topic.
!?! cela ne parle pas à tout le monde.
Merci.
Quelqu'un pourrait-il se dévouer pour nous faire une synthèse de ce qu'il faut retenir ou pas de l'applicable à propos des robot.txt ?
Merci d'avance.