|
Directrices Principales:::::::::::Volver al Inicio de Aparecer en Google
Fuente:
http://www.google.com.ar/intl/es/webmasters/
Directriz de diseño y contenido:
Cree un sitio con una jerarquía y vínculos de texto claros. Se debe poder acceder a todas las páginas desde al menos un vínculo de texto estático.
Ofrezca a los usuarios un mapa del sitio con vínculos que apunten a las secciones importantes de su sitio. Si el mapa del sitio contiene más de 100 vínculos, puede dividirlo en varias páginas.
Cree un sitio útil con mucha información y escriba páginas que describan su contenido claramente y con exactitud.
Determine las palabras que los usuarios escribirían para encontrar sus páginas y asegúrese de que su sitio realmente las incluya.
Intente utilizar texto en lugar de imágenes para mostrar nombres, contenido o vínculos importantes. El rastreador de Google no reconoce texto incorporado dentro de las imágenes.
Asegúrese de que los códigos TITLE y ALT sean descriptivos y precisos.
Compruebe que no haya vínculos rotos o código HTML incorrecto.
Si decide utilizar páginas dinámicas, (p. ej., una URL que contenga un carácter '?'), tenga en cuenta que no todos los motores de búsqueda rastrean páginas dinámicas, además de páginas estáticas. Esto ayuda a mantener parámetros cortos y un número reducido de los mismos.
Mantenga los vínculos de una página dada en un número razonable (menos de 100).
Directriz técnica:
Utilice un navegador de texto como Lynx para examinar su sitio, ya que la mayoría de las arañas de los motores de búsqueda ven su sitio de la misma manera que lo haría Lynx. Si las funciones avanzadas como Javascript, cookies, ID de sesión, marcos, DHTML o Flash impiden la visualización de todo su sitio en un navegador de texto, es posible que las arañas de los motores de búsqueda tengan problemas para rastrear el mismo.
Permita que los robots de búsqueda rastreen sus sitios sin ID de sesión o argumentos que hacen un seguimiento de su ruta a lo largo del sitio. Estas técnicas son de gran utilidad para el seguimiento del comportamiento de un usuario individual, pero el patrón de acceso de los robots es completamente distinto. El uso de estas técnicas puede llevar a una indexación incompleta de su sitio, ya que es posible que los robots no puedan eliminar las URL que tengan un aspecto distinto pero que en realidad apuntan a la misma página.
Asegúrese de que su servidor Web admite la cabecera HTTP "If-Modified-Since". Esta función permite que su servidor Web avise a Google si su contenido ha cambiado desde la última vez que rastreamos su sitio. La compatibilidad con esta función le ahorra ancho de banda y gastos generales.
Utilice el archivo robots.txt en su servidor Web. Este archivo comunica a los rastreadores qué directorios pueden o no rastrearse. Asegúrese de que el archivo está actualizado para su sitio de modo que no bloquee accidentalmente el rastreador Googlebot. Visite <http://www.robotstxt.org/wc/faq.html> (sólo disponible en inglés) para obtener respuestas a las preguntas más frecuentes sobre los robots y cómo controlarlos cuando visiten su sitio.
Si su compañía adquiere un sistema de administración de contenido, asegúrese de que éste pueda exportar el contenido de modo que las arañas de los motores de búsqueda puedan rastrear su sitio.
Cuando esté listo su sitio:
Cuando su sitio esté online, envíelo a Google desde aquí </addurl.html>.
Asegúrese de que todos los sitios que deben conocer sus páginas sepan que su sitio está online.
Envíe su sitio a los directorios relevantes como Open Directory Project y Yahoo!.
Revise periódicamente la sección para webmasters de Google para obtener más información.
Directrices de calidad - Principios básicos:
Cree páginas para usuarios y no para motores de búsqueda. No engañe a sus usuarios ni presente a los motores de búsqueda contenido distinto al que usted desea mostrar a éstos.
Evite trucos destinados a mejorar los rankings de los motores de búsqueda. Una regla general es preguntarse si se sentiría cómodo al tener que explicar qué ha hecho a un sitio Web de la competencia. Otra prueba de gran utilidad es preguntarse: "¿Esto ayuda a mis usuarios?; ¿haría esto si no existiesen los motores de búsqueda?".
No participe en esquemas de vínculos diseñados para incrementar el ranking o el valor de PageRank de su sitio. En particular, evite vínculos a los creadores de sitios fraudulentos o "vecindarios indeseables" de la Web, ya que su propio ranking podría verse afectado negativamente por dichos vínculos.
No utilice programas informáticos no autorizados para enviar páginas, comprobar rankings, etc. Estos programas consumen recursos informáticos y vulneran nuestros términos del servicio. Google no recomienda el uso de productos como WebPosition Gold™ que envían consultas automáticas o de programación a Google.
Directrices de calidad - Recomendaciones específicas:
Evite texto o vínculos ocultos.
No utilice el encubrimiento o redireccionamientos elusivos.
No envíe consultas automatizadas a Google.
No cargue páginas con palabras irrelevantes.
No cree múltiples páginas, subdominios o dominios que presenten básicamente contenido duplicado.
Evite páginas "puerta" creadas exclusivamente para motores de búsqueda u otros métodos "caseros", como programas de afiliación con poco o nada de contenido original.
Estas directrices de calidad cubren las formas más comunes de comportamiento engañoso o manipulador. No obstante, Google puede reaccionar negativamente a otras prácticas engañosas que no se incluyen aquí (p. ej., engañar a los usuarios con el registro de palabras escritas incorrectamente de sitios Web conocidos). No se debe suponer que Google autoriza una técnica engañosa específica sólo por el hecho de que no se incluya en esta página. Los webmasters que se esfuercen en respetar el espíritu de los principios básicos mencionados anteriormente ofrecerán a los usuarios un servicio de mayor calidad y alcanzarán un mejor ranking que aquellos que buscan vacíos legales que explotar.
Si cree que algún sitio está vulnerando las directrices de calidad de Google, por favor, avísenos en la página http://www.google.com/intl/es/spamreport.html <spamreport.html>. Google prefiere desarrollar soluciones escalables y automatizadas a los problemas. Por lo tanto, intentamos minimizar la lucha directa contra sitios fraudulentos. Los informes sobre sitios fraudulentos que recibimos se utilizan para crear algoritmos escalables que reconozcan y bloqueen intentos futuros de generar sitios fraudulentos.
Verdades y mentiras de Google
Mentira: La publicidad en Google afecta a mis rankings en los resultados de búsqueda.
Verdad: La publicidad en Google no tiene ninguna influencia, ni positiva ni negativa, sobre los rankings de un sitio en Google.
Mentira: Si me uno a un intercambio de vínculos o programa de vínculos "gratuitos para todos" incrementaré mis rankings.
Verdad: Los esquemas de vínculos no aumentan el valor de PageRank de un sitio dado y, con frecuencia, son perjudiciales para el mismo. Muchos de los sitios que hacen publicidad de programas que comparten vínculos ofrecen pocas ventajas pero distribuyen su dirección de correo electrónico sin autorización, lo que tiene como consecuencia una mayor cantidad de correo no deseado dirigido a usted.
Mentira: Los programas de "comprobación de ranking" automatizados representan una buena solución para que los webmasters ahorren tiempo y midan su "presencia online".
Verdad: Los programas de "comprobación de ranking" automatizados vulneran los términos del servicio de Google </terms.html> de Google. al utilizar recursos de servidor que deben reservarse para responder a las solicitudes de los usuarios. Solicitamos encarecidamente que no utilice programas de comprobación de ranking para verificar su posición en Google.
Mentira: Un competidor puede estropear de algún modo el ranking de un sitio o hacer que éste sea eliminado del índice de Google.
Verdad: No hay prácticamente nada que pueda hacer un competidor para perjudicar su ranking o eliminar su sitio de nuestro índice. Su clasificación e inclusión dependen de factores bajo su control como webmaster, como la elección de contenido y el diseño del sitio.
Mentira: Un sitio Web puede ser eliminado del índice de Google, si su URL se envía con excesiva frecuencia.
Verdad: No requerimos el envío de sitios ni penalizamos los que nos llegan con excesiva frecuencia. Tiene la libertad de enviarnos su URL el número de veces que desee. No obstante, dada la naturaleza de nuestro proceso de inclusión, su tiempo sería más productivo si lo empleara para mejorar el contenido y los vínculos de su sitio.
Mentira: Los sitios que utilizan ASP (u algún otro tipo de archivo que no sea HTML) no se incluyen en el índice de Google.
Verdad: En Google, podemos indexar la mayoría de los tipos de páginas y archivos, con pocas excepciones. Entre los tipos de archivos que podemos indexar se incluyen: pdf, asp, jsp, hdml, shtml, xml, cfm, doc, xls, ppt, rtf, wks, lwp y wri.
Optimizadores de motor de búsqueda
SEO es la abreviatura en inglés de "optimizador de motor de búsqueda". Muchos SEO ofrecen servicios de gran utilidad para los propietarios de un sitio Web, servicios que van desde la copia hasta sugerencias sobre la arquitectura del sitio y ayuda sobre cómo encontrar directorios relevantes a los que se puede enviar un sitio. No obstante, existen algunos SEO pocos éticos que han afectado negativamente a la industria debido a actividades de marketing demasiados agresivas e intentos de manipular injustamente los resultados de los motores de búsqueda.
Aunque Google no tiene relaciones con ningún SEO y no ofrece recomendaciones, sí tenemos algunas sugerencias que le ayudarán a distinguir un SEO que mejoraría su sitio de otro que solamente contribuiría a la eliminación definitiva de éste de los resultados de los motores de búsqueda.
Desconfíe de compañías de SEO que le envíen correo electrónico no solicitado.
Sorprendentemente, nosotros también recibimos este tipo de mensajes:
"Estimado google.com:
He visitado su sitio Web y he comprobado que no está incluido en la mayoría de los principales motores de búsqueda y directorios..."
Sea tan escéptico con el correo no solicitado sobre motores de búsqueda como lo es con las pastillas adelgazantes que "queman grasas mientras duerme" o las solicitudes para ayudar a transferir fondos de dictadores depuestos.
Nadie puede garantizarle el puesto número 1 en el ranking de Google.
Desconfíe de SEO que dicen garantizar rankings, que afirman tener una "relación especial" con Google o que proclaman que disponen de un "envío con prioridad" a nuestro buscador. Google no acepta ningún envío con prioridad. De hecho, la única manera de enviar un sitio directamente a Google es a través de la página http://www.google.es/intl/es/addurl.html </intl/es/addurl.html>. Esto lo puede hacer usted mismo sin coste alguno.
Desconfíe de una compañía amante del secretismo o que no explica claramente sus intenciones.
Pida explicaciones si algo no le queda claro. Si un SEO crea contenido engañoso o falso en su nombre, como páginas puerta o dominios "descartables", puede que su sitio quede excluido definitivamente del índice de Google. En última instancia, usted es el responsable de las acciones de las compañías que contrata. Por lo tanto, es mejor asegurarse de que sabe exactamente cómo piensan "ayudarle" éstas.
Nunca debe tener un vínculo a un SEO.
Evite SEO que hablan sobre la eficacia de los vínculos "gratuitos para todos", esquemas de popularidad de vínculos o el envío de su sitio a miles de motores de búsqueda. Normalmente, se trata de prácticas inútiles que no afectan en absoluto a su ranking en los resultados de los principales motores de búsqueda. Al menos, no de una manera que se podría considerar positiva.
Puede que algunos SEO intenten venderle la capacidad de escribir palabras clave directamente en la barra de direcciones del navegador.
La mayoría de este tipo de ofertas requiere que los usuarios instalen software adicional, y pocos usuarios lo hacen. Evalúe este tipo de propuestas con especial atención y mantenga su escepticismo sobre el número de usuarios que, según se proclama en el sitio, han descargado las aplicaciones necesarias.
Elija con cuidado.
Al considerar si va a contratar un SEO, se recomienda realizar algunas averiguaciones sobre el sector. Evidentemente, Google le proporciona una manera de hacerlo. También puede consultar algunas de las historias aparecidas en la prensa que conminan a actuar con precaución, incluido este artículo sobre un SEO particularmente agresivo: <http://www.salon.com/tech/feature/2002/07/01/spyware_inc/index.html> (sólo disponible en inglés). Aunque Google no hace comentarios sobre compañías específicas, hemos encontrado empresas que se llaman SEO y que presentan prácticas comerciales claramente inaceptables. Tenga cuidado.
Asegúrese de comprender a dónde va su dinero.
Aunque Google nunca vende un ranking mejor en nuestros resultados de búsqueda, hay muchos otros motores de búsqueda que combinan resultados de pago por clic o pago por inclusión con sus resultados de búsqueda Web normales. Algunos SEO prometerán un ranking elevado en motores de búsqueda, pero lo colocarán en la sección publicitaria del mismo en lugar de en los resultados. Algunos SEO incluso cambian en tiempo real sus precios de oferta para crear la ilusión de que "controlan" otros motores de búsqueda y de que pueden colocarse en el lugar deseado. Esta trampa no funciona con Google, ya que nuestra publicidad está claramente marcada y separada de nuestros resultados de búsqueda. No obstante, asegúrese de preguntar a cualquier SEO que esté considerando contratar las tarifas que se destinarán a una inclusión permanente y las que se destinarán a la publicidad temporal.
Hable con varios SEO y pregunte a otras empresas de este tipo si recomendarían la empresa que usted está considerando contratar.
Las referencias son un buen punto de partida, pero no lo son todo. Debe preguntar a la compañía cuánto tiempo hace que ejerce sus actividades comerciales y cuántos empleados tiene. Si se siente presionado o a disgusto, siga su instinto y actúe con precaución: espere hasta encontrar una empresa en la que pueda confiar. Pregúntele a la empresa SEO si informa a Google sobre todos los usos inadecuados de sitios fraudulentos que encuentra mediante nuestro formulario de reclamaciones contra sitios fraudulentos <spamreport.html>. Las empresas SEO éticas informan sobre los sitios engañosos que vulneran las directrices de Google sobre sitios fraudulentos.
Asegúrese de estar protegido legalmente.
Por su propia seguridad, debe insistir en obtener una garantía completa e incondicional de reembolso. No tenga miedo de pedir un reembolso si no está satisfecho por cualquier motivo o si las acciones del SEO conllevan la eliminación de su sitio del índice de un motor de búsqueda. Asegúrese de disponer de un contrato escrito que incluya las tarifas. El contrato también debe exigir que el SEO respete las directrices recomendadas para la inclusión del sitio en cada motor de búsqueda.
¿Cuáles son los usos inadecuados más comunes que suele sufrir el propietario de un sitio Web?
Un tipo de práctica fraudulenta habitual es la creación de dominios "sombra" que envían usuarios a un sitio mediante redireccionamientos engañosos. Esta clase de dominio frecuentemente será propiedad del SEO que dice estar trabajando en beneficio del cliente. Sin embargo, si la relación se deteriora, el SEO podría apuntar el dominio a un sitio distinto, o incluso al dominio de un competidor. En este caso, el cliente habrá pagado por desarrollar un sitio de la competencia propiedad exclusiva del SEO.
Otra práctica ilícita es la colocación de páginas "puerta" cargadas con palabras clave en algún lugar del sitio Web del cliente. El SEO promete que este proceso hará que la página sea más relevante para un mayor número de consultas. Esta declaración es completamente falsa, ya que las páginas individuales raramente son relevantes para una amplia gama de palabras clave. No obstante, aún más insidioso es que dichas páginas puerta a menudo contienen vínculos ocultos que apuntan también a los otros clientes del SEO. Este tipo de páginas reduce la popularidad del vínculo de un sitio y la redirecciona al SEO y sus otros clientes, entre los que pueden incluirse sitios con contenido indeseable o ilegal.
¿En qué debo fijarme?
Existen algunas señales de advertencia que indican que podría estar tratando con un SEO sin escrúpulos. No se trata de una lista exhaustiva. Por lo tanto, ante cualquier duda, debe seguir su instinto. No dude en romper la relación si el SEO:
Es propietario de dominios sombra
Coloca vínculos a sus otros clientes en páginas puerta
Ofrece vender palabras clave en la barra de direcciones
No distingue entre los verdaderos resultados de búsqueda y los anuncios que aparecen en ellos
Garantiza un ranking concreto pero solamente para frases de palabras clave extrañas y largas que
usted obtendría de todos modos
Funciona con múltiples alias o información falsificada sobre quién es
Obtiene tráfico de motores de búsqueda "falsos", spyware o scumware
Se han eliminado dominios suyos del índice de Google o él mismo n
Preguntas de webmaster
1. ¿Qué es el encubrimiento?
El término "encubrimiento" se utiliza para describir un sitio Web que devuelve páginas Web alteradas a los motores de búsqueda que lo rastrean. Es decir, el servidor Web está programado para devolver a Google contenido distinto al que ven los usuarios normales, normalmente para intentar distorsionar los rankings del motor de búsqueda. Esto puede dar a los usuarios una impresión errónea respecto a lo que encontrarán al hacer clic en un resultado de búsqueda. Para mantener la exactitud y la calidad de nuestros resultados de búsqueda, Google puede excluir permanentemente de nuestro índice los sitios o autores de sitios que practican el encubrimiento con el fin de distorsionar sus rankings de búsqueda.
2. ¿Necesito enviar a Google páginas o vínculos actualizados u obsoletos?
Google actualiza su índice con frecuencia. Por lo tanto, no es necesario enviar vínculos actualizados u obsoletos. Detectaremos los cambios en su sitio durante el próximo rastreo.
3. ¿Cómo puedo enviar varias páginas?
Por favor, visite nuestra página Añadir URL </addurl.html> para introducir sus URL. No es necesario enviar cada página individual; la página de nivel superior del dominio es suficiente. Nuestro rastreador, Googlebot, se encarga de lo demás.
4. ¿Por qué Google no indexa ninguna de mis páginas?
Si sus páginas aún no se han indexado, es probable que se deba a que no hay páginas suficientes en la Web que enlacen con ellas. Google se centra en la interconectividad de vínculos entre las páginas y confía en la amplitud y libertad de Internet para devolver los resultados de búsqueda más relevantes. Si no hay otras páginas que enlacen con las suyas, no podemos asignar un valor de PageRank (nuestra medida patentada de la importancia de una página) a las mismas de manera razonable. Una vez que haya otras páginas que apunten a ellas, encontraremos sus páginas.
5. ¿Cuánto tarda el robot de Google en indexar una URL una vez que ésta se ha enviado?
Según el momento del envío y de nuestro rastreo, el proceso completo puede durar entre seis y ocho semanas.
6. ¿Dónde se encuentra el título de mi página?
A diferencia de muchos motores de búsqueda, Googlebot puede devolver resultados correspondientes a páginas conocidas pero que aún no han sido rastreadas. Dado que todavía no hemos consultado esas páginas, no aparecen sus títulos. En su lugar, la página de resultados de Google muestra la URL.
7. ¿Cómo debo solicitar que Google no devuelva material en caché desde mi sitio?
Google almacena muchas páginas Web en su caché para recuperarlas como copia de seguridad para los usuarios en caso de que el servidor en el que se aloja la página falle temporalmente. Los usuarios pueden ver la versión en caché seleccionando el vínculo "En caché" de la página de resultados. Si no desea que se pueda acceder a su contenido a través del caché de Google, utilice un código <META> con el atributo CONTENT="NOARCHIVE". Para ello, coloque la siguiente línea en la sección <HEAD> de sus documentos:
<META NAME="ROBOTS" CONTENT="NOARCHIVE">
Este código indicará a los robots que no deben archivar la página. Google seguirá indexando y siguiendo los vínculos de la página, pero no presentará a los usuarios material en caché. Si desea que otros robots coloquen en caché su contenido pero no que lo hagan los robots de Google, utilice el código siguiente:
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
Por favor, tenga en cuenta que el cambio surtirá efecto la próxima vez que Google rastree la página que presenta la directiva NOARCHIVE en un código <META>. Si desea que el cambio se realice antes, el propietario del sitio debe contactarnos y solicitar la eliminación inmediata del contenido archivado. Tenga en cuenta también que la directiva NOARCHIVE sólo controla si una versión en caché de una página estará disponible. Para controlar si se debe indexar la página, utilice CONTENT="NOINDEX". Para controlar si se deben seguir los vínculos, utilice CONTENT="NOFOLLOW". Para obtener más información, consulte la página Robots Exclusion <http://www.robotstxt.org/wc/exclusion.html> (Exclusión de robots; sólo disponible en inglés).
Preguntas sobre la tecnología Googlebot
1. ¿Cómo puedo solicitar que Google no rastree mi sitio o una parte de él?
El estándar para la exclusión de robots que se encuentra en <http://www.robotstxt.org/wc/norobots.html> proporciona un archivo denominado robots.txt que usted puede colocar en su servidor para excluir Googlebot y otros rastreadores Web (Googlebot tiene un agente usuario de "Googlebot").
Además, Googlebot comprende algunas extensiones del estándar robots.txt. Entre los patrones para desautorizar se puede incluir * para que coincidan con cualquier secuencia de caracteres. Además, dichos patrones pueden terminar en $ para indicar el final de un nombre. Por ejemplo, para evitar que Googlebot rastree archivos que terminan en .gif, puede utilizar la siguiente entrada de robots.txt:
User-Agent: Googlebot
Disallow: /*.gif$
Por favor, tenga en cuenta que Googlebot no interpreta una respuesta 401/403 ("Sin autorización"/"Prohibido") a una recuperación de robots.txt como una solicitud para no rastrear las páginas del sitio. Para evitar que Googlebot y otros rastreadores Web rastreen las páginas de su sitio, puede utilizar la siguiente entrada de robots.txt:
User-Agent: *
Disallow: /
Por favor, tenga en cuenta también que cada puerto debe disponer de su propio archivo robots.txt. En particular, si ofrece contenido a través de http y https, necesitará un archivo robots.txt independiente para cada uno de estos protocolos. Por ejemplo, si desea permitir que se ofrezcan todos los tipos de archivo vía http pero que sólo las páginas .html se ofrezcan vía https, el archivo de robots.txt del protocolo http (http://suservidor.com/robots.txt) sería:
User-Agent: *
Allow: /
El archivo robots.txt para el protocolo https (https://suservidor.com/robots.txt) sería:
User-Agent: *
Disallow: /
Allow: /*.html$
Otro estándar más conveniente para el uso de una página cada vez implica la adición de un código <META> a una página HTML para avisar a los robots de que no deben indexar la página o seguir los vínculos que ésta contiene. Este estándar se describe en <http://www.robotstxt.org/wc/exclusion.html> (sólo disponible en inglés). También puede leer la información incluida en el estándar HTML <http://www.w3.org/TR/REC-html40/appendix/notes.html> (sólo disponible en inglés) acerca de estos códigos. Recuerde que cambiar el archivo robots.txt de su servidor o al cambiar los códigos <META> de sus páginas no provocará un cambio inmediato en los resultados que devuelve Google. Esto se debe a que los cambios deben propagarse en el próximo índice Web de Google antes de reflejarse en los resultados de búsqueda de Google.
2. ¿Por qué Googlebot solicita un archivo denominado robots.txt que no se encuentra en mi servidor?
robots.txt es un documento estándar que notifica a Googlebot que no debe descargar información total o parcialmente de su servidor Web. Para obtener información sobre cómo crear un archivo robots.txt, consulte The Robot Exclusion Standard <http://www.robotstxt.org/wc/norobots.html> (Estándar de exclusión de robots; sólo disponible en inglés).
3. ¿Por qué Googlebot intenta descargar vínculos incorrectos de mi servidor o de un servidor que no existe?
Hay que tener en cuenta que muchos vínculos de la Web estarán rotos u obsoletos en un momento dado. Cuando un usuario publica un vínculo incorrecto que apunta a su sitio (debido quizá a un error de ortografía o de mecanografiado) o no actualice sus páginas para reflejar los cambios en su servidor, Googlebot intentará descargar un vínculo incorrecto desde su sitio. Ésta es otra razón por la cual puede obtener resultados en una máquina que no es un servidor Web.
4. ¿Por qué Googlebot descarga información de nuestro servidor Web "secreto"?
Es casi imposible mantener un servidor Web "secreto" no publicando vínculos hacia él. Cuando un usuario sigue un vínculo desde su servidor "secreto" a otro servidor Web, es probable que su URL "secreta" se incluya en el código de referencia, por lo que podrá ser almacenada y posiblemente publicada por el otro servidor Web en su registro de referencia. Por lo tanto, si existe un vínculo a su servidor o página Web "secretos" en cualquier lugar de la Web, es probable que Googlebot y otros "rastreadores Web" lo encuentren.
5. ¿Por qué Googlebot no obedece a mi archivo robots.txt?
Para ahorrar ancho de banda, Googlebot sólo descarga el archivo robots.txt una vez al día o cuando hemos recogido un número importante de páginas del servidor. Por lo tanto, puede que transcurra un tiempo hasta que Googlebot tenga constancia de los cambios que se podrían haber realizado a su archivo robots.txt. Además, Googlebot se encuentra distribuido en varias máquinas. Cada una de ellas mantiene su propio registro de su archivo robots.txt. También puede comprobar que su sintaxis se ajuste al estándar en: <http://www.robotstxt.org/wc/norobots.html> (sólo disponible en inglés). Si el problema persiste, por favor, avísenos y lo corregiremos.
Por favor, tenga en cuenta que existe una pequeña diferencia entre la manera en que Googlebot utiliza el archivo robots.txt y la manera en que se debería utilizar según el estándar robots.txt (sin olvidar la distinción entre "debería" y "debe"). El estándar indica que deberíamos utilizar la primera regla aplicable, pero Googlebot obedece a la más larga (es decir, la más específica). Esta práctica, más intuitiva, coincide con la conducta real de los usuarios y lo que éstos esperan de nosotros. Por ejemplo, considere utilizar el archivo robots.txt siguiente:
User-Agent: *
Allow: /
Disallow: /cgi-bin
Es evidente que la intención del webmaster es permitir que los robots rastreen todo excepto el directorio /cgi-bin. En consecuencia, es lo que en Google hacemos.
6. ¿Cómo puedo registrar mi sitio con Googlebot para que se incluya en el índice?
Por favor, visite el formulario Añadir URL </addurl.html>.
7. ¿Cómo elimino un sitio de Google?
Google actualiza todo su índice automáticamente de manera regular. Al rastrear la Web, encontramos páginas nuevas, descartamos vínculos muertos y actualizamos los nuevos automáticamente. Es probable que los vínculos ahora obsoletos "desaparezcan" de nuestro índice durante el próximo rastreo. Para obtener información detallada sobre cómo eliminar o suprimir del caché una página en Google, haga clic aquí </remove.html>.
8. Necesito ayuda. Googlebot rastrea mi sitio demasiado rápido. ¿Qué puedo hacer?
Por favor, envíe un mensaje de correo electrónico a googlebot@google.com <mailto:googlebot@google.com> con el nombre de su sitio y una descripción detallada del problema. Por favor, incluya también una parte del registro Web que muestra los accesos a Google. De este modo, podremos localizar el problema con mayor rapidez.
9. ¿Por qué se producen resultados desde múltiples máquinas en Google.com, todas con el agente usuario Googlebot?
Googlebot se ha diseñado para distribuirse en varias máquinas para mejorar el rendimiento y adaptarse al crecimiento de la Web.
10. ¿Pueden darme las direcciones IP desde las que Googlebot realiza los rastreos para que pueda filtrar mis registros?
Las direcciones IP utilizadas por Googlebot cambian de vez en cuando. La mejor manera de identificar los accesos de Googlebot es utilizar el agente usuario (Googlebot).
11. ¿Cómo bloqueo de mi sitio todos los rastreadores excepto Googlebot?
El siguiente archivo robots.txt realizará esta acción en todos los rastreadores que se comporten correctamente.
User-agent: *
Disallow: /
User-agent: Googlebot
Allow: /
12. ¿Cómo puedo notificar a Googlebot que no debe rastrear páginas generadas dinámicamente en mi sitio?
Lo logrará con el siguiente archivo robots.txt.
User-agent: Googlebot
Disallow: /*?
13. No encuentro la respuesta a mi pregunta. ¿Dónde la puedo enviar?
Por favor, visite nuestra página Envíenos un mensaje </contact.html> para buscar el lugar adecuado al que enviar su pregunta.
Para obtener más respuestas, consulte la página Robots FAQ <http://www.robotstxt.org/wc/faq.html> (Preguntas más frecuentes sobre robots; sólo disponible en inglés).
Red House Javea : Houses and Villas Inmobiliaria Javea
|