Guía del rastreador TechSEO360: mapas del sitio y auditorías técnicas de SEO

Publicado: 2019-05-21

Desde hace 10 años, el rastreador que utilizo para las auditorías técnicas de SEO de sitios web que realizo en Search Engine People es lo que hoy en día se llama TechSEO360. Una joya escondida; rentable, eficiente (rastrea cualquier sitio de cualquier tamaño), con visión de futuro (por ejemplo: tenía soporte AJAX antes que otras herramientas de rastreo similares). He escrito sobre este rastreador de sitios web antes, pero quería hacer una publicación todo en uno más completa.

Explicación de TechSEO360

TechSEO360 es un rastreador técnico de SEO que destaca:

  • Software nativo para Windows y Mac.
  • Puede rastrear sitios web muy grandes de forma inmediata.
  • Configuración de orugas flexible para aquellos que la necesitan.
  • Use informes integrados o personalizados para analizar los datos recopilados del sitio web (aunque generalmente confío en exportar todos los datos a Excel y usar sus poderosos filtros, pivote, formato automático, etc.).
  • Cree mapas de sitio XML de imagen, video y hreflang además de mapas de sitio visuales.

Cómo está estructurada esta guía

Esta guía cubrirá todas las funciones de SEO más importantes que se encuentran en este software.

  • Usaremos el sitio web de demostración https://Crawler.TechSEO360.com en todos nuestros ejemplos.
  • Todas las capturas de pantalla serán de la versión de Windows, pero la versión de Mac contiene las mismas funciones y herramientas.
  • Usaremos TechSEO360 en su modo gratuito, que es el estado al que se cambia cuando finaliza la prueba gratuita inicial de 30 días totalmente funcional.
  • Usaremos la configuración predeterminada para el rastreo y el análisis del sitio web, a menos que se indique lo contrario.
  • Comenzaremos mostrando cómo configurar el rastreo del sitio y luego pasaremos a SEO técnico, informes y mapas del sitio.

Configuración e inicio del rastreo

La mayoría de los sitios se rastrearán bien cuando utilicen la configuración predeterminada. Esto significa que la única configuración requerida generalmente será ingresar la ruta del sitio web que desea analizar, ya sea que resida en Internet, un servidor local o un disco local.
rastreador de inicio
Como alternativa fácil a la configuración manual, también es posible aplicar varios "ajustes preestablecidos rápidos" que configuran los ajustes subyacentes. Ejemplos podrían ser:

  • Sabe que desea crear un mapa del sitio de video y quiere asegurarse de que puede generar lo mejor posible.
  • Utiliza un CMS de sitio web específico que genera muchas URL de contenido delgado que deben excluirse.

ajustes preestablecidos de configuración del rastreador
Para aquellos que quieran sumergirse en la configuración, pueden afirmar un control casi completo del proceso de rastreo, que incluye:

Motor de orugas

Aquí es donde puede jugar con los aspectos internos más profundos de cómo se realizan las solicitudes HTTP. Una cosa en particular es cómo puede aumentar la velocidad de rastreo: simplemente aumente la cantidad de subprocesos simultáneos y conexiones simultáneas; solo asegúrese de que su computadora y sitio web puedan manejar la carga adicional.
configuración del motor de oruga

Filtros para webmasters

Controle hasta qué punto el rastreador debe obedecer a noindex, nofollow, robots.txt y similares.
obedecer las instrucciones del sitio web

Filtros de análisis

Configure reglas para las cuales las URL deben analizar su contenido. Hay múltiples opciones de filtrado "excluir" y "limitar a" disponibles, incluidos patrones de URL, extensiones de archivo y tipos MIME.
filtros de análisis de rastreadores

Filtros de salida

Similar a "Escanear sitio web | Filtros de análisis", pero en su lugar se utiliza para controlar qué URL se "etiquetan" para su eliminación cuando finaliza el rastreo de un sitio web.
filtros de salida del rastreador
Las direcciones URL excluidas por las opciones que se encuentran en "Escanear sitio web | Filtros de webmaster" y "Escanear sitio web | Filtros de salida" todavía se pueden conservar y mostrar después de que se detenga el rastreo del sitio web si la opción "Escanear sitio web | Opciones de rastreador | Aplicar filtros de webmaster y de salida después del escaneo del sitio web se detiene" está desmarcado. Con esta combinación usted:

  • Consigue conservar toda la información recopilada por el rastreador, para que puedas inspeccionarlo todo.
  • Aún así, evite que se incluyan las URL al crear mapas de sitio HTML y XML.
  • Todavía obtenga el "etiquetado" adecuado para cuando haga informes y exporte.

Progreso de rastreo

Durante el rastreo del sitio web, puede ver varias estadísticas que muestran cuántas URL han analizado su contenido, cuántas han resuelto sus enlaces y referencias y cuántas URL aún están esperando en las colas.
progreso del escaneo del sitio web

Descripción general del sitio web después del rastreo

Después de que finaliza el rastreo de un sitio, el programa abre una vista con columnas de datos a la izquierda:
descripción general de las URL encontradas
Si selecciona una URL, puede ver más detalles a la derecha:
detalles sobre URL específicas
Aquí hay una miniatura de cómo puede verse en una pantalla de tamaño completo:
descripción completa de los resultados del escaneo del sitio web

Lado izquierdo

Aquí encontrará las URL y los datos asociados encontrados durante el escaneo del sitio web. De forma predeterminada, solo se muestran algunas de las columnas de datos más importantes. Encima de esto hay un panel que consta de cinco botones y un cuadro de texto. Sus propósitos son:

#1
Menú desplegable con "informes rápidos" predefinidos. Estos se pueden utilizar para configurar rápidamente:

  • Qué columnas de datos son visibles.
  • Qué "opciones de filtro rápido" están habilitadas.
  • El "texto de filtro rápido" activo para limitar aún más lo que se muestra.

seleccione de informes rápidos predefinidos

#2
Menú desplegable para cambiar entre mostrar todas las URL en el sitio web como una "lista" plana o como un "árbol".
cambiar entre ver URL en formato de lista y árbol

#3
Menú desplegable para configurar qué columnas de datos son visibles.
controlar qué columnas de datos son visibles

#4
En comparación con lo anterior, habilitar la visibilidad de la columna de datos "Redirecciones a la ruta" se ve así:
ejemplo de visibilidad de la columna de datos activada

#5
Desplegable para configurar qué "opciones de filtro rápido" se seleccionan.
opciones de filtro rápido

#6
Botón de encendido/apagado para activar/desactivar todas las funciones de "filtros rápidos".

#7
Cuadro que contiene el "texto de filtro rápido" que se utiliza para personalizar aún más lo que se muestra.

Más adelante se explicará con ejemplos cómo utilizar la funcionalidad de "informes rápidos" y "filtros rápidos".

Lado derecho

Aquí es donde puede ver detalles adicionales de la URL seleccionada en el lado izquierdo. Esto incluye la lista "Enlazado por" con detalles adicionales, la lista "Enlaces [internos]", la lista "Usado por", el "Resumen del directorio" y más.

Para comprender cómo usar esto al investigar los detalles, compare los siguientes dos escenarios.

#1
A la izquierda, hemos seleccionado la URL http://crawler.techseo360.com/noindex-follow.html ; también podemos ver que el rastreador lo ha etiquetado como "[noindex][follow]" en la columna de datos "URL flags":
descripción general de noindex y URL de seguimiento
A la derecha dentro de la pestaña "Enlaces [internos]", podemos confirmar que se han seguido todos los enlaces incluidos y ver detalles adicionales .
noindex y siga los detalles de la URL

#2
A la izquierda hemos seleccionado la URL http://crawler.techseo360.com/nofollow.html ; también podemos ver que el rastreador lo ha etiquetado como "[index][nofollow]" en la columna de datos "URL flags".:
descripción general de las URL indexadas y nofollow
A la derecha dentro de la pestaña "Enlaces [internos]", podemos confirmar que no se ha seguido ningún enlace .
índice y detalles de la URL nofollow

Uso de informes rápidos

Como dije, no los uso a menudo, prefiero Mostrar todas las columnas de datos y luego exportar a Excel. Pero para aquellos a quienes les gustan este tipo de informes integrados en otras herramientas, estos son algunos de los informes rápidos disponibles más utilizados:

Todos los tipos de redireccionamientos

El "informe rápido" incorporado para mostrar todo tipo de redireccionamientos, incluida la información necesaria para seguir las cadenas de redireccionamiento:
Informe de redirección de URL
Esencialmente esto tiene:

  1. Cambió la visibilidad de las columnas de datos a las más apropiadas.
  2. Establezca el texto del filtro en:
    [httpredirect|canonicalredirect|metarefreshredirect] -[noindex] 200 301 302 307
  3. Filtros activados:
    • Only show URLs with all [filter-text] found in "URL state flags" column
    • Only show URLs with any filter-text-number found in "response code" column

Con esto una URL tiene que cumplir las siguientes tres condiciones para ser mostrada:

  1. Tiene que apuntar a otra URL mediante una redirección HTTP, una instrucción canónica o una metaactualización de "0 segundos".
  2. No puede contener una instrucción "noindex".
  3. Debe tener el código de respuesta 200, 301, 302 o 307.

404 No encontrado

Si necesita identificar rápidamente enlaces rotos y referencias de URL, este informe es una buena opción. Con esto, las columnas de datos "Linked.List" (p. ej., etiqueta "a"), "Used.List" (p. ej., atributo "src") y "Redirected.List" se hacen visibles.
Informe de URL no encontradas

Sin índice

Vea rápidamente todas las páginas con la instrucción "noindex".
Informe sin índice de URL

Títulos duplicados #1

Vea rápidamente todas las páginas con títulos duplicados, incluidas aquellas con títulos vacíos duplicados.
informe de títulos duplicados de URL predeterminadas

Títulos duplicados #2

Si no se anula con otros filtros, el texto del filtro coincide con el contenido dentro de todas las columnas de datos visibles. Aquí hemos reducido nuestro informe de títulos duplicados a aquellos que contienen la palabra "ejemplo".
informe de títulos duplicados de URL filtradas

Recuento de caracteres del título

Limite las URL mostradas por el número de caracteres del título. Puede controlar el umbral y si está por encima o por debajo. Similar está disponible para las descripciones.
los caracteres del título cuentan

Recuento de píxeles del título

Limite las URL mostradas por el número de píxeles del título. Puede controlar el umbral y si está por encima o por debajo. Similar está disponible para las descripciones.
recuento de píxeles del título

Imágenes y texto alternativo/anclaje faltante

Solo muestre URL de imágenes que se usaron sin ningún texto alternativo o vinculadas sin ningún texto de anclaje.
imágenes con referencias que faltan alt o texto de anclaje

Otras herramientas

Análisis en la página

De forma predeterminada, se realiza un análisis de texto completo en todas las páginas durante el rastreo del sitio web. La opción encontrada para esto reside en "Escanear sitio web | Recopilación de datos" que da resultados como estos:
Resumen de análisis de contenido y palabras clave de URL
Sin embargo, siempre puede analizar páginas individuales sin rastrear todo el sitio web:
Detalles de análisis de contenido y palabras clave de URL
Tenga en cuenta que puede ver qué palabras clave y frases están orientadas en todo un sitio web si utiliza el botón "sumar puntajes para páginas seleccionadas".

Listas de palabras clave

Un creador de listas de palabras clave flexible que permite combinar listas de palabras clave y realizar una limpieza integral.
listas de palabras clave

Herramientas en línea de terceros

Si necesita más herramientas, puede agregarlas usted mismo e incluso decidir cuáles deberían ser accesibles mediante pestañas en lugar de solo el menú desplegable.
Herramientas en línea de terceros
El software pasará automáticamente la URL seleccionada o similar a la herramienta en línea seleccionada. Cada herramienta en línea está configurada por un archivo de texto que define qué datos se pasan y cómo se hace.

Mapas del sitio

Tipos de archivos de mapa del sitio

Con 13 formatos de archivo de mapa de sitio distintos, es probable que sus necesidades estén cubiertas. Esto incluye mapas de sitio XML, mapas de sitio de video y mapas de sitio de imagen.
formatos de archivo de mapa de sitio admitidos

Mapas de sitio XML y Hreflang

Incluso si su sitio web no incluye ningún marcado hreflang, TechSEO360 a menudo podrá generar mapas de sitio XML con información hreflang alternativa adecuada si sus URL contienen partes que incluyen una referencia al idioma, la cultura o el país.
hreflang en mapas de sitio XML

Sitemaps de imagen y vídeo XML

Por lo general, puede acelerar su configuración utilizando uno de los "Preajustes rápidos":

  • Mapa del sitio de vídeo de Google
  • Mapa del sitio de video de Google (el sitio web tiene videos alojados externamente)
  • Mapa del sitio de imágenes de Google
  • Mapa del sitio de imágenes de Google (el sitio web tiene imágenes alojadas externamente)

Si tiene la intención de crear mapas de sitio de imágenes y videos, use una de las opciones de video, ya que también incluyen toda la configuración óptima para mapas de sitios de imágenes.

TechSEO360 usa diferentes métodos para calcular qué páginas, videos e imágenes pertenecen juntos en los mapas de sitio XML generados, algo que puede ser complicado si una imagen o video se usa en varios lugares.

Mapas del sitio HTML

Seleccione de las plantillas HTML integradas o diseñe la suya propia, incluido el código HTML/CSS/JS real y varias opciones utilizadas al crear los mapas del sitio.
mapas de sitio HTML personalizados

Otra funcionalidad

Soporte Javascript y AJAX

Puede configurar TechSEO360 para buscar código Javascript para referencias de archivos y URL marcando la opción "Escanear sitio web | Opciones de rastreador | Intentar buscar dentro de Javascript".

Si se trata de un sitio web AJAX, puede cambiar a una solución habilitada para AJAX en "Escanear sitio web | Motor de rastreo | Tipo de ruta y controlador predeterminados".

Búsqueda personalizada de texto y código

A menudo, puede ser útil buscar texto y código en todo un sitio web, por ejemplo, para encontrar páginas utilizando el código antiguo de Google Analytics o similar.

Puede configurar búsquedas múltiples en "Escanear sitio web | Recopilación de datos" | Busque cadenas personalizadas, código y patrones de texto".

Los resultados se muestran en la columna de datos "Búsquedas personalizadas de página" que muestra un recuento para cada búsqueda, opcionalmente con el contenido extraído de la coincidencia de patrones.

Puntuación de importancia calculada

TechSEO360 calcula la importancia de todas las páginas en función de los enlaces internos y los redireccionamientos internos.

Puede ver esto habilitando la visibilidad de la columna de datos "Puntuación de importancia escalada".

Detección de contenido similar

A veces, las páginas son similares pero no son duplicados exactos. Para encontrarlos, puede habilitar la opción "Escanear sitio web | Recopilación de datos | Seguimiento y almacenamiento de datos extendidos | Realizar análisis de palabras clave para todas las páginas" antes de escanear.

Al ver los resultados, habilite la visibilidad de la columna de datos "Duplicados de contenido de página (vista visual)" y obtendrá una representación gráfica del contenido.

Interfaz de línea de comandos (CLI)

Si está utilizando la versión de prueba o de pago, puede utilizar la línea de comandos; este es un ejemplo:
"techseo.exe" -exit -scan -build ":my-project.ini" @override_rootpath=http://example.com@
Lo anterior pasa un archivo de proyecto con todas las opciones definidas, anula el dominio del sitio web e indica a TechSEO360 que ejecute un rastreo completo, cree mapas de sitios y salga.

Importación de datos

La funcionalidad "Archivo | Importar..." funciona de forma inteligente y se puede utilizar para:

  • Importar listas de URL. Si las URL importadas son de dominios mixtos, TechSEO360 determinará si hay un dominio principal e importará adecuadamente en las pestañas "Interno" y "Externo".
  • TechSEO360 también puede detectar varias otras fuentes de datos cuyo contenido se agregará a los datos existentes:
    • El servidor Apache inicia sesión para "etiquetar" las URL visitadas por GoogleBot "[googlebot]" y detectar las URL no vinculadas internamente/usadas "[huérfanas]".
    • Las Herramientas para webmasters de Google exportan a "etiquetas" URL indexadas por Google "[googleindexed]" y datos de clics e impresiones.
    • Majestuosas exportaciones de CSV para datos de puntuación de backlinks.

    El "[...]" anterior puede ser utilizado por el "texto de filtros rápidos" para generar más informes personalizados.

Exportación de datos

La funcionalidad "Archivo | Exportar..." puede exportar datos a CSV, Excel, HTML y más dependiendo de lo que esté exportando. Usar:

  • Seleccione el control con los datos que desea exportar.
  • Aplique opciones para que el control solo contenga los datos que desea exportar. (Esto puede incluir, por ejemplo, "columnas de datos", "opciones de filtro rápido" y "texto de filtro rápido")
  • Haga clic en el botón "Exportar" y ahora tiene los datos que desea en el formato que desea.

Precios de TechSEO360

Hay esencialmente tres estados diferentes:

  1. Cuando descarga el software por primera vez, obtiene una prueba gratuita de 30 días completamente funcional.
  2. Cuando caduca la versión de prueba, continúa funcionando en modo gratuito, lo que permite rastrear 500 páginas en sitios web.
  3. Al comprar, el precio de suscripción anual es de $ 99 para una licencia de usuario único que se puede usar tanto en Windows como en Mac.

Puede descargar la versión de prueba para Windows y Mac en https://TechSEO360.com .