Guía del rastreador TechSEO360: mapas del sitio y auditorías técnicas de SEO
Publicado: 2019-05-21Desde hace 10 años, el rastreador que utilizo para las auditorías técnicas de SEO de sitios web que realizo en Search Engine People es lo que hoy en día se llama TechSEO360. Una joya escondida; rentable, eficiente (rastrea cualquier sitio de cualquier tamaño), con visión de futuro (por ejemplo: tenía soporte AJAX antes que otras herramientas de rastreo similares). He escrito sobre este rastreador de sitios web antes, pero quería hacer una publicación todo en uno más completa.
Explicación de TechSEO360
TechSEO360 es un rastreador técnico de SEO que destaca:
- Software nativo para Windows y Mac.
- Puede rastrear sitios web muy grandes de forma inmediata.
- Configuración de orugas flexible para aquellos que la necesitan.
- Use informes integrados o personalizados para analizar los datos recopilados del sitio web (aunque generalmente confío en exportar todos los datos a Excel y usar sus poderosos filtros, pivote, formato automático, etc.).
- Cree mapas de sitio XML de imagen, video y hreflang además de mapas de sitio visuales.
Cómo está estructurada esta guía
Esta guía cubrirá todas las funciones de SEO más importantes que se encuentran en este software.
- Usaremos el sitio web de demostración https://Crawler.TechSEO360.com en todos nuestros ejemplos.
- Todas las capturas de pantalla serán de la versión de Windows, pero la versión de Mac contiene las mismas funciones y herramientas.
- Usaremos TechSEO360 en su modo gratuito, que es el estado al que se cambia cuando finaliza la prueba gratuita inicial de 30 días totalmente funcional.
- Usaremos la configuración predeterminada para el rastreo y el análisis del sitio web, a menos que se indique lo contrario.
- Comenzaremos mostrando cómo configurar el rastreo del sitio y luego pasaremos a SEO técnico, informes y mapas del sitio.
Configuración e inicio del rastreo
La mayoría de los sitios se rastrearán bien cuando utilicen la configuración predeterminada. Esto significa que la única configuración requerida generalmente será ingresar la ruta del sitio web que desea analizar, ya sea que resida en Internet, un servidor local o un disco local. 
Como alternativa fácil a la configuración manual, también es posible aplicar varios "ajustes preestablecidos rápidos" que configuran los ajustes subyacentes. Ejemplos podrían ser:
- Sabe que desea crear un mapa del sitio de video y quiere asegurarse de que puede generar lo mejor posible.
- Utiliza un CMS de sitio web específico que genera muchas URL de contenido delgado que deben excluirse.

Para aquellos que quieran sumergirse en la configuración, pueden afirmar un control casi completo del proceso de rastreo, que incluye:
Motor de orugas
Aquí es donde puede jugar con los aspectos internos más profundos de cómo se realizan las solicitudes HTTP. Una cosa en particular es cómo puede aumentar la velocidad de rastreo: simplemente aumente la cantidad de subprocesos simultáneos y conexiones simultáneas; solo asegúrese de que su computadora y sitio web puedan manejar la carga adicional. 
Filtros para webmasters
Controle hasta qué punto el rastreador debe obedecer a noindex, nofollow, robots.txt y similares. 
Filtros de análisis
Configure reglas para las cuales las URL deben analizar su contenido. Hay múltiples opciones de filtrado "excluir" y "limitar a" disponibles, incluidos patrones de URL, extensiones de archivo y tipos MIME. 
Filtros de salida
Similar a "Escanear sitio web | Filtros de análisis", pero en su lugar se utiliza para controlar qué URL se "etiquetan" para su eliminación cuando finaliza el rastreo de un sitio web. 
Las direcciones URL excluidas por las opciones que se encuentran en "Escanear sitio web | Filtros de webmaster" y "Escanear sitio web | Filtros de salida" todavía se pueden conservar y mostrar después de que se detenga el rastreo del sitio web si la opción "Escanear sitio web | Opciones de rastreador | Aplicar filtros de webmaster y de salida después del escaneo del sitio web se detiene" está desmarcado. Con esta combinación usted:
- Consigue conservar toda la información recopilada por el rastreador, para que puedas inspeccionarlo todo.
- Aún así, evite que se incluyan las URL al crear mapas de sitio HTML y XML.
- Todavía obtenga el "etiquetado" adecuado para cuando haga informes y exporte.
Progreso de rastreo
Durante el rastreo del sitio web, puede ver varias estadísticas que muestran cuántas URL han analizado su contenido, cuántas han resuelto sus enlaces y referencias y cuántas URL aún están esperando en las colas. 
Descripción general del sitio web después del rastreo
Después de que finaliza el rastreo de un sitio, el programa abre una vista con columnas de datos a la izquierda: 
Si selecciona una URL, puede ver más detalles a la derecha: 
Aquí hay una miniatura de cómo puede verse en una pantalla de tamaño completo: 
Lado izquierdo
Aquí encontrará las URL y los datos asociados encontrados durante el escaneo del sitio web. De forma predeterminada, solo se muestran algunas de las columnas de datos más importantes. Encima de esto hay un panel que consta de cinco botones y un cuadro de texto. Sus propósitos son:
#1
Menú desplegable con "informes rápidos" predefinidos. Estos se pueden utilizar para configurar rápidamente:
- Qué columnas de datos son visibles.
- Qué "opciones de filtro rápido" están habilitadas.
- El "texto de filtro rápido" activo para limitar aún más lo que se muestra.

#2
Menú desplegable para cambiar entre mostrar todas las URL en el sitio web como una "lista" plana o como un "árbol". 
#3
Menú desplegable para configurar qué columnas de datos son visibles. 
#4
En comparación con lo anterior, habilitar la visibilidad de la columna de datos "Redirecciones a la ruta" se ve así: 
#5
Desplegable para configurar qué "opciones de filtro rápido" se seleccionan. 
#6
Botón de encendido/apagado para activar/desactivar todas las funciones de "filtros rápidos".
#7
Cuadro que contiene el "texto de filtro rápido" que se utiliza para personalizar aún más lo que se muestra.
Más adelante se explicará con ejemplos cómo utilizar la funcionalidad de "informes rápidos" y "filtros rápidos".
Lado derecho
Aquí es donde puede ver detalles adicionales de la URL seleccionada en el lado izquierdo. Esto incluye la lista "Enlazado por" con detalles adicionales, la lista "Enlaces [internos]", la lista "Usado por", el "Resumen del directorio" y más.
Para comprender cómo usar esto al investigar los detalles, compare los siguientes dos escenarios.
#1
A la izquierda, hemos seleccionado la URL http://crawler.techseo360.com/noindex-follow.html ; también podemos ver que el rastreador lo ha etiquetado como "[noindex][follow]" en la columna de datos "URL flags": 
A la derecha dentro de la pestaña "Enlaces [internos]", podemos confirmar que se han seguido todos los enlaces incluidos y ver detalles adicionales . 
#2
A la izquierda hemos seleccionado la URL http://crawler.techseo360.com/nofollow.html ; también podemos ver que el rastreador lo ha etiquetado como "[index][nofollow]" en la columna de datos "URL flags".: 
A la derecha dentro de la pestaña "Enlaces [internos]", podemos confirmar que no se ha seguido ningún enlace . 
Uso de informes rápidos
Como dije, no los uso a menudo, prefiero Mostrar todas las columnas de datos y luego exportar a Excel. Pero para aquellos a quienes les gustan este tipo de informes integrados en otras herramientas, estos son algunos de los informes rápidos disponibles más utilizados:
Todos los tipos de redireccionamientos
El "informe rápido" incorporado para mostrar todo tipo de redireccionamientos, incluida la información necesaria para seguir las cadenas de redireccionamiento: 
Esencialmente esto tiene:
- Cambió la visibilidad de las columnas de datos a las más apropiadas.
- Establezca el texto del filtro en:
[httpredirect|canonicalredirect|metarefreshredirect] -[noindex] 200 301 302 307 - Filtros activados:
-
Only show URLs with all [filter-text] found in "URL state flags" column -
Only show URLs with any filter-text-number found in "response code" column
-
Con esto una URL tiene que cumplir las siguientes tres condiciones para ser mostrada:

- Tiene que apuntar a otra URL mediante una redirección HTTP, una instrucción canónica o una metaactualización de "0 segundos".
- No puede contener una instrucción "noindex".
- Debe tener el código de respuesta 200, 301, 302 o 307.
404 No encontrado
Si necesita identificar rápidamente enlaces rotos y referencias de URL, este informe es una buena opción. Con esto, las columnas de datos "Linked.List" (p. ej., etiqueta "a"), "Used.List" (p. ej., atributo "src") y "Redirected.List" se hacen visibles. 
Sin índice
Vea rápidamente todas las páginas con la instrucción "noindex". 
Títulos duplicados #1
Vea rápidamente todas las páginas con títulos duplicados, incluidas aquellas con títulos vacíos duplicados. 
Títulos duplicados #2
Si no se anula con otros filtros, el texto del filtro coincide con el contenido dentro de todas las columnas de datos visibles. Aquí hemos reducido nuestro informe de títulos duplicados a aquellos que contienen la palabra "ejemplo". 
Recuento de caracteres del título
Limite las URL mostradas por el número de caracteres del título. Puede controlar el umbral y si está por encima o por debajo. Similar está disponible para las descripciones. 
Recuento de píxeles del título
Limite las URL mostradas por el número de píxeles del título. Puede controlar el umbral y si está por encima o por debajo. Similar está disponible para las descripciones. 
Imágenes y texto alternativo/anclaje faltante
Solo muestre URL de imágenes que se usaron sin ningún texto alternativo o vinculadas sin ningún texto de anclaje. 
Otras herramientas
Análisis en la página
De forma predeterminada, se realiza un análisis de texto completo en todas las páginas durante el rastreo del sitio web. La opción encontrada para esto reside en "Escanear sitio web | Recopilación de datos" que da resultados como estos: 
Sin embargo, siempre puede analizar páginas individuales sin rastrear todo el sitio web: 
Tenga en cuenta que puede ver qué palabras clave y frases están orientadas en todo un sitio web si utiliza el botón "sumar puntajes para páginas seleccionadas".
Listas de palabras clave
Un creador de listas de palabras clave flexible que permite combinar listas de palabras clave y realizar una limpieza integral. 
Herramientas en línea de terceros
Si necesita más herramientas, puede agregarlas usted mismo e incluso decidir cuáles deberían ser accesibles mediante pestañas en lugar de solo el menú desplegable. 
El software pasará automáticamente la URL seleccionada o similar a la herramienta en línea seleccionada. Cada herramienta en línea está configurada por un archivo de texto que define qué datos se pasan y cómo se hace.
Mapas del sitio
Tipos de archivos de mapa del sitio
Con 13 formatos de archivo de mapa de sitio distintos, es probable que sus necesidades estén cubiertas. Esto incluye mapas de sitio XML, mapas de sitio de video y mapas de sitio de imagen. 
Mapas de sitio XML y Hreflang
Incluso si su sitio web no incluye ningún marcado hreflang, TechSEO360 a menudo podrá generar mapas de sitio XML con información hreflang alternativa adecuada si sus URL contienen partes que incluyen una referencia al idioma, la cultura o el país. 
Sitemaps de imagen y vídeo XML
Por lo general, puede acelerar su configuración utilizando uno de los "Preajustes rápidos":
- Mapa del sitio de vídeo de Google
- Mapa del sitio de video de Google (el sitio web tiene videos alojados externamente)
- Mapa del sitio de imágenes de Google
- Mapa del sitio de imágenes de Google (el sitio web tiene imágenes alojadas externamente)
Si tiene la intención de crear mapas de sitio de imágenes y videos, use una de las opciones de video, ya que también incluyen toda la configuración óptima para mapas de sitios de imágenes.
TechSEO360 usa diferentes métodos para calcular qué páginas, videos e imágenes pertenecen juntos en los mapas de sitio XML generados, algo que puede ser complicado si una imagen o video se usa en varios lugares.
Mapas del sitio HTML
Seleccione de las plantillas HTML integradas o diseñe la suya propia, incluido el código HTML/CSS/JS real y varias opciones utilizadas al crear los mapas del sitio. 
Otra funcionalidad
Soporte Javascript y AJAX
Puede configurar TechSEO360 para buscar código Javascript para referencias de archivos y URL marcando la opción "Escanear sitio web | Opciones de rastreador | Intentar buscar dentro de Javascript".
Si se trata de un sitio web AJAX, puede cambiar a una solución habilitada para AJAX en "Escanear sitio web | Motor de rastreo | Tipo de ruta y controlador predeterminados".
Búsqueda personalizada de texto y código
A menudo, puede ser útil buscar texto y código en todo un sitio web, por ejemplo, para encontrar páginas utilizando el código antiguo de Google Analytics o similar.
Puede configurar búsquedas múltiples en "Escanear sitio web | Recopilación de datos" | Busque cadenas personalizadas, código y patrones de texto".
Los resultados se muestran en la columna de datos "Búsquedas personalizadas de página" que muestra un recuento para cada búsqueda, opcionalmente con el contenido extraído de la coincidencia de patrones.
Puntuación de importancia calculada
TechSEO360 calcula la importancia de todas las páginas en función de los enlaces internos y los redireccionamientos internos.
Puede ver esto habilitando la visibilidad de la columna de datos "Puntuación de importancia escalada".
Detección de contenido similar
A veces, las páginas son similares pero no son duplicados exactos. Para encontrarlos, puede habilitar la opción "Escanear sitio web | Recopilación de datos | Seguimiento y almacenamiento de datos extendidos | Realizar análisis de palabras clave para todas las páginas" antes de escanear.
Al ver los resultados, habilite la visibilidad de la columna de datos "Duplicados de contenido de página (vista visual)" y obtendrá una representación gráfica del contenido.
Interfaz de línea de comandos (CLI)
Si está utilizando la versión de prueba o de pago, puede utilizar la línea de comandos; este es un ejemplo:
"techseo.exe" -exit -scan -build ":my-project.ini" @override_rootpath=http://example.com@
Lo anterior pasa un archivo de proyecto con todas las opciones definidas, anula el dominio del sitio web e indica a TechSEO360 que ejecute un rastreo completo, cree mapas de sitios y salga.
Importación de datos
La funcionalidad "Archivo | Importar..." funciona de forma inteligente y se puede utilizar para:
- Importar listas de URL. Si las URL importadas son de dominios mixtos, TechSEO360 determinará si hay un dominio principal e importará adecuadamente en las pestañas "Interno" y "Externo".
- TechSEO360 también puede detectar varias otras fuentes de datos cuyo contenido se agregará a los datos existentes:
- El servidor Apache inicia sesión para "etiquetar" las URL visitadas por GoogleBot "[googlebot]" y detectar las URL no vinculadas internamente/usadas "[huérfanas]".
- Las Herramientas para webmasters de Google exportan a "etiquetas" URL indexadas por Google "[googleindexed]" y datos de clics e impresiones.
- Majestuosas exportaciones de CSV para datos de puntuación de backlinks.
El "[...]" anterior puede ser utilizado por el "texto de filtros rápidos" para generar más informes personalizados.
Exportación de datos
La funcionalidad "Archivo | Exportar..." puede exportar datos a CSV, Excel, HTML y más dependiendo de lo que esté exportando. Usar:
- Seleccione el control con los datos que desea exportar.
- Aplique opciones para que el control solo contenga los datos que desea exportar. (Esto puede incluir, por ejemplo, "columnas de datos", "opciones de filtro rápido" y "texto de filtro rápido")
- Haga clic en el botón "Exportar" y ahora tiene los datos que desea en el formato que desea.
Precios de TechSEO360
Hay esencialmente tres estados diferentes:
- Cuando descarga el software por primera vez, obtiene una prueba gratuita de 30 días completamente funcional.
- Cuando caduca la versión de prueba, continúa funcionando en modo gratuito, lo que permite rastrear 500 páginas en sitios web.
- Al comprar, el precio de suscripción anual es de $ 99 para una licencia de usuario único que se puede usar tanto en Windows como en Mac.
Puede descargar la versión de prueba para Windows y Mac en https://TechSEO360.com .
