¿Qué significan los diferentes elementos que muestran las estadísticas de mi sitio?
El programa de estadísticas que es instalado en su sitio es HTTP-Analyze.
HTTP-Analyze es un analizador de informes (LOG) para servidores web. Analiza el fichero de informe de un servidor web y crea un sumario inteligible de la información encontrada alli. HTTP-Analyze ha sido optimizado para procesar grandes logfiles (ficheros de informe o registro) tan rápido como sea posible.
Abajo le explicamos de forma mas detallada como este potente programa funciona sobre su sitio web, y le proveemos de información sobre los resultados que obtendrá.
El servidor web es un programa que funciona sobre una máquina en red, esperando conexiones del mundo exterior para servir ciertos documentos pedidos a través de un navegador.
Para comunicarse, el servidor y el navegador usan un metodo de comunicación asíncrona llamado HTTP (Protocolo de Hipertexto), que funciona de la forma siguiente:
1. El usuario arranca el navegador y escribe una dirección URL
2. El navegador se conecta a un servidor determinado y pide ese documento
3. El servidor de web maneja la petición y manda la respuesta
si el documento existe, el servidor lo envia
si no existe o su acceso no esta permitido, el servidor devuelve un documento con un mensaje de error
4. El documento enviado como respuesta a esta petición puede contener objetos embebidos. Estos pueden ser URL apuntando a otros recursos, documentos, imagenes, applets, cadenas de audio/ video, o cualquier otro objeto que se pueda direccionar por HTML
El navegador entonces pide todos aquellos objetos embebidos en la página del servidor, usando los métodos 2 y 3 anteriores, antes de mostrar el contenido de la página.
El método de comunicación se llama asíncrono, porque el navegador envia las diferentes peticiones a la vez (sin tener que esperar a haber recibido uno tras otro), utilizando diferentes canales de comunicación.
Desde que las peticiones del navegador son amenudo manejadas por diferentes procesos o hilos del servidor , no existe ninguna relación entre las entradas en el fichero de informe causado por las respuestas del servidor a las peticiones del documento y sus objetos embebidos.
Por ejemplo, la orden por la que el servidor marca una transmision exitosa del documento y sus imágenes contenidas en él no son predecibles y dependen del tipo de documento, objetos, velocidad del servidor, carga del sistema y de red y otros muchos parámetros.
--------------------------------------------------------------------------------
Todos y cada una de las respuestas del servidor , ya sea exito, error o un tiempo de espera agotado (ej. no hay respuesta) - se marca en el fichero de informe del servidor. Desde que el servidor ha recibido una petición, su respuesta correspondiente se le llama un HIT (un Acceso). El número de Hits debe ser igual al número de líneas del informe menos las líneas vacías o corruptas. Una entrada típica en el formato habitual de informe es:
hostname-[01/Feb/1998:10:10:00 +0100]"
GET/index.html HTTP/1.0"200 4839
El campo hostname contiene el nombre completo del dominio cualificado (FQDN) del sitio accediendo a tu servidor (Mirar "Casos especiales", mas abajo). Los dos campos siguientes contiene normalmente un menos "-" para indicar que esos campos están vacíos. La fecha esta entre corchetes ("[" y "]"), ye l siguiente campo contiene el método de peticion ("GET", for ejemplo) el nombre del documento requerido (URL) y la especificación de protocolo ("HTTP/1.0)
El campo siguiente contiene el código de respuesta del servidor("200" es "Correcto" , "404" es "Documento no encontrado", por ejemplo).El último campo contiene el tamaño del documento (algunos servidores marcan el número de bytes transferidos hasta ahora y otros el tamaño total, que difieren en que si el usuario interrumpe la transferencia antes de haber sido completamente transferido.
Hay un par mas de formatos de fichero de informe, el formato combinado o el extendido de registro. Esos formaros añaden el nombre del navegador y la URL referida (la página que contiene el link al documento pedido, si esta peticion se ha realizado a partir de un link) en el registro del fichero de informe. Estos dos formatos (Combinado o Extendido) se añaden en los siguientes dos campos al formato de informe común (CLF) de las dos más comunes formas siguientes:
CLFMozilla/2.0 (X11; IRIX 6.3; IP22)
http://foo/bar.htmlCLF"http://foo/bar.html"
"Mozilla/2.0 (X11; IRIX 6.3; IP22)"
Dese cuenta que en la segunda forma, el User-Agent (navegador) y la URL de referencia estan entre comillas, con lo que se hace ambiguo en ciertos casos como URL de referencia erróneos, que tambien pueden llevar comillas, por lo que se prefiere el primer método
Las entradas de registro mostradas es solo la información que el servidor guarda en el fichero de informe. Debería haber mucha más información que se transfiere entre el servidor y el cliente, pero aunque es disponible a través de Scripts CGI corriendo en su servidor, no se registran en el fichero de informe. Es más, HTTP-Analyze sólo puede mostrar la información en sumario del fichero de informe (logfile) - ni más ni menos.
--------------------------------------------------------------------------------
Recogerlos en el navegador
Tan pronto como una página ha llegado al cache de disco del navegador, el navegador puede enviar peticiones condicionadas de los documentos o de los objetos embebidos. Esta petición condicionada pregunta al servidor sobre los documentos/objetos que han sido modificados desde la última vez que se pidió la página (y si la página está todavía en la cache del navegador). Así, el tráfico de red se reduce un poco, pues los ficheros solo se transfieren si han sido cambiados recientemente. Si esa peticion condicional llega, el servidor responderá un codigo 304 (Sin modificar), indicando que el documento no ha sido cambiado desde el código 200 (Exito) en el intervalo de tiempo especificado. Desde que el navegador esta normalmente configurado (por defecto) para realizar las peticiones una vez por sesión y si no realiza búsqueda en la caché, ni siquiera puedes llegar a ver un código 304 si los usuarios visitan tu web en esa misma sesion. Las peticiones condicionales solo se realizan si el usuario termina esa sesión con el navegador y más tarde reinicia el navegador
Recogerlos en un Servidor Proxy
Organizaciones con un gran número de usuarios - como compañias, universidades o proveedores en linea - a menudo usan un servidor asi llamado proxy ( próximo), por dos razones principales:
A menudo esas organizaciones tiene un firewall (cortafuegos) que les protejen contra ataques externos de intrusos. Esto significa que su red está separada de forma lógica del resto de internet y que deben utilizar un servidor proxy, que les comunica con el exterior de su red local
Reducir la carga de red de alguna forma, pues el proxy actua como una máquina de copia local: Tan pronto como ha llegado la página que ha pedido el navegador al proxy, éste guarda una copia en su caché de disco, muy parecido a la forma en la que el propio navegador lo hace, como antes, así, los documentos que han sido requerido de forma habitual solo se transfieren una vez, preparado para dar esa respuesta en el futuro, desde la cache local en vez de hacerlo desde el servidor original, donde se creo el documento.
Ambas formas de almacenaje (cache) hacen técnicamente imposible contar los visitantes o seguir su pista a través de su sitio web. Como ve, en el registro de su servidor, es unos cuantos accesos en un principio, y algún codigo 304, por petición condicional de algun navegador, dependiendo de las preferencias del navegador o del proxy.
El informe de estadísticas contiene entre otras la siguiente información
Número de accesos, códigos 304's, ficheros, visitas a páginas, sesiones, información enviada (en KB)
La cantidad de datos peticionados, transferidos y guardados en cache(en KB)
El número de URL únicas, sirios y sesiones por mes
el número de respuestas que no sean codigo 200 (Correcto)
el promedio de acesos por dia de la semana de la última semana
las máximas de acceso por dia y hora
el número de acesos, codigos 304, ficheros y datos al dia
los mayores 5 dias, 24 horas, 5 minutos y 5 segundos en el tiempo en sumario
las mayores 30 URL accedidas (por accesos, 304 o datos enviados)
las menos 10URL accedidas (por accesos, 304 o datos enviados)
los mayores 30 dominios accedidos
los mayores 30 navegadores
los mayores 30 servidores en referencia
lista corta/detallada de los ficheros requeridos
lista corta/detallada de los dominios, o dominios o dominio invertido
lista corta/detallada de los navegadores
lista corta/detallada de las URL de referencia
La siguiente tabla supone un sumario de todos los términos en las estadísticas que no se disciernen por si mismas.
Término
Significado
Hits
Un HIT, o acceso, es una respuesta dada por un servidor que ha sido pedida desde un navegador. Esto incluye cualquier respuesta dede el servidor, no solo documentos o ficheros de texto. Si una página tiene objetos embebidos, el servidor generara por ejemplo 3 acesos, 1 por el documento y 2 por un par de imagenes que tuviera.
Files
Si el usuario pide un documento y el servidor le devuelve un fichero por respuesta, se cuenta como un código 200 (OK). Cualquier respuesta así se cuenta como un fichero. "Fichero" aqui significa cualquier tipo de fichero.
Code 304
Una respuesta Code 304 (No modificado) se genera por el servidor si un documento no ha sido modificado desde la última vez que fue requerido por el usuario, por lo que no hay necesidad de responderlo si ya ha sido almacenado en la cache de disco del navegador cliente, por lo que puede construie el documento a partir de ese recurso de la cache de forma local. Esta técnica reduce el tráfico de red, aunque tambien cause inexactitudes en los informes registrados de las páginas, dado que el navegador solo realiza estas peticiones una vez por sesión, y en el caso de los proxies solo se realizan una vez independientemente de los usuarios. Aún así la relación entre ficheros y cód.304 refleja la eficiencia de los mecanismos de cache por lo menos de aquellos accesos que se han producido en el servidor.
Pageviews
Son todos aquellos ficheros que tienen un sufijo de formato texto (.html, .text) o aquellos que son el directorio índice de ficheros. Este número permite estimar cuantos documentos "reales" transmite su servidor. Si están definidos correctamente, el analizador puntúa estos ficheros de texto (documentos) como pageviews. No incluyen imagenes, CGI, Java Applets u otro objetos que no terminen con una extensión marcada como pageviews (.html, .text).
Other responses ¹
Hay muchas mas respuestas que los cod.200 o cod.304, especialmente en la especificación del protocolo estandard HTTP/1.1 que viene. Pueden ser cod.302 (redirigida), cod.401 (página movida), o cod.404 (O no existe en este servidor, o su acesso esta restringido).
KBytes transferred
La cantidad de datos transferidos durante periodo de sumario total del cual el servidor genera el informe. Algunos servidores registran solo los datos transferidos y otros el tamaño completo del fichero. Difieren en que si el navegador cliente ha sido interrumpido de la descarga, algunos servidores (como los de Netscape) solo registran los datos enviados y no los datos que hubieran sido transferidos si la página hubiera sido completamente descargada.
KBytes requested¹
Esta es la cantidad de datos pedidos durante el tiempo total evaluado.HTTP-Analyze calcula este número sumando los valores de KBytes transferred y KBytes saved by cache (ver abajo ).
KBytes saved by cache ¹
La cantidad de datos salvados por los diversos mecanismos de cache como navegadores y servidores proxy. Es el número de cod.304 de un fichero multiplicado por el tamaño de estos ficheros. Dado que HTTP-Analyze solo sabe el tamaño del archivo si ha sido pedido, en el mismo periodo de tiempo, por lo que los valores KBytes saved by cache y KBytes requested son solo orientativos del valor real.
Unique URLs
Unique URLs el número de URL válidas y diferentes accediendo al servidor durante un tiempo determinado. Esto te muesta el número de ficheros diferentes pedidos al menos una vez en el correspondiente período de tiempo.
Unique sites
El número de servidores diferentes accediendo al servidor durante un tiempo determinado. Este gráfico de tiempo y acceso está ligado al mes actual. Esto significa que si un servidor accede al tuyo muy a menudi, solo se cuenta una vez por mes, solo la suma de los servidores únicos, por mes se lista en el informe de estadístcas.
Sessions
Similar a unique sites,esto es el número de servidores únicos accediendo a un servidor en un espacio de tiempo. Este se realiza una vez al dia por defecto con fines de compatibilidad con sistemas antiguos, pero se puede cambiar con la opción -u o por fichero configuración de directivas de sesion. Por ejemplo, si el espacio de tiempo es de 2 horas tras el primer acceso desde ese servidor, son tomadas como una misma sesión. Todos los siguientes accesos a partir de esas 2 horas serán otra sesión. Esto es una forma de saber un número aproximado de cuantas sesiones acceden a tu servidor desde diferentes servidores.
¹ sólo muestra el total de la sumatoria de las paginas.
- 300 Los Usuarios han Encontrado Esto Útil