
:: Metodología Unificada de Evaluación Web (UWEM 1.0)
En el marco de la UWEM, las declaraciones de conformidad tienen que referirse a una lista de recursos evaluados respecto al alcance del sitio o los sitios Web. En esta Sección figuran las definiciones de base para los distintos conceptos usados.
En función de las necesidades de las distintas aplicaciones de la UWEM, esta lista de recursos puede especificarse mediante diversos participantes en el proceso de evaluación, como por ejemplo, un dueño de un sitio Web, un redactor de un sitio Web, un organismo de inspSección, etc. En este documento se explica únicamente cómo dicha lista debe redactarse sin ambigüedades.
En general, no será factible someter a prueba todos los recursos de un sitio Web conforme a la totalidad de los criterios de evaluación. Por consiguiente, después de haber determinado y seleccionado la lista de recursos que deban ser evaluados y el nivel de conformidad perseguido, proponemos identificar un determinado número de subconjuntos o “muestras”.
En los recursos para el muestreo se debería incluir la lista de recursos esenciales completada por una selSección de recursos arbitrarios. A esta lista la denominamos lista de los recursos de muestreo.
La lista de recursos esenciales es una serie de recursos genéricos, probablemente presentados en la mayoría de los sitios Web, que, además, resultan esenciales para la utilización y la evaluación de la accesibilidad de un sitio. Por tanto, la lista de los recursos esenciales constituye una serie de recursos que deben ser incluidos en cualquier evaluación de la accesibilidad del sitio. En general, la lista de recursos esenciales no puede determinarse de forma automática sino que se precisa recurrir al criterio humano para su selSección. En el caso de pruebas totalmente automáticas, como por ejemplo, en un observatorio, la lista de los recursos esenciales puede determinarse mediante determinados métodos heurísticos. La lista de los recursos esenciales debe incluir todos los recursos mencionados a continuación si estos son aplicables:
Obviamente, cualquiera de los recursos puede pertenecer a más de una categoría de las arriba mencionadas: lo fundamental es que, en la medida de lo posible, toda la lista de los recursos esenciales cubra colectivamente todos los objetivos aplicables de muestreo. Cualquier recurso dado debe aparecer una sola vez en la lista de recursos esenciales.
Una lista de recursos de muestreo es un conjunto que puede ser generado por una herramienta automática a partir de una selSección dada. Típicamente, se utilizaría una lista de recursos de muestreo en el marco de evaluaciones realizadas en un gran número de sitios (sólo en función de criterios automáticos), donde no es factible ni necesario evaluar la totalidad de las páginas Web de cada sitio [8].
Si se utiliza un método de muestreo, entonces el resultado del muestreo debe ser representativo y sin ambigüedad, lo que significa que debe ser una lista aleatoria dentro del número total de recursos. En ese caso, la lista de los recursos de muestreo para una evaluación automática a gran escala debe emplear un algoritmo de muestreo que seleccione la serie de recursos con ayuda de un algoritmo de muestreo uniforme aleatorio o casi uniforme aleatorio [HENZINGER00], o una lista de muestras aleatorias procedentes de la lista completa de las páginas Web (a condición de que la lista completa de las páginas Web esté disponible) [9]
El método de agregación de la UWEM de la Sección 6 se aplica a nivel de una página Web y, por consiguiente, cada unidad de muestreo debe parecerse a la serie debe parecerse a la serie de recursos Web que constituyen conjuntamente la expresión de una página Web.
En los resultados de las pruebas debe indicarse claramente el margen de error del intervalo de confianza del 95% del valor medio de las muestras agregadas para un sitio Web, siguiendo el método de agregación de la UWEM de la Sección 6. Incumbe a los proveedores de herramientas la decisión de presentar el margen de error para cada sitio Web, o bien de efectuar un muestreo para un margen de error dado, [10] con objeto de presentar una sola vez el margen de error máximo. [11]
El margen de error m de un intervalo de confianza se define como el valor añadido o sustraído de la media del muestreo, lo que determina la longitud del intervalo:
Figura 2: margen de error m del intervalo de confianza
Donde z=1,96 para un intervalo de confianza del 95% y sigma es la desviación estándar de las muestras agregadas para el sitio Web, siguiendo el método de agregación de la Sección 6.
Cabe señalar que el algoritmo de muestreo utilizado, así como cualquier otra restricción que limite o falsee el resultado, incluyendo, de forma no restrictiva, la lista de restricciones abajo mencionadas, deben indicarse explícitamente en cualquier informe de evaluación:
Como alternativa al método descrito más arriba, que, además, resulta especialmente apropiado para las pruebas por expertos, autorizamos una selSección manual del número mínimo de recursos. Este número mínimo de recursos de una lista de recursos de muestreo, depende del tamaño estimado del sitio Web.
El tamaño mínimo de la muestra es de 30 recursos únicos (si están disponibles), añadiendo 2 recursos únicos por 1000 hasta un máximo de 50 recursos en la lista de los recursos de muestreo. Este número es arbitrario. En una versión futura de la UWEM se añadirán recomendaciones más pormenorizadas sobre los tamaños de las muestras, basadas sobre todo en los resultados de las experiencias efectuadas en el marco de los proyectos EIAO y BenToWeb.
* Advertencia: Esta traducción al español de UWEM 1.0 ha sido realizada por Technosite en noviembre del 2006. Technosite no se responsabiliza de los errores o imprecisiones de traducción ni sus eventuales consecuencias. La versión oficial de UWEM 1.0 en inglés se puede consultar en el sitio del WAB Cluster.