2.3.3 Depuración de base6000.[El error como problema de los problemas, 2. Metología, 2.3. Proceso de elaboración]En este punto trataremos de explicar todos los cambios y depuraciones realizados desde que comenzamos a trabajar con base6000 de 6000 registros hasta que obtuvimos el resultado final, que llamaremos base2450. Un gran filtrado en función de unos criterios que pretendieron eliminar aquellos registros con una alta carga de información desechable. Mostramos a continuación la estructura de campos de la tabla. Existen más informaciones complementarias en otras tablas, pero este el el núcleo duro de la información. Asimismo, han sido ocultados algunos campos considerados como poco relevantes para nuestro trabajo y consecuentemente para el lector y han sido creados otros a partir de informaciones previas, o de otras tablas, que pueden mejorar la comprensión global del trabajo. |
|||
Fueron eliminados varios campos con información de poco interés para nuestros objetivos y también fueron modificados los contenidos de algunos campos que originariamente mostraban en otro formato o que estaban encriptados por razones de seguridad. El siguiente paso, tal vez uno de los más laboriosos y aburrido fue el de transformar unos datos de texto, en agrupaciones de datos con frecuencia con que aparecían. El campo Rsmal que admitía una longitud de hasta 255 caracteres, recogía todas las respuestas erróneas que recibía el problema a lo largo del tiempo, separadas por coma. Hubo que agrupar todas las respuestas lineales e iguales en forma de pares, es decir, cada respuesta fallada asociada a su frecuencia de repetición. También se hubieron de eliminar los problemas cuyas respuestas presentaban errores de anotación (coma decimal y punto como separador de miles) que ya hemos comentado en el apartado 2.1 Web winmates.net. Con el ánimo de minimizar la influencia de la “ganga” sobre la “mena”, procedimos a eliminar la primera, la ganga, que quedó operativizada como tal cuando un error aparecía con una frecuencia inferior o igual a 5, aspecto que ya comentado en el punto 2.1. Es decir se eliminar los problemas con pocos errores o ninguno (caso hipotético), lo cual incluye los de tienen una frecuencia de repetición inferior o igual a 5. Tras más de un mes de trabajo con estas tareas de limpieza hemos obtenido una tabla de 2486 registros llamada base2486. Han sido eliminados más de la mitad. Una purga muy significativa donde sólo han quedado los problemas con errores sistemáticos estables, dignos de estudio y análisis. De todo ello nos ocuparenos en el siguiente apartado. |
2.3.1 Terminología y Diagrama | 2.3.2 Obtención de respuesta | 2.3.3 Depuración de la base6000 |
Derechos Reservados © Juan A Cordero, 2020 |