Reducción de la dimensionalidad interactiva (iDR)

Los Algoritmos DR en la analítica visual

Los algoritmos DR son capaces de encontrarestructuras latentes de baja dimensión ocultas en datos de alta dimensionalidad, permitiendo obtener un mapa en un espacio de baja dimensión (2D o 3D) que conserva la estructura más significativa de datos. Estos algoritmos se basan en el cómputo de las distancias mutuas entre los elementos de un espacio de entrada, para obtener una representación de los mismos en un espacio de visualización de baja dimensión (2D/3D) que preserva en sus aspectos más importantes la estructura definida por esas distancias mutuas. Estos algoritmos definen, por tanto, un mapeo o proyección del espacio de entrada sobre el espacio de visualización que conserva la estructura y relaciones topológicas más significativas de los datos en el espacio original.

Los algoritmos DR son herramientas extremadamente útiles en el campo de la analítica visual, ya que proporcionan una forma avanzada de "espacialización" de los datos, es decir, la generación de representaciones visuales donde la proximidad espacial entre dos elementos i y j en la visualización representan similitud entre los correspondientes elementos xi y xj en el espacio de alta dimensión.

Algoritmos DR interactivos (iDR)

Por otra parte, un elemento cl
ave en la analítica visual es la interacción. Las técnicas de interacción como el zoom, traslación y la rotación de los datos, el focus& context, brushing,etc, permiten al usuario reconfigurar la visualización para centrarse en los aspectos interesantes de los datos o para descartar información irrelevante. En elprocedimiento típico de uso de los algoritmos de DR para la visualización de datos, la interacción tiene lugar a menudo después del cómputo de la proyección. El usuario establece una configuración inicial para el algoritmo de DR, lo ejecuta hasta la convergencia y, después de N iteraciones, los resultados de salida se utilizan para producir una visualización. El usuario puede después utilizar técnicas de interacción para reconfigurar esta visualización o incluso decidir ejecutar el algoritmo de DR con otra parametrización, iniciando el ciclo de nuevo.

Sin embargo, la interacción puede ir más allá de este enfoque, si se permite al usuario tomar el control completo del comportamiento del algoritmo DR durante la convergencia visualizando los resultados intermedios. Utilizando algoritmos no convexos, como el SNE (stochastic neighbor embedding), que se basan en un mecanismo de aproximación iterativo, la visualización de los resultados intermedios describe una estructura cambiante que revela de forma dinámica los cambios en las relaciones entre las muestras en función del conjunto de variables elegidas. 

El resultado es una visualización que cambia dinámicamente -una transición animada- la cual permite al usuario seguir los cambios en la proyección resultante ante cambios en la formulación del problema, tales como, por ejemplo, los cambios en ​​la métrica del espacio de entrada a través de la modificación de los pesos de las variables de entrada, o en presencia de datos de entrada de variantes (por ejemplo, en los procesos dinámicos en los que los elementos de los datos de entrada cambian con el tiempo).

iDR-vibracionesMotor

Aplicación a la visualización interactiva de estados de vibración en un motor de inducción

Una versión preliminar de esta idea se puede ver figura adjunta, aplicando el algoritmo stochastic neighbor embedding sobre un espacio de alta dimensionalidad compuesto por las energías de vibración (aceleraciones) y corrientes en distintas bandas de frecuencia, para distintas condiciones de funcionamiento del motor, incluyendo:
  • Fallo en una de las fases
  • Asimetría mecánica (excentricidad en el eje)
  • Fallo en una de las fases y asímetría mecánica simultáneas
  • Desequilibrios eléctricos inducidos por cargas de 5Ω, 10Ω, 15Ω, 20Ω 
  • Desequilibrios eléctricos graduales desde 0Ω hasta 20Ω, 
Modificando los pesos de cada una de las variables (bandas de frecuencia en corrientes y vibraciones) el mapa de los estados de vibración se "reordena", organizando los estados a partir de las variables a las que el usuario ha dado peso significativo. Si alguna variable fundamental para caracterizar un fallo es omitida, dicho fallo no es separado en la visualización, quedando mezclado en la nube de puntos. Cuando el usuario da peso a dicha variable, emerge la separación, mostrando implícitamente al usuario que esa variable es relevante en la caracterización del fallo.

Agradecimientos

La investigación publicada en esta página ha sido financiada por fondos del Principado de Asturias, del Ministerio de Economía y Competitividad (mineco) y por fondos FEDER de la Unión Europea bajo el proyecto DPI2009-13398-C02/01. 
Comments