Clasificadores Rápidos basados en el algoritmo del Vecino más Similar (MSN) para Datos Mezclados

Selene Hernández Rodríguez, José Francisco Martínez Trinidad, Jesús Ariel Carrasco Ochoa

Resumen


El clasificador k vecinos más cercanos (k-NN) ha sido ampliamente utilizado dentro del Reconocimiento de Patrones debido a su simplicidad y buen funcionamiento. Sin embargo, en aplicaciones en las cuales el conjunto de entrenamiento es muy grande, la comparación exhaustiva que realiza k-NN se vuelve inaplicable. Por esta razón, se han desarrollado diversos clasificadores rápidos k-NN; la mayoría de los cuales se basan en propiedades métricas (en particular la desigualdad triangular) para reducir el número de comparaciones entre prototipos. Por lo cual, los clasificadores rápidos k-NN existentes son aplicables solamente cuando la función de comparación es una métrica (usualmente con datos numéricos). Sin embargo, en algunas ciencias como la Medicina, Geociencias, Sociología, etc., los prototipos generalmente están descritos por atributos numéricos y no numéricos (datos mezclados). En estos casos, la función de comparación no siempre cumple propiedades métricas. Por esta razón, es importante desarrollar clasificadores rápidos basados en la búsqueda de los k vecinos más similares (k-MSN) para datos mezclados que usen funciones de comparación no métricas. En esta tesis, se proponen cuatro clasificadores rápidos k-MSN, siguiendo los enfoques más exitosos. Los experimentos con diferentes bases de datos muestran que los clasificadores propuestos reducen significativamente el número de comparaciones entre prototipos.

Palabras clave


Regla del vecino más cercano; búsqueda rápida del vecino más cercano; datos mezclados; funciones de comparación no métricas

Texto completo:

PDF


Contacto:
Oscar Zavala