Propuesta de algoritmos para la reducción de espacio muestral en la cefalosporina
Abstract
En el presente trabajo se presentan la implementación y evaluación de varios métodos de reduc-ción de la dimensionalidad basados en técnicas de inteligencia artificial, y aborda uno de sus com-plejos problemas, como es el identificar y reducir un conjunto representativo de atributos para así contribuir al mejoramiento de los modelos de clasificación y predicción. La búsqueda de subconjun-tos óptimos de atributos para la clasificación de conjuntos de datos presenta el inconveniente de su complejidad temporal. Se implementaron procedimientos de búsqueda por algoritmos genéti-cos, enfriamiento simulado, búsqueda secuencial y una hibridación entre este último y algoritmos genéticos, con tal de alcanzar mayor robustez y eficiencia. Se implementan además varias medi-das de asociación entre subconjuntos variables, a partir de conceptos de la estadística clásica o tomadas de la Teoría de la Información de Shannon. En todos los casos experimentados se reduce el espacio muestral en más del 65%. Los mejores resultados se alcanzan con el algoritmo Enfria-miento Simulado, empleando Máquinas de Soporte Vectorial como clasificador. Todos estos proce-dimientos de búsqueda presentan una complejidad temporal de orden polinomial, esto demuestra la viabilidad práctica en costo y recursos computacionales de cada procedimiento implementado.
Palabras clave:
Atributos, clasificación, dimensionalidad, inteligencia artificial, predicción, reducción.
ABSTRACT
This paper presents the implementation and evaluation of various methods of dimensionality reduc-tion based on artificial intelligence techniques, and addresses one of their complex problems, such as identifying and reducing a representative set of attributes to assist in the improvement of the classification and prediction models. The quest for optimal subsets of attributes for the classifica-tion of data sets have the disadvantage that its time complexity. Search procedures were imple-mented by genetic algorithms, simulated cooling, sequential search and a hybrid between this and genetic algorithms, so to achieve greater robustness and efficiency. It also implemented several measures of association between variable subsets, based on concepts borrowed from classical sta-tistical theory of Shannon Information. In all cases tested the sample space is reduced by more than 65%. The best results are achieved through the Simulated Annealing algorithm using support vector machines classifier. All these search procedures present a polynomial time complexity of order, this demonstrates the practical feasibility and cost of each procedure computing resources deployed.Keywords:
Artificial intelligence, classification, dimensionality, reduction, prediction, sub-attributes.Downloads
Published
How to Cite
Issue
Section
License
La editorial "Universo Sur", de la Universidad de Cienfuegos, publica el contenido de la Revista "Universidad y Sociedad" bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional.
© Podrá reproducirse, de forma parcial o total, el contenido de esta publicación, siempre que se haga de forma literal y se mencione la fuente.