K-means based method for handling unlabeled data

Sharon Diznarda Álvarez Gómez; Silvio Amable Machuca Vivar; Paulina Elizabeth Salas Medina

K-means based method for handling unlabeled data

Autores/as

Sharon Diznarda Álvarez Gómez Universidad Regional Autónoma de Los Andes. Ecuador https://orcid.org/0000-0003-3213-9034
Silvio Amable Machuca Vivar Universidad Regional Autónoma de Los Andes. Ecuador https://orcid.org/0000-0002-4681-3045
Paulina Elizabeth Salas Medina Universidad Regional Autónoma de Los Andes. Ecuador https://orcid.org/0000-0001-6573-533X

Resumen

From the development achieved by the current information society, incalculable volumes of data are generated. The exponential growth of information significantly supports people's decision mak-ing in their daily activities. In Ecuador there are many institutions that store the data of their pro-cesses, the tourism sector representing an example of this. However, the data generated exceeds the power of analysis and processing of human beings, sometimes relevant information is present-ed that is not visible to people. The present investigation proposes a solution to the described prob-lem starting from the development of a method for the treatment of unlabeled data.The proposed method is based on the unsupervised k-means algorithm. The proposal has been implemented from the stored data set of the tourism sector in the City of Riobamba.

Keywords:

Machine learning, data mining, roughsets, entropy, information gain.

ABSTRACT

A partir del desarrollo alcanzado por la actual sociedad de la información, se generan volúmenes incalculables de datos. El crecimiento exponencial de la información apoya significativamente la to-ma de decisiones de las personas en sus actividades cotidianas. En el Ecuador existen muchas insti-tuciones que almacenan los datos de sus procesos, el sector turístico representa un ejemplo de ello. Sin embargo, los datos generados superan el poder de análisis y procesamiento del ser hu-mano, en ocasiones se presenta información relevante que no es visible para las personas. La pre-sente investigación propone una solución al problema descrito a partir del desarrollo de un método para el tratamiento de datos no etiquetados, basado en el algoritmo no supervisado de k-means. La propuesta ha sido implementada a partir del conjunto de datos almacenados del sector turístico de la ciudad de Riobamba.

Palabras clave:

Aprendizaje automático, minería de datos, roughsets, entropía, ganancia de información.

Descargas

Publicado

2021-12-01

Cómo citar

Álvarez Gómez, S. D., Machuca Vivar, S. A., & Salas Medina, P. E. (2021). K-means based method for handling unlabeled data. Universidad Y Sociedad, 13(S3), 452–458. Recuperado a partir de https://rus.ucf.edu.cu/index.php/rus/article/view/2504

Descargar cita

Número

Vol. 13 Núm. S3 (2021): Aportes educación, sociedad y empresa en América Latina

Sección

Artículos

Licencia

La editorial "Universo Sur", de la Universidad de Cienfuegos, publica la revista Universidad y Sociedad bajo la Licencia Creative Commons Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0).

Usted puede compartir el material, sin fines comerciales, siempre que:

Atribuya adecuadamente (autores, revista, enlace al artículo y a esta licencia).
No cree obras derivadas.
Indique si ha realizado cambios.

Los autores conservan los derechos de autor.
Texto completo de la licencia: https://creativecommons.org/licenses/by-nc-nd/4.0/

K-means based method for handling unlabeled data

Autores/as

Resumen

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

Artículos más leídos del mismo autor/a

Idioma

INSTRUCTIVOS

CERTIFICADA POR

INDEXADA EN:

RUS por el mundo

Desarrollado por

Universidad y Sociedad

Datos de la revista

Información institucional

Dirección editorial