Técnicas para el análisis y visualización de datos en el campo agropecuario
DOI:
https://doi.org/10.56124/encriptar.v8i16.004Palabras clave:
Metodología CRISP-DM, procesamiento de datos, análisis de peso, análisis de datosResumen
El estudio tuvo como objetivo la limpieza y preparación de datos relacionados con el peso de los lechones en diferentes etapas desde su nacimiento hasta el destete. Se abordan técnicas para el análisis y visualización de datos en el sector agropecuario mediante la aplicación parcial de la metodología CRISP-DM. En primer lugar, se recopilaron datos desde 2022 al 2024 de la ESPAM MFL referentes al hato porcino los mismos que estaban en tablas de Excel. Posteriormente, se realiza una revisión exhaustiva de la información, se determina que, de 1477 registros, únicamente el 6.23% estaban completos. Luego, se limpió y preparó los datos empleando un enfoque estructurado que incluyó la identificación y eliminación de datos atípicos mediante el método del rango intercuartílico, el filtrado de registros completos y el cálculo de tasas de crecimiento promedio entre columnas, las mismas que se emplearon para imputar valores faltantes, obteniendo un conjunto de datos limpio y consistente. El resultado más relevante incluye la generación de un conjunto de datos apto para modelos de aprendizaje automático, validado mediante diversas visualizaciones, como diagramas de cajas, histogramas y gráficos de dispersión. Este enfoque proporciona un marco reproducible y adaptable para la preparación de datos en el sector agropecuario.
Descargas
Citas
@BigDataAnalytics. (2023). Dataset: Qué es y principales características. The Data Schools. https://thedataschools.com/que-es/data-set/
AgroSpray. (2022, January 10). Inteligencia artificial en el agro: más productivo y sustentable -. AgroSpray Blog. https://agrospray.com.ar/blog/inteligencia-artificial-en-el-agro/
Ambrósio, L. M., Linhares, H. M., David, J., Braga, R., Arbex, W., Campos, M. M., & Capilla, R. (2021). Enhancing the reuse of scientific experiments for agricultural software ecosystems. Journal of Grid Computing, 19(4). https://doi.org/10.1007/s10723-021-09583-x
Bagnato. (2020). Clasificación con datos desbalanceados | Aprende Machine Learning. Aprende Machine Learning. https://www.aprendemachinelearning.com/clasificacion-con-datos-desbalanceados/
Bajić, F., & Job, J. (2023). Review of chart image detection and classification. International Journal on Document Analysis and Recognition (IJDAR), 26(4), 453–474. https://doi.org/10.1007/s10032-022-00424-5
Cavaller, V., Ruiz, D., Terrádez, M., Martín, A., & García, R. (JUNIO de 2018). Técnicas avanzadas de análisis y visualización de datos. COMEIN(78). https://doi.org/https://doi.org/10.7238/issn.2014-2226
Campos, A. (2023). Inteligencia artificial en agricultura: la nueva revolución del sector. Increnta. https://increnta.com/insights/inteligencia-artificial-en-agricultura/
Chen, J., Xiangliang, C., Fu, H., & Lam, A. (2018). Agricultural product monitoring system supported by cloud computing. Cluster Computing, 22(S4), 8929–8938. https://doi.org/10.1007/s10586-018-2022-5
Corvalán, J. G. (2018). Inteligencia artificial: retos, desafíos y oportunidades - Prometea: la primera inteligencia artificial de Latinoamérica al servicio de la Justicia*. https://www.redalyc.org/journal/5340/534057837015/html/
Coursera. (2023, June 15). Visualización de datos: Definición, ventajas y ejemplos. Coursera. https://www.coursera.org/mx/articles/data-visualization
Cuevas, M. F., Olguin, G. M., Noriega, A. L., & Ortiz, R. (2021, 07 15). Agricultura de precisión, análisis de imágenes aplicada a la producción agrícola. inecol. https://www.inecol.mx/inecol/index.php/es/ct-menu-item-25/ct-menu-item-27/17-ciencia-hoy/1431-agricultura-de-precision-analisis-de-imagenes-aplicada-a-la-produccion-agricola
De Catalunya, U. O. (2018). Técnicas avanzadas de análisis y visualización de datos. https://comein.uoc.edu/divulgacio/comein/es/numero78/articles/tecnicas-avanzadas-analisis-visualizacion-datos.html
De Oliveira, W., Braga, R., David, J., Ströele, V., Campos, F., & Castro, G. (2022). Visionary: a framework for analysis and visualization of provenance data. Knowledge and Information Systems, 64(2), 381–413. https://doi.org/10.1007/s10115-021-01645-6
Deeken, H., Wiemann, T., & Hertzberg, J. (2019). A spatio-semantic approach to reasoning about agricultural processes. Applied Intelligence, 49(11), 3821–3833. https://doi.org/10.1007/s10489-019-01451-2
Deniz, M., De Sousa, K. T., Gomes, I. C., Fabro, J. A., Vale, M. M. D., & Dittrich, J. R. (2021). Development and application of an autonomous data logger to measure environmental variables in livestock farming. International Journal of Environmental Science and Technology, 19(9), 8699–8712. https://doi.org/10.1007/s13762-021-03734-z
Dutta, S. (2023). Modelado de datos: Un pilar fundamental de su futura tecnología de IA. CAS. https://www.cas.org/es-es/resources/blog/modelado-de-datos-un-pilar-fundamental-de-su-futura-tecnologia-de-ia
Espinosa-Zúñiga, J. J. (2020). Aplicación de metodología CRISP-DM para segmentación geográfica de una base de datos pública. Ingeniería, Investigación y Tecnología, 21(1), e00008. https://doi.org/10.22201/fi.25940732e.2020.21n1.008
Frąckiewicz, M. (2023, August 19). El papel de la computación espacial en la agricultura y la ganadería. TS2 SPACE. https://ts2.space/es/el-papel-de-la-computacion-espacial-en-la-agricultura-y-la-ganaderia/#gsc.tab=0
González, R. (2022). ¿Calidad o cantidad? Lo que más importa en el Big Data. Big Data Magazine. https://bigdatamagazine.es/calidad-o-cantidad-lo-que-mas-importa-en-el-big-data
GRAP. (2023). Digitalización y análisis Big Data en granjas porcinas. Recuperado de https://www.grap.udl.cat/es/recerca/linies-de-recerca/digitalitzacio-i-analisi-big-data-en-granges-porcines/
Himeur, Y., Elnour, M., Fadli, F., Meskin, N., Petri, I., Rezgui, Y., Bensaali, F., & Amira, A. (2022). AI-big data analytics for building automation and management systems: a survey, actual challenges and future perspectives. Artificial Intelligence Review, 56(6), 4929–5021. https://doi.org/10.1007/s10462-022-10286-2
IBM. (2023). CRISP-DM: Cross-Industry Standard Process for Data Mining. Guía para la Minería de Datos. Disponible en https://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview.
Instituto de Ingeniería del Conocimiento. (2021, January 21). Machine Learning y Deep Learning - Expertos en IIC. Instituto De Ingeniería Del Conocimiento. https://www.iic.uam.es/inteligencia-artificial/machine-learning-deep-learning/
Paz, A. (2023, March 29). Calidad de Datos: Cómo Asegurar la Precisión y Confiabilidad en tu Información - Estrategia Uno. Estrategia Uno. https://estrategia.uno/calidad-de-datos-precision-y-confiabilidad/
Pérez, A. (2021, September 20). Inteligencia artificial y gestión de calidad. OBS Business School. https://www.obsbusiness.school/blog/inteligencia-artificial-y-gestion-de-calidad
profesorDATA. (2022, January 21). Reducción de la dimensionalidad: Análisis de Componentes Principales (PCA). profesorDATA.com. https://profesordata.com/2020/09/01/reduccion-de-la-dimensionalidad-analisis-de-componentes-principales-pca/
Ramírez-Morales, I., Mazon-Olivo, B., & Pan, A. (2018). Ciencia de datos en el sector agropecuario. En Análisis de datos agropecuarios (pp. 1-44). Machala, Ecuador: Editorial UTMACH. https://doi.org/10.48190/9789942241207.1
Reyes, V. (2018). Revista de los Estudios de Ciencias de la Información y de la Comunicación. Dianet. https://dialnet.unirioja.es/servlet/articulo?codigo=7472358
Sunil, C. K., Jaidhar, C. D., & Patil, N. (2023). Systematic study on deep learning-based plant disease detection or classification. Artificial Intelligence Review, 56(12), 14955–15052. https://doi.org/10.1007/s10462-023-10517-0
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2025 Revista Científica de Informática ENCRIPTAR - ISSN: 2737-6389.

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.










