Techniques for Data Analysis and Visualization in the Agricultural Field
DOI:
https://doi.org/10.56124/encriptar.v8i16.004Keywords:
CRISP-DM methodology, data processing, weight analysis, data miningAbstract
The study aims to clean and prepare data related to piglet weight at different stages from birth to weaning. It explores techniques for data analysis and visualization in the agricultural sector through the partial application of the CRISP-DM methodology.First, data from 2022 to 2024 related to the swine herd at ESPAM MFL was collected, originally stored in Excel tables. Subsequently, a thorough review of the information was conducted, revealing that only 6.18% of the 1,489 records were complete. The data was then cleaned and prepared using a structured approach that included identifying and removing outliers through the interquartile range method, filtering complete records, and calculating average growth rates across columns. These growth rates were used to impute missing values, resulting in a clean and consistent dataset. The most significant outcome is the generation of a dataset suitable for machine learning models, validated through various visualizations such as box plots, histograms, and scatter plots. This approach provides a reproducible and adaptable framework for data preparation in the agricultural sector.
Downloads
References
@BigDataAnalytics. (2023). Dataset: Qué es y principales características. The Data Schools. https://thedataschools.com/que-es/data-set/
AgroSpray. (2022, January 10). Inteligencia artificial en el agro: más productivo y sustentable -. AgroSpray Blog. https://agrospray.com.ar/blog/inteligencia-artificial-en-el-agro/
Ambrósio, L. M., Linhares, H. M., David, J., Braga, R., Arbex, W., Campos, M. M., & Capilla, R. (2021). Enhancing the reuse of scientific experiments for agricultural software ecosystems. Journal of Grid Computing, 19(4). https://doi.org/10.1007/s10723-021-09583-x
Bagnato. (2020). Clasificación con datos desbalanceados | Aprende Machine Learning. Aprende Machine Learning. https://www.aprendemachinelearning.com/clasificacion-con-datos-desbalanceados/
Bajić, F., & Job, J. (2023). Review of chart image detection and classification. International Journal on Document Analysis and Recognition (IJDAR), 26(4), 453–474. https://doi.org/10.1007/s10032-022-00424-5
Cavaller, V., Ruiz, D., Terrádez, M., Martín, A., & García, R. (JUNIO de 2018). Técnicas avanzadas de análisis y visualización de datos. COMEIN(78). https://doi.org/https://doi.org/10.7238/issn.2014-2226
Campos, A. (2023). Inteligencia artificial en agricultura: la nueva revolución del sector. Increnta. https://increnta.com/insights/inteligencia-artificial-en-agricultura/
Chen, J., Xiangliang, C., Fu, H., & Lam, A. (2018). Agricultural product monitoring system supported by cloud computing. Cluster Computing, 22(S4), 8929–8938. https://doi.org/10.1007/s10586-018-2022-5
Corvalán, J. G. (2018). Inteligencia artificial: retos, desafíos y oportunidades - Prometea: la primera inteligencia artificial de Latinoamérica al servicio de la Justicia*. https://www.redalyc.org/journal/5340/534057837015/html/
Coursera. (2023, June 15). Visualización de datos: Definición, ventajas y ejemplos. Coursera. https://www.coursera.org/mx/articles/data-visualization
Cuevas, M. F., Olguin, G. M., Noriega, A. L., & Ortiz, R. (2021, 07 15). Agricultura de precisión, análisis de imágenes aplicada a la producción agrícola. inecol. https://www.inecol.mx/inecol/index.php/es/ct-menu-item-25/ct-menu-item-27/17-ciencia-hoy/1431-agricultura-de-precision-analisis-de-imagenes-aplicada-a-la-produccion-agricola
De Catalunya, U. O. (2018). Técnicas avanzadas de análisis y visualización de datos. https://comein.uoc.edu/divulgacio/comein/es/numero78/articles/tecnicas-avanzadas-analisis-visualizacion-datos.html
De Oliveira, W., Braga, R., David, J., Ströele, V., Campos, F., & Castro, G. (2022). Visionary: a framework for analysis and visualization of provenance data. Knowledge and Information Systems, 64(2), 381–413. https://doi.org/10.1007/s10115-021-01645-6
Deeken, H., Wiemann, T., & Hertzberg, J. (2019). A spatio-semantic approach to reasoning about agricultural processes. Applied Intelligence, 49(11), 3821–3833. https://doi.org/10.1007/s10489-019-01451-2
Deniz, M., De Sousa, K. T., Gomes, I. C., Fabro, J. A., Vale, M. M. D., & Dittrich, J. R. (2021). Development and application of an autonomous data logger to measure environmental variables in livestock farming. International Journal of Environmental Science and Technology, 19(9), 8699–8712. https://doi.org/10.1007/s13762-021-03734-z
Dutta, S. (2023). Modelado de datos: Un pilar fundamental de su futura tecnología de IA. CAS. https://www.cas.org/es-es/resources/blog/modelado-de-datos-un-pilar-fundamental-de-su-futura-tecnologia-de-ia
Espinosa-Zúñiga, J. J. (2020). Aplicación de metodología CRISP-DM para segmentación geográfica de una base de datos pública. Ingeniería, Investigación y Tecnología, 21(1), e00008. https://doi.org/10.22201/fi.25940732e.2020.21n1.008
Frąckiewicz, M. (2023, August 19). El papel de la computación espacial en la agricultura y la ganadería. TS2 SPACE. https://ts2.space/es/el-papel-de-la-computacion-espacial-en-la-agricultura-y-la-ganaderia/#gsc.tab=0
González, R. (2022). ¿Calidad o cantidad? Lo que más importa en el Big Data. Big Data Magazine. https://bigdatamagazine.es/calidad-o-cantidad-lo-que-mas-importa-en-el-big-data
GRAP. (2023). Digitalización y análisis Big Data en granjas porcinas. Recuperado de https://www.grap.udl.cat/es/recerca/linies-de-recerca/digitalitzacio-i-analisi-big-data-en-granges-porcines/
Himeur, Y., Elnour, M., Fadli, F., Meskin, N., Petri, I., Rezgui, Y., Bensaali, F., & Amira, A. (2022). AI-big data analytics for building automation and management systems: a survey, actual challenges and future perspectives. Artificial Intelligence Review, 56(6), 4929–5021. https://doi.org/10.1007/s10462-022-10286-2
IBM. (2023). CRISP-DM: Cross-Industry Standard Process for Data Mining. Guía para la Minería de Datos. Disponible en https://www.ibm.com/docs/es/spss-modeler/saas?topic=dm-crisp-help-overview.
Instituto de Ingeniería del Conocimiento. (2021, January 21). Machine Learning y Deep Learning - Expertos en IIC. Instituto De Ingeniería Del Conocimiento. https://www.iic.uam.es/inteligencia-artificial/machine-learning-deep-learning/
Paz, A. (2023, March 29). Calidad de Datos: Cómo Asegurar la Precisión y Confiabilidad en tu Información - Estrategia Uno. Estrategia Uno. https://estrategia.uno/calidad-de-datos-precision-y-confiabilidad/
Pérez, A. (2021, September 20). Inteligencia artificial y gestión de calidad. OBS Business School. https://www.obsbusiness.school/blog/inteligencia-artificial-y-gestion-de-calidad
profesorDATA. (2022, January 21). Reducción de la dimensionalidad: Análisis de Componentes Principales (PCA). profesorDATA.com. https://profesordata.com/2020/09/01/reduccion-de-la-dimensionalidad-analisis-de-componentes-principales-pca/
Ramírez-Morales, I., Mazon-Olivo, B., & Pan, A. (2018). Ciencia de datos en el sector agropecuario. En Análisis de datos agropecuarios (pp. 1-44). Machala, Ecuador: Editorial UTMACH. https://doi.org/10.48190/9789942241207.1
Reyes, V. (2018). Revista de los Estudios de Ciencias de la Información y de la Comunicación. Dianet. https://dialnet.unirioja.es/servlet/articulo?codigo=7472358
Sunil, C. K., Jaidhar, C. D., & Patil, N. (2023). Systematic study on deep learning-based plant disease detection or classification. Artificial Intelligence Review, 56(12), 14955–15052. https://doi.org/10.1007/s10462-023-10517-0
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Scientific Journal of Informatics ENCRYPT - ISSN: 2737-6389.

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.










