CatBoost y Regresión Logística como enfoques de aprendizaje automático en el Matchmaking y la Disponibilidad Percibida

Autores/as

  • Jorge Iván Pincay-Ponce Universidad Laica Eloy Alfaro de Manabí ULEAM
  • María Roxana Martínez Universidad Abierta Interamericana UAI
  • Wilian Richart Delgado-Muentes Universidad Laica Eloy Alfaro de Manabí ULEAM
  • Juan Alberto Figueroa-Suárez Universidad Laica Eloy Alfaro de Manabí ULEAM

DOI:

https://doi.org/10.56124/encriptar.v7i14.009

Palabras clave:

Emparejamiento, métodos de ensemble, citas rápidas

Resumen

El presente trabajo tiene como objetivo rediseñar el análisis del conjunto de datos “Speed Dating”, que fue parte de la investigación titulada “Gender Differences in Mate Selection: Evidence from a Speed Dating Experiment” presentada por Raymond Fisman, Sheena Iyengar, Emir Kamenica y Itamar Simonson, en el The Quarterly Journal of Economics, la más antigua revista de economía en idioma inglés, en 2006. Con base en la teoría de la "disponibilidad percibida" que indica que las personas son más propensas a considerar atractivas a aquellas que parecen más alcanzables o interesadas en ellas, se ha empleado regresiones logísticas y el método de ensemble CatBoost, para generar con ellos un trabajo conjunto y descubrir patrones aparentemente influyentes en la decisión de personas del sexo opuesto sobre llevar una eventual relación de pareja a partir de un experimento social de citas rápidas de cuatro minutos. Se encontró que en general, los compañeros y compañeras de las parejas privilegian en el orden de más a menos lo siguiente en sus parejas: atractivo, probabilidad de compatibilidad, intereses comunes, divertido o divertida, ambición, satisfacción con conocidos (indicativo de asocialidad), intereses de TV, sinceridad, edad de la pareja. Estos resultados reportan una exactitud superior al 80% con Regresión Logística y 88% con el método de ensamble CatBoost. La herramienta utilizada en la elaboración del modelo fue Orange Data Mining 3.37.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Association for the Advancement of Artificial Intelligence (Ed.). (2018). Proceedings of the Twelfth International AAAI Conference on Web and Social Media: ICWSM: 25-28 June 2018, Stanford, California, USA. International AAAI Conference on Web and Social Media, Palo Alto, California. AAAI Press.

Brannan, D., & Mohr, C. D. (2018). Love, friendship, and social support. Noba textbook series: Psychology. Champaign, IL: DEF publishers.

Buss, D. M., & Schmitt, D. P. (1993). Sexual Strategies Theory: An evolutionary perspective on human mating. Psychological Review, 100(2), 204-232. https://doi.org/10.1037/0033-295X.100.2.204

Fernández, A., Garcia, S., Herrera, F., & Chawla, N. V. (2018). SMOTE for learning from imbalanced data: Progress and challenges, marking the 15-year anniversary. Journal of artificial intelligence research, 61, 863-905.

Fisman, R., Iyengar, S. S., Kamenica, E., & Simonson, I. (2006). Gender Differences in Mate Selection: Evidence From a Speed Dating Experiment. The Quarterly Journal of Economics, 121(2), 673-697. https://doi.org/10.1162/qjec.2006.121.2.673

Hayashi, T., Mawalim, C. O., Ishii, R., Morikawa, A., Fukayama, A., Nakamura, T., & Okada, S. (2023). A Ranking Model for Evaluation of Conversation Partners Based on Rapport Levels. IEEE Access, 11, 73024-73035. https://doi.org/10.1109/ACCESS.2023.3287984

Joshi, A., Saggar, P., Jain, R., Sharma, M., Gupta, D., & Khanna, A. (2021). CatBoost—An Ensemble Machine Learning Model for Prediction and Classification of Student Academic Performance. Advances in Data Science and Adaptive Analysis, 13(03n04), Article 03n04. https://doi.org/10.1142/S2424922X21410023

Kleinerman, A., Rosenfeld, A., Ricci, F., & Kraus, S. (2018). Optimally balancing receiver and recommended users’ importance in reciprocal recommender systems. Proceedings of the 12th ACM Conference on Recommender Systems, 131-139. https://doi.org/10.1145/3240323.3240349

Lundberg, S. (2018). SHAP. API Reference. https://tinyurl.com/yhcdt2w8

Lundberg, S., & Lee, S.-I. (2017). A Unified Approach to Interpreting Model Predictions. https://doi.org/10.48550/ARXIV.1705.07874

McFarland, D. A., Broska, D., Prabhakaran, V., & Jurafsky, D. (2024). Coming into relations: How communication reveals and persuades relational decisions. Social Networks, 79, 57-75. https://doi.org/10.1016/j.socnet.2024.05.003

Mukhopadhyay, S. (2018). Advanced Data Analytics Using Python. Apress. https://doi.org/10.1007/978-1-4842-3450-1

Pincay Ponce, J. I. (2023). Análisis de datos educativos aplicado en el estudio de la incidencia de factores socioeconómicos en el rendimiento escolar [Doctor en Ciencias Informáticas, Universidad Nacional de La Plata]. https://doi.org/10.35537/10915/156471

Pincay Ponce, J. I., De Giusti, A. E., Sánchez Andrade, D. A., & Figueroa Suárez, J. A. (2024). CatBoost: Aprendizaje automático de conjunto para la analítica de los factores socioeconómicos que inciden en el rendimiento escolar. Revista Iberoamericana de Tecnología en Educación y Educación en Tecnología, 38, e3. https://doi.org/10.24215/18509959.38.e3

Pincay-Ponce, J., Sánchez-Andrade, D., Caicedo-Ávila, I., & Macías-Valencia, D. (2020, noviembre 27). Clasificación de pacientes según su posibilidad de adquirir Diabetes Mellitus empleando algoritmos de Machine Learning. IV Congreso Internacional Tecnologías de la Información y Computación (CITIC 2020), Calceta, Ecuador. https://tinyurl.com/yve333v7

Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A. V., & Gulin, A. (2019). CatBoost: Unbiased boosting with categorical features (arXiv:1706.09516; Número arXiv:1706.09516). arXiv. http://arxiv.org/abs/1706.09516

Regan, P. C. (1998). Minimum Mate Selection Standards as a Function of Perceived Mate Value, Relationship Context, and Gender. Journal of Psychology & Human Sexuality, 10(1), 53-73. https://doi.org/10.1300/J056v10n01_04

Sharabi, L. L., & Dorrance-Hall, E. (2024). The online dating effect: Where a couple meets predicts the quality of their marriage. Computers in Human Behavior, 150, 107973. https://doi.org/10.1016/j.chb.2023.107973

Van den Broeck, G., Lykov, A., Schleich, M., & Suciu, D. (2022). On the Tractability of SHAP Explanations. Journal of Artificial Intelligence Research, 74, 851-886. https://doi.org/10.1613/jair.1.13283

Weigard, A., & Spencer, R. J. (2023). Benefits and challenges of using logistic regression to assess neuropsychological performance validity: Evidence from a simulation study. The Clinical Neuropsychologist, 37(1), 34-59. https://doi.org/10.1080/13854046.2021.2023650

Ye, Y., Ni, K., Jing, F., Zhou, Y., Tang, W., & Zhang, Q. (2024). Model-Informed Targeted Network Interventions on Social Networks Among Men Who Have Sex With Men in Zhuhai, China. IEEE Transactions on Computational Social Systems, 11(1), 238-246. https://doi.org/10.1109/TCSS.2022.3216756

Zheng, X., Zhao, G., Zhu, L., Zhu, J., & Qian, X. (2022). What You Like, What I Am: Online Dating Recommendation via Matching Individual Preferences with Features. IEEE Transactions on Knowledge and Data Engineering, 1-1. https://doi.org/10.1109/TKDE.2022.3148485

Publicado

2024-11-20

Cómo citar

Pincay-Ponce, J. I., Martínez, M. R., Delgado-Muentes, W. R. ., & Figueroa-Suárez, J. A. . (2024). CatBoost y Regresión Logística como enfoques de aprendizaje automático en el Matchmaking y la Disponibilidad Percibida. Revista Científica De Informática ENCRIPTAR - ISSN: 2737-6389., 7(14), 169–186. https://doi.org/10.56124/encriptar.v7i14.009