Aprendizaje automático para la investigación económica: ¿cuándo, cuál y cómo?

in #economiclast year

Este artículo está dirigido a economistas interesados en utilizar el aprendizaje automático (ML) para sus investigaciones y aplicaciones, y científicos de datos que deseen aplicar sus herramientas para el análisis económico.

1_R4d0gzIml16Udl7gt4y_Sg.webp

Fondo:
Recientemente, asistí a la sesión de educación continua de la Asociación Económica Estadounidense sobre Aprendizaje Automático y Big Data a cargo de Melissa Dell (Universidad de Harvard) y Matthew Harding (UC Irvine) en la reunión anual de ASSA 2023, la mayor reunión de científicos sociales.

En este breve artículo, he resumido las lecciones clave aprendidas de esas sesiones y una breve reseña de artículos seleccionados publicados en la principal revista de economía que utiliza ML.

Nota: el artículo es más sugerente que explicativo y está categorizado en tres secciones principales, cada una de las cuales se enfoca en una pregunta clave:

¿Cuándo ML es útil en economía?

¿Qué modelos de ML se recomiendan?

¿Cómo utilizar ML para sus aplicaciones económicas?

Terminamos el blog con una discusión sobre la

limitaciones del ML en su forma actual. En el camino, también proporcionaré enlaces a recursos útiles.

Terminamos el blog con una discusión sobre las limitaciones de ML en su forma actual. En el camino, también proporcionaré enlaces a recursos útiles.

1_kmpZq4RCrDjwaosy9JlIFw.webp

¿Cuándo ML es útil en economía?
Tanto Melissa como Matthew, en su curso, argumentaron los siguientes tres casos en los que los modelos ML podrían agregar valor para el análisis económico.

  1. Para tratar datos no tradicionales, como imágenes, textos, etc.
    Los conjuntos de datos granulares y no tradicionales, como imágenes, textos, audio y videos, son difíciles de procesar utilizando modelos econométricos tradicionales; por lo tanto, ML podría usarse para extraer información útil en esos casos.

Por ejemplo, en Hansen et al. (2018), publicado en QJE, los autores responden cómo la transparencia afecta las deliberaciones de los responsables de la política monetaria utilizando datos NLP y algoritmos ML. Del mismo modo, Larsen et al. (2021), publicado en JME, utilizan grandes corpus de noticias y algoritmos de ML para investigar el papel que juegan los medios de comunicación en el proceso de formación de expectativas de los hogares.

  1. Para capturar la no linealidad que es difícil usando modelos tradicionales
    El ML podría ser útil si los datos y la aplicación contienen una fuerte no linealidad, que es difícil de capturar con los enfoques tradicionales.

Por ejemplo, en Maliar et al. (2021), publicado en JME, los autores usan ML para resolver un modelo económico dinámico al convertirlos en un conjunto de ecuaciones de regresión no lineal. De manera similar, en Kleinberg et al. (2018), publicado en QJE, los autores evalúan si el LA puede mejorar las decisiones de los jueces con o sin fianza. Aunque el resultado es binario, este es un problema muy complejo que exige procesar datos complejos para tomar decisiones prudentes.

  1. Para procesar datos tradicionales a escala para mejorar la precisión de la predicción o extraer nueva información
    ML podría ser útil para procesar datos grandes y complejos (grandes) con muchas variables. Los modelos ML pueden ayudar a: 1. mejorar la precisión de la predicción, 2. extraer nueva información o 3. automatizar la extracción de características.

Bianchi et al. (2022), publicado en AER, muestran que ML se puede implementar de manera productiva en un entorno rico en datos para corregir errores en el juicio humano en la respuesta de la encuesta y mejorar la precisión predictiva. De manera similar, en Bandiera et al. (2020), publicado en JPE, los autores miden el comportamiento del CEO utilizando datos de diario de alta frecuencia y alta dimensión y un algoritmo ML. Finalmente, en Farbmacher et al. (2020), publicado en JoE, el autor usa ML para la detección de fraude en reclamos de seguros utilizando datos altamente desestructurados.

ML probablemente no sea útil para los casos en los que la complejidad de los datos (que podría estar relacionada con la forma, el tamaño, la colinealidad, la no linealidad, etc.) es pequeña y los modelos econométricos tradicionales probablemente serían suficientes. Sin embargo, si la complejidad de los datos aumenta, es decir, cuando se trata de big data, el valor agregado por los modelos ML podría ser mayor (como se muestra en el gráfico anterior).

¿Qué modelos de ML se recomiendan?

  1. Cuando se trata de datos de texto, el modelo de "transformador" es útil
    Se podrían usar muchos modelos de lenguaje grandes para procesar datos de texto; sin embargo, se ha demostrado que los modelos de transformadores son más útiles. Hay varios recursos para aprender sobre ellos, incluido este curso de Coursera de Andrew Ng, y también encontré útil este artículo de Medium.

  2. Cuando se trata de imágenes, el modelo "ConvNext" es útil
    Se pueden emplear muchas arquitecturas CNN para procesar imágenes, pero el modelo ConvNext ha demostrado ser más exitoso. Nuevamente, puede leer este documento para obtener una explicación detallada del modelo y este artículo de Medium para una comprensión intuitiva.

  3. Cuando se trata de datos tradicionales en economía, los modelos de "aprendizaje conjunto" son útiles
    Los modelos de aprendizaje de conjunto podrían ser útiles si el tamaño de los datos es pequeño pero incluye muchas características y si hay colinealidad o no linealidad, lo cual es difícil de capturar. Hay muchos recursos para aprender sobre estos modelos, incluido este curso de Coursera y este artículo de Medium.

  4. En el modelado de decisiones estratégicas, el "aprendizaje de refuerzo" es útil
    RL podría ser útil si el objetivo principal es modelar decisiones estratégicas complejas en aplicaciones económicas donde solo se puede observar información parcial. Sin embargo, esto se encuentra en una etapa inicial y solo hay unas pocas aplicaciones en economía donde se puede usar, por ejemplo, el documento de economista de IA y una aplicación en pagos. Puedes aprender más sobre RL en este Libro de Sutton y Barto y este curso de Coursera.

  5. Cuando el enfoque está en la inferencia causal, el "ML causal" puede ayudar
    El ML causal podría ser útil cuando el objetivo principal es hacer inferencias causales, pero el conjunto de datos es grande y complejo. Esta es un área emergente de investigación; sin embargo, puede consultar este curso de Stanford y un trabajo de investigación de Susan Athey para obtener más información. Para una comprensión intuitiva sin demasiados detalles técnicos.

Coin Marketplace

STEEM 0.20
TRX 0.13
JST 0.029
BTC 66649.04
ETH 3352.77
USDT 1.00
SBD 2.70