FLUJOS MIGRATORIOS


Bienvenidos a nuestro proyecto Final de Data Scientist en Henry.

Los flujos migratorios representan el constante y dinámico movimiento de personas a lo largo de la historia, transformando sociedades y enriqueciendo culturas. Este fenómeno humano, arraigado en la búsqueda de oportunidades, seguridad y una mejor calidad de vida, ha moldeado el mundo de maneras inimaginables.

Desde las migraciones tempranas de poblaciones ancestrales hasta los complejos patrones de movilidad contemporánea, la migración ha sido una fuerza impulsora del cambio y la adaptación en todo el mundo. En la actualidad, este fenómeno trasciende fronteras y continentes, impulsado por una variedad de factores multifacéticos.

Los motivos que impulsan estos flujos son diversos y abarcan desde conflictos geopolíticos, desastres naturales, oportunidades laborales, hasta la búsqueda de estabilidad y reunificación familiar. Asimismo, las políticas gubernamentales y los sistemas legales influyen en la dirección y magnitud de estos movimientos poblacionales.

Imagen de migración
En nuestro análisis de flujos migratorios, exploramos tanto la migración interna como la internacional. Estudiamos detenidamente como esta relacionada con condiciones económicas, sociales y ambientales a través de su relación con inidicadores específicos. Determinamos la importancia de cada uno y el impacto de su variación.

Este analisis busca entender el proceso migratorio en Argentina, considerando diversos factores como indicadores económicos, ambientales y sociales y su relación con la migración.
Se pretende examinar cómo la variación de estos indicadores impacta en la cantidad de migrantes que ingresan o salen de Argentina. Además, se llevará a cabo una caracterización exhaustiva del proceso migratorio en el país, incluyendo el análisis de la cantidad de migrantes, sus países de origen y destino. Asimismo, se realizará un estudio detallado sobre la distribución geográfica de la población inmigrante en Argentina, explorando en qué provincias se establecen con mayor frecuencia.
El análisis también se enfocará en identificar y calcular indicadores clave de rendimiento con el propósito de lograr una distribución equitativa y homogénea de los inmigrantes a lo largo y ancho del territorio argentino.

Únete a nosotros en este viaje para explorar y comprender la complejidad y el significado de los flujos migratorios en nuestro mundo contemporáneo.

Desarrollo


Para el desarrollo de este proyecto realizamos varios procesos fundamentales para poder cumplir con los objetivos

machine-learning

Exploración de datos

Exploración de datos, aplicación de métodos estadísticos. Revisión de outliers.

+
machine-learning

Procesamiento de datos

Recolección, limpieza y transformacion de datos. Desarrollo de flujos de trabajo automatizados en Google Cloud.

+
machine-learning

Visualización de datos

Creación de dashboards interactivos, creación de KPIs.

+
machine-learning

Machine Learning

Desarrollo de modelo de Machine Learning.

+

Análisis


Impacto de indicadores en la migración neta

Nuestro estudio se enfocó en comprender la relación entre indicadores clave y la migración neta, utilizando dos enfoques distintos. En primer lugar, analizamos esta relación a escala global, examinando datos de todos los países durante el período estudiado. Se calcularon los coeficientes de regresión lineal entre la migración neta y cada indicador, revelando resultados interesantes.

Posteriormente, nos centramos en Argentina, nuestro país de interés, reconociendo que la variación de los indicadores puede impactar de manera diferente debido a las singularidades de cada nación. Al realizar un análisis similar pero exclusivamente con datos de Argentina, observamos coeficientes de regresión más significativos en comparación con el análisis global.

Ambos enfoques coincidieron en identificar los indicadores más correlacionados con la migración neta:

Nivel de Ingresos : Se evidenció que a mayor nivel de ingresos, hay una tendencia hacia una migración neta más alta.
Tasa de Pobreza : Existe una relación inversa, donde a mayor tasa de pobreza, se registra una migración neta menor.
Cantidad de Importaciones : Una mayor cantidad de importaciones se asoció con una migración neta más elevada.

Un hallazgo particularmente intrigante fue la correlación positiva entre la cantidad de importaciones y la migración neta, un aspecto que merece un análisis más profundo para comprender su alcance y significado para el país. Es crucial explorar cómo el aumento en las importaciones influye en la migración neta de una nación.


Caracterización del proceso migratorio en argentina

Al observar el flujo migratorio en Argentina desde 1990 hasta 2020, identificamos tendencias notables en cuanto a los países de origen y destino de los migrantes. Inicialmente, Italia fue el principal país de origen de los inmigrantes, sin embargo, a partir de 1995, Paraguay ocupó ese lugar.
En cuanto a los destinos elegidos por los emigrantes argentinos, España y Estados Unidos se destacan como los principales receptores durante el período estudiado.


Relación entre indicadores y flujos migratorios

Al comparar los indicadores de los países de origen y destino de los migrantes argentinos, se observa una consistencia con los hallazgos previos. Países como España, Estados Unidos e Israel, destinos preferidos por los emigrantes argentinos, muestran valores más altos en el indicador de importaciones.
Sin embargo, es intrigante notar que, a pesar de tener una alta tasa de pobreza, Argentina recibe inmigrantes de naciones con una mejor situación económica. Esto sugiere la influencia de otros factores no analizados que podrían estar impulsando la migración hacia Argentina.


Radicación de inmigrantes dentro de Argentina

Distribución de inmigrantes por Provincias : La provincia de Buenos Aires alberga casi la mitad de los inmigrantes en Argentina, con un impresionante 46.6% de la población inmigrante residiendo allí. Le sigue la Ciudad Autónoma de Buenos Aires, que acoge al 28.68%. Esto indica una marcada concentración en el área metropolitana más grande del país por lo que como parte del nuestra propuesta, decidimos trabajar en distribuir los flujos hacia el interior.

Origen de los Inmigrantes : Los países vecinos, como Paraguay y Bolivia, representan conjuntamente más del 50% de la población inmigrante en Argentina. Con Paraguay liderando con un 29.84% y Bolivia con un 21.77%, estos datos subrayan la influencia significativa de las naciones limítrofes en el flujo migratorio hacia Argentina.

Distribución por Género y Edad : La mayoría de los inmigrantes son mujeres, representando un 51.64% de la población inmigrante total. En cuanto a la edad, los grupos de 30 a 54 años abarcan casi el 40% de la población inmigrante, destacando una migración predominantemente en edad laboral.

Implicaciones Socioeconómicas : La preeminencia de provincias como Buenos Aires y la alta concentración de inmigrantes de países vecinos pueden tener repercusiones en la dinámica económica y social del país. Esto puede incluir una diversidad cultural enriquecedora, pero también desafíos en términos de integración, empleo y servicios sociales que se no se deben descuidar.

Retos y Oportunidades : La concentración geográfica y la diversidad de orígenes sugieren la necesidad de programas de integración cultural y laboral adaptados a las necesidades específicas de estos grupos. Además, la distribución por género y edad destaca la importancia de políticas que aborden tanto las necesidades laborales como las de integración familiar y social.

Estos datos revelan patrones significativos en la radicación de inmigrantes en Argentina, ofreciendo una visión detallada de las áreas clave que podrían requerir enfoque por parte de políticas públicas y programas de integración.

Dashboard


Modelo de Machine Learning


Modelo de predicción:
"Variación de stock migratorio en Argentina"

El propósito principal del modelo consiste en estimar el impacto de las variaciones en los indicadores, Ingresos per cápita, Acceso a electricidad, Crecimiento PBI per cápita, Importaciones de Mercadería, Personas desempleadas de educación avanzada, Pobreza y Mortalidad, en la cantidad de inmigrantes que recibe argentina.

Para la construcción de este modelo, se generó un conjunto de datos que abarca el período de 1995 a 2020, incluyendo información sobre el stock migratorio (valor a predecir) de todos los países reconocidos por las Naciones Unidas. Este conjunto de datos también contiene los valores correspondientes a los indicadores mencionados.

Se seleccionaron las filas que contenían más del 70% de las características no nulas, y se realizaron imputaciones de valores faltantes mediante la técnica de KNN.
Se exploraron varios modelos de regresión, siendo XGBoostRegressor el que ofreció el rendimiento óptimo, ajustando los hiperparámetros con OPTUNA con cross validation.

En términos de evaluación del modelo, se logró un coeficiente de determinación (R2) de 0.97, aunque el Valor Absoluto Medio (MAE) fue de 339239. Al analizar las predicciones para Argentina, se observó que, en el conjunto de pruebas, las predicciones fueron sistemáticamente menores que los valores reales, pero copiaban la tendencia de los valores reales.

Mediante la librearia Streamlit se creo una aplicación que determina el porcentaje de variacion del stock migratorio en Argentina ante variaciones en los indicadores estudiados.


Puede ver la aplicación ingresando a este link.
Tambien puede ver con mas detalle el desarrollo de este modelo en este repositorio.