El método que predice el precio de los alimentos

La preocupación de los ciudadanos de países como Honduras, Guatemala, Nicaragua, El Salvador o Venezuela por el Precio de la Canasta Básica Alimentaria es muy alta debido a la influencia que tienen en él factores climáticos o políticos

También lo es para las organizaciones sin ánimo de lucro con las que colaboramos, que se preguntan cómo poder conocer el método que predice el precio de los alimentos y su evolución para poder tomar decisiones de cara a la prestación de ayudas a familias cuya situación económica les dificulta comprar estos alimentos básicos.

En GIS4tech hemos estado trabajando en el proceso de predicción de los precios de la Canasta Básica Alimentaria de Venezuela utilizando como datos los reportes de CENDA (Centro de Documentación y Análisis para los Trabajadores), del Banco Central de Venezuela y de DolarToday, referente en tipos de cambio.

¿Qué es la canasta básica alimentaria?

La Canasta Básica Alimentaria es el conjunto de diversos alimento expresados en cantidades, para satisfacer las necesidades de calorías de un hogar promedio, compuesta por lácteos, carnes, huevos, legumbres, cereales, azucares, grasas, verduras y fruta.

El método que predice el precio de los alimentos

1. Web Scraping del precio de los alimentos

Realizamos un proceso de extracción de datos de los precios de la Canasta Básica Alimentaria de la página CENDA de Venezuela en diferentes formatos:
Gráfica de predicción de la canasta básica alimentaria

Los formatos “Scraping Datos PDFs” y “Scraping HTML o Franja Animada” reportan los precios de la Canasta Básica Alimentaria en Dólares (US), pero los reportes Web poseen los precios en Bolívares, lo que implica que se debe aplicar una tasa de cambio para hacer la transformación a Dólares (US), para lo que se realizó otro Web Scraping de la página “DolarToday” y se utilizaron los datos históricos del Banco Central de Venezuela (BCV):

Predicción real del precio de los alimentos a 30 días usando la metodología ARIMA y google trends

2. Reconstrucción e integración de los datos

Se emplearon datos del BCV para reconstruir la serie temporal en el periodo donde se tenían datos de CENDA previos al 2021 y datos de DolarToday a partir del 2021.

Con ello, conseguimos obtener la cantidad mínima necesaria de datos para completar la serie de datos de precios del dólar de años anteriores, imprescindibles para crear esa serie temporal y reflejar las variaciones en el precio de los alimentos en el tiempo, y, a su vez, predecir los precios futuros de la Canasta Básica Alimentaria aplicando un algoritmo de Machine LearningARIMA” Modelo Autorregresivo Integrado de Media Móvil, que se utiliza para encontrar patrones que permitan predecir datos:

3. Evaluación de la capacidad de predicción de la herramienta ARIMA

Antes de poder predecir de manera directa la serie de precios, se construyeron datos de entrenamiento y validación para evaluar la capacidad predictiva del modelo. En la imagen se pueden apreciar los resultados del entrenamiento del algoritmo ARIMA solo para 2021, que reproduce la tendencia:
Gráfica de predicción de datos para el método que estima el precio de los alimentos
Tras examinar los errores y comprobar la capacidad predictiva del algoritmo, se procedió a entrenar el algoritmo con la serie completa y realizar una predicción a 30 días (en azul):
Gráfica de predicción de la canasta básica alimentaria

4. Predicción de la evolución del precio de la Canasta Básica Alimentaria con ARIMA

En la siguiente gráfica se ve como, gracias a los datos obtenidos y reconstruidos desde 2010 hasta 2021, se pudieron predecir los precios futuros de la Canasta Básica de Alimentos para todo el periodo octubre 2021 – octubre 2022:
Gráfica de predicción de la canasta básica de CENDA alimentaria

5. Predicción de la evolución del precio de la Canasta Básica de Alimentos con ARIMA + Google Trends

Incorporamos a las variables ya incluidas en el algoritmo ARIMA una variable externa compuesta por las búsquedas que realizan las personas de la Canasta Básica en Internet reflejadas en Google Trends desde 2010 hasta la fecha en la que desarrollamos este proceso para conseguir una predicción de los precios precisa y exacta, reflejadas en la siguiente imagen; las búsquedas se correlacionan con los precios de la Canasta Básica de Alimentos:

Gráfica de predicción de la canasta básica de mediante búsquedas en google

Después, se entrenó un nuevo algoritmo incorporando la variable representada por las búsquedas de la palabra clave de Google Trends comentadas anteriormente. El resultado muestra error promedio de predicción mínimo de 4.88 $ (US), lo que indica que el algoritmo logra reproducir los cambios de tendencia de los precios con un bajo margen de error:

Gráfico de errores

Tras ello, se procedió a la predicción real de los precios de la Canasta Básica de Alimentos para el periodo octubre 2021 – octubre 2022 en base a la serie histórica y a Google Trends:

Predicción real del precio de los alimentos usando la metodología ARIMA y google trends

Por último, se realizó la predicción de los precios de la Canasta Básica Alimentaria para los siguientes 30 días en base a la serie histórica y a Google Trends:

Predicción real del precio de los alimentos a 30 días usando la metodología ARIMA y google trends
Comparte en:

Si quieres saber más sobre la metodología usada o sobre cómo la hemos volcado al público