Si te estás preguntando cómo monitorear el precio de los alimentos mediante Web Scraping, nos gustaría comentar que esta es una de las labores de mayor relevancia que realizamos como Socios Tecnológicos dentro del ámbito humanitario, debido al alto impacto que genera en el presupuesto familiar el incremento del precio de los alimentos que conforman la canasta básica alimentaria.
Por ejemplo, para la recopilación de precios de alimentos que realizamos en Guatemala, Honduras y Nicaragua hemos usado el siguiente procedimiento y así es como podrías hacerlo tú:
Para obtener la información más precisa y detallada de las actualizaciones y cambios en los precios de alimentos de Centroamérica, recurrimos a dos grandes portales de datos:
Los reportes de SIMPAH se publican semanalmente y desaparecen al publicar nuevos precios. Por ello, las labores de extracción y salvaguarda de los datos es de suma importancia, para monitorear, generando un histórico y detectando cambios abruptos de los precios, lo cual se define como una anomalía.
La Base de datos global de Precios de Alimentos, a pesar de carecer de actualizaciones semanales como los reportes de SIMPAH, permite dar una mirada al pasado y evaluar los precios de los alimentos hace varios meses o incluso un año atrás. Esto puede ser útil para evaluar los cambios que ha experimentado un determinado alimento en el tiempo y anticiparnos a posibles crisis alimentarias.
Pero ¿Cómo monitorear el precio de los alimentos de cualquier país con Web Scraping? A continuación lo explicamos.
El Web Scraping, o “Scrapeo Web”, es una técnica de recolección de datos que permite extraer información de sitios web de manera automatizada y puede ser utilizado para diferentes fines, de manera manual o automática.
Antes de comenzar a hacer Web Scraping, es importante tener en cuenta las políticas de privacidad y de uso de los sitios web que se van a acceder, ya que algunos pueden prohibir o limitar este tipo de actividad si se detecta un uso indebido.
A través de un extenso script de Python realizamos el proceso de extracción de información de las 2 fuentes comentadas anteriormente y se realizan descargas de los reportes semanales de los precios de los alimentos en formato PDF. Luego, usamos técnicas Web Scraping combinadas con minería de texto para extraer los precios de cada documento.
Los datos que han sido extraídos a partir de las técnicas de Web scraping y minería de texto, se organizan en tablas para ser almacenados en una base de datos relacional y se actualizan de forma periódica, lo que garantiza la representatividad en el tiempo de los datos desde un punto de vista estadístico.
En la actualidad, no existe otra base de datos en abierto que se actualice diariamente con los precios de los alimentos para Guatemala, Honduras y Nicaragua.
Tras este proceso, los precios de los alimentos de los 4 países pertenecientes al Corredor Seco Centroamericano, así como sus fluctuaciones, se vuelcan de manera constante a la plataforma PREDISAN de monitoreo de la Seguridad Alimentaria y Nutricional en Centroamérica, que hemos desarrollado junto a Acción Contra El Hambre para permitir ayudar a ONG’s y entidades gubernamentales a la toma de decisiones y a la detección temprana de amenazas que puedan afectar al poder adquisitivo de los consumidores.
Estas fluctuaciones de precios se muestran en el apartado “Amenazas” e influyen en las predicciones SAN que se muestran en el apartado “Predicciones”.
Correo electrónico: info@gis4tech.com