La Agencia Estatal de Meteorología (Aemet) ha confirmado esta semana que el pasado mes de febrero fue el segundo más lluvioso de este siglo, con un valor de 123,9 mm en la España peninsular, cifra que representa el 241% del valor normal del mes. Un nivel de precipitaciones que ha dejado importantes inundaciones.
La tecnología avanza a marchas forzadas para servir como herramienta de control y anticipación de estos desastres naturales ante un clima cada vez más volátil y dramático. Satélites, sensores ambientales y millones de datos nutren a la comunidad científica para conocer y adelantarse a los cambios en el clima.
Google lleva años usando la inteligencia artificial para ayudar a predecir eventos de alto riesgo como las inundaciones, mucho antes de que esta tecnología o más bien los modelos de lenguaje, se volviera popular entre los millones de usuarios del buscador de internet. Ahora pretende sumar la fuerza de Gemini a su propuesta con Groundsource, analizando millones de artículos de prensa e informes oficiales.
Sumando datos
Proyectos como el gemelo digital de la Tierra que se está creando en Europa ponen de relieve la necesidad de impulsar la investigación y acumular aún más datos sobre el planeta para mejorar los sistemas de predicción meteorológica.
Las bases de datos aportadas por satélites ofrecen información relevante sobre la extensión de las inundaciones, pero sufren la interferencia de las nubes entre otros inconvenientes. Iniciativas internacionales como el Sistema Global de Alerta y Coordinación de Desastres (GDACS) entre la Unión Europea y las Naciones Unidas que proporciona un inventario de aproximadamente 10.000 entradas.
Inundaciones en el sur y este de España.
En vez de utilizar la información de satélites o sensores, Google ha puesto ahora a trabajar a los modelos de lenguaje detrás de Gemini en busca de información online. Esta IA capaz de resumir texto se dedica ahora a analizar las noticias sobre inundaciones que se publican en medios de todo el mundo, entre otros documentos.
Con Groundsource, la multinacional quiere aportar su granito de arena transformando información pública en archivos de eventos estructurados y localizados. Las noticias analizadas hasta ahora abarcan desde el año 2000 hasta la actualidad y cubren más de 150 países.

Mapa de Groudsource con GDACS
Omicrono
Gracias a ese análisis de la información vertida por los medios, el gigante de internet asegura poder rellenar parte de los huecos de información sobre este fenómeno. En el mapa superior, Google muestra la densidad de inundaciones que ha registrado Groundsource en comparación con las inundaciones registradas por GDACS, señaladas con puntos rojos. España está entre los países más marcados.
Este trabajo se suma a su familia de modelos y conjuntos de datos geoespaciales de IA de Google Earth y se pone a disposición de científicos y autoridades para ofrecer alertas con 24 horas de antelación.

Las previsiones están disponibles en Flood Hub, que cubre a 2.000 millones de personas en más de 150 países. Flood Hub se lanzó en 2016 como un mapa interactivo para lanzar alertas sobre zonas con riesgo de inundación en tiempo real.
Analizando noticias
El proyecto utiliza una nueva metodología basada en la IA de Gemini para verificar la información de millones de informes públicos, tanto noticias como archivos estatales, y traducirlo en un inmenso archivo de datos que los científicos tendrían que crear de forma más lenta.
El primer paso, implica que Gemini extraiga los datos que aportan los medios de comunicación globales, tanto artículos de noticias, informes gubernamentales y boletines locales. Estos archivos han crecido en los últimos años al igual que se han incrementado los desastres naturales.
La metodología de Google analiza únicamente noticias o documentos en los que las inundaciones son el tema principal. Después, Google usa el agente de usuario de Google Read Aloud para aislar el texto original que puede estar en 80 idiomas, este se estandariza al inglés mediante la API de Cloud Translation.
Al Modelo de Lenguaje a Gran Escala (LLM) de Gemini se le da una instrucción sofisticada para guiarle en el proceso de verificación, el paso más delicado. Debe distinguir entre inundaciones en curso o pasadas, descartando artículos que aborden advertencias futuras o declaraciones políticas relacionadas.

Imagen de las inundaciones alrededor del río Tajo, en Portugal, hecha por el Sentinel-1.
Omicrono
Otro detalle clave es determinar la fecha exacta a la que hace referencia esa noticia. Gemini utiliza referencias relativas como “el martes pasado” vinculándola con la fecha de publicación para acotar información. La tercera tarea implica fijar los datos en un punto exacto del mapa. El sistema identifica ubicaciones detalladas (barrios y calles) y las asigna a polígonos espaciales estandarizados utilizando la plataforma Google Maps.
“Al transformar medios no estructurados en datos, hemos generado 2,6 millones de eventos”, aseguran los investigadores que el sistema ha demostrado, no solo su capacidad, sino también su eficacia al capturar entre el 85% y el 100% de las inundaciones graves registradas por GDACS entre 2020 y 2026.
Explica Google que esta misma metodología se podría aplicar también para crear conjuntos de datos históricos sobre otros peligros y así acelerar los esfuerzos globales de resiliencia ante crisis. Además, los investigadores continúan perfeccionando el modelo para ampliar la cobertura a zonas rurales e integrando nuevas fuentes de datos.
