Niantic anuncia “Large Geospatial Model” treinado em dados de jogadores de Pokémon GO

A Niantic, empresa por trás do Pokémon GO, divulgou recentemente um comunicado que pode surpreender muita gente: eles pretendem criar um modelo de inteligência artificial geoespacial em larga escala, chamado de Large Geospatial Model (LGM). A ideia, de forma simplificada, é utilizar os dados de escaneamento de PokéStops — realizados pelos próprios jogadores — para construir uma visão tridimensional e contextualizada do mundo real.

Mas o que isso significa na prática? E como as informações que geramos enquanto jogamos podem contribuir para a criação de um modelo em nível global? Vamos explorar os principais pontos desse anúncio e como tudo se conecta ao universo de geoinformação e modelos espaciais.


O que é o “Large Geospatial Model” (LGM)?

A Niantic descreve o LGM como um modelo de IA que entende e navega pelo mundo físico de forma semelhante ao raciocínio humano. Enquanto grandes modelos de linguagem (como o ChatGPT) analisam texto para “aprender” padrões linguísticos, o LGM analisaria imagens e escaneamentos em 3D de lugares reais para entender:

  • Estruturas físicas (como prédios, monumentos e ruas)
  • Características arquitetônicas (por exemplo, como são as igrejas em diferentes regiões)
  • Contexto cultural (estilos de construção em diferentes cidades e países)

Dessa forma, o LGM não apenas reconheceria a forma de um objeto, mas teria uma “compreensão” mais ampla do que ele é e como se encaixa em uma paisagem urbana ou rural.


Como a Niantic está usando nossos dados?

Os jogadores de Pokémon GO podem escanear PokéStops e ginásios, gerando milhares de imagens em 3D desses locais. Até o momento, esses dados vinham sendo usados para criar e aprimorar o Visual Positioning System (VPS) da Niantic, que permite localizar um smartphone no mundo real com precisão de centímetros.

No entanto, o próximo passo é bem mais ambicioso: juntar esses “modelos locais” (que analisam apenas um lugar específico) em um “modelo global” (LGM), capaz de preencher lacunas e inferir como uma edificação se parece mesmo em partes não escaneadas. Para isso, a Niantic precisará de bilhões de imagens e bilhões de horas de escaneamentos — algo que não está disponível em qualquer banco de dados na internet. Logo, a participação da comunidade de jogadores se mostra essencial.


De modelos locais a um modelo global

Até agora, cada local escaneado gera o que se chama de “modelo local”, isto é, um conjunto de dados e uma rede neural que entendem somente aquele lugar específico. O LGM funcionaria como um “agregador”: ele combinaria milhares ou milhões de modelos locais para criar uma visão unificada.

Imagine que o “modelo local” de uma igreja capture apenas a frente do prédio. Esse modelo, isoladamente, não reconheceria o mesmo prédio se você estivesse na parte de trás. Já um LGM, ao comparar diversas igrejas escaneadas no mundo inteiro, poderia “deduzir” como é a parte de trás dessa igreja, mesmo sem ter recebido um escaneamento específico desse ponto. Esse raciocínio se baseia em características comuns de construções e informações culturais aprendidas pelo modelo ao longo do treinamento em diferentes regiões do planeta.

Hoje, a Niantic tem 10 milhões de locais escaneados ao redor do mundo, e mais de 1 milhão deles estão ativados e disponíveis para uso em seu serviço VPS . Eles recebem cerca de 1 milhão de novos scans a cada semana, cada um contendo centenas de imagens discretas. 


Até onde vai essa tecnologia?

A Niantic ressalta que esse é um projeto ambicioso e ainda distante de ser concluído. Eles contam com dados provenientes de mais de 10 milhões de locais escaneados ao redor do mundo, porém, apenas 1 milhão desses locais foram processados e estão efetivamente prontos para uso no VPS. Para um LGM “completo”, ainda será preciso mais volume de dados e potentes recursos de computação.

É interessante notar que a capacidade de “pensar como um humano” no espaço físico traz possibilidades quase infinitas — desde a navegação em mapas 3D hiper-realistas, até a criação de experiências de realidade aumentada cada vez mais imersivas. Entretanto, levanta também questionamentos sobre privacidade, uso de dados e autonomia de IA na interpretação do mundo.


Reflexões finais

O anúncio da Niantic reforça como o mapeamento 3D e o uso de dados colaborativos são peças-chave para tecnologias que aproximam o digital do mundo real. O “Large Geospatial Model” é uma grande aposta para quem trabalha com geoinformação, inteligência artificial e realidade aumentada.

Para nós, que acompanhamos o universo de geotecnologias, fica a lição de que os modelos de IA vão além do texto e da linguagem: agora, eles também podem se apoiar em dados visuais e geoespaciais para compreender o planeta em que vivemos. E se a Niantic conseguir atingir seu objetivo, poderemos ver um salto significativo no modo como interagimos com espaços virtuais no mundo real — tudo graças à colaboração involuntária (ou não) de milhões de jogadores e suas câmeras de smartphone.


E você, o que acha dessa nova tecnologia? Acredita que veremos em breve modelos geoespaciais tão poderosos quanto os grandes modelos de linguagem? Compartilhe a sua opinião aqui no GeoDescomplicado!


Referências

Post oficial da Niantic anunciando o Large Geospatial Model: https://nianticlabs.com/news/largegeospatialmodel?hl=en