Geocursos 2026: "High-Performance GIS: Otimização de Dados Geoespaciais para Big Data" (16h)

CURSO: "High-Performance GIS: Otimização de Dados Geoespaciais para Big Data ou Engenharia de Dados Geoespaciais: Alta Performance e Economia de Armazenamento com GDAL/OGR" (16h)
DATA: 12 e 13 de junho 2026 (13h às 19h)
INSTRUTOR: Vinícius Vieira Mesquita - vieiramesquita@gmail.com ou vinicius.mesquita@ufg.br
FORMAÇÃO E EXPERIÊNCIA: http://lattes.cnpq.br/5593300644032017
OBJETIVO DO CURSO: Capacitar o profissional a estruturar, otimizar e converter grandes volumes de dados geoespaciais. Ao final do curso, o aluno dominará o uso das ferramentas GDAL/OGR e automação via Shell Scripting e GNU Parallel, sendo capaz de reduzir drasticamente o tempo de processamento e os custos de armazenamento em infraestruturas locais ou em nuvem.
FERRAMENTAS UTILIZADAS: GDAL/OGR; Python; Bash; GNU Parallel
CONTEÚDO PROGRAMÁTICO:
1 - Introdução à Estrutura de Dados Geoespaciais:
Do SIG Desktop ao Big Data: Por que o clique do mouse é o gargalo na era da nuvem e o que mudou. A tríade da eficiência: velocidade de leitura, economia de disco e interoperabilidade. Tipos de dados e novos paradigmas: Rasters, Vetores, Nuvens de Pontos e Tensores. GDAL/OGR: O "canivete suíço" geoespacial e por que dominá-lo. O "Gargalo Invisível": Como o CRS (Sistema de Coordenadas) drena sua performance.
2 - Configuração de Ambiente de Processamento e Análise WSL2 (Linux no Windows): Otimizando o sistema para processamento de dados. O Ecossistema de Linha de Comando: Instalação do binário GDAL/OGR e Python3-GDAL. Navegação básica em Bash para automação. Visualização rápida com QGIS e inspeção de dados com gdalinfo e ogrinfo.
3 - Tratamento de Dados Matriciais/Rasters (GDAL) Otimização de Tipos de Dados: Quando usar Byte vs Int1 vs Float e o seu impacto no tamanho do arquivo em disco e memória Estratégias de Compressão: Quando usar LZW, DEFLATE ou a potência do ZSTD.
Compressão com Perda (Lossy): O uso do LERC para grandes volumes. Cloud Optimized GeoTIFF (COG): Criando arquivos otimizados para acesso via HTTP.
Prática 4 - Tratamento de Dados Vetoriais (Python + OGR)
Além do Shapefile: Por que o formato .shp é o inimigo da performance em Big Data. Formatos de alta performance: GeoPackage, FlatGeobuf e Parquet/GeoParquet - equivalentes ao COG para vetores. O Poder do ogr2ogr: SQL espacial: Filtragem e limpeza de atributos via linha de comando. Otimização de dados vetoriais: Redução de precisão decimal e simplificação de geometrias sem perda de topologia (Douglas Peucker). Limpeza de Esquemas: Selecionando apenas as colunas essenciais para o banco. Indexação Espacial: O uso de R-Tree para buscas ultrarrápidas em milhões de feições.
Prática BÔNUS:
Processamento em Massa com GNU Parallel Multiprocessamento: Como utilizar todos os núcleos do seu processador. Sintaxe do Parallel: Transformando um comando simples em uma fila de processamento paralelo. Exemplo Real: Processar milhares de imagens de satélite ou arquivos vetoriais simultaneamente.
Observação: Conceitos básicos de cartografia, noções básicas de lógica de programação (variáveis, loops, etc.) e noções de uso e navegação em terminal de sistema operacional.
High-Performance GIS: Otimização de Dados Geoespaciais para Big Data ou Engenharia de Dados Geoespaciais: Alta Performance e Economia de Armazenamento com GDAL/OGR
Data: 03 e 04 de julho 2026 (Sexta 14h - 20h, sábado 9h - 16h)
Doutor em Ciências Ambientais (UFG) & Pesquisador Assistente | Coordenador Técnico do Mapeamento de Pastagens