As redes sociais se tornaram uma enxurrada de informações que se transformam em big data. O conteúdo, publicado principalmente pelo público em geral, inclui comentários, críticas, observações, fotografias e vídeos sobre praticamente todo e qualquer assunto. Muitas vezes, as postagens acabam sendo pouco mais do que uma distração no dia a dia agitado das pessoas.

Ainda assim, as redes sociais são um poderoso mecanismo de comunicação.

A empresa de pesquisa de mercado Statista estima que existam 2,77 bilhões de usuários regulares de redes sociais hoje. A tecnologia tem impulsionado o crescimento no número de usuários por meio de servidores progressivamente mais poderosos, velocidades de internet mais rápidas e dispositivos móveis cada vez mais acessíveis em todo o mundo.

Além disso, as plataformas de redes sociais geralmente oferecem APIs que permitem que os desenvolvedores acessem seus bancos de dados para criar aplicativos que usam os dados de redes sociais. Já os cientistas de dados podem agregar e analisar postagens de redes sociais em tempo real e aplicar esses dados a uma ampla variedade de estudos.

Isso inclui descobrir como mitigar congestionamentos de trânsito em estradas, monitorar e responder a eventos nacionais e internacionais à medida que eles se desenrolam, detectar possíveis surtos de doenças e descobrir seu impacto na sociedade.

Na Universidade Estadual de San Diego (SDSU), na Califórnia, o Center for Human Dynamics in the Mobile Age (HDMA) foi fundado em 2013 com o objetivo de transformar pesquisa acadêmica em informações úteis que pudessem levar à tomada de decisões em tempo real e a mudanças bem fundamentadas nas políticas públicas.

O HDMA tem uma abordagem interdisciplinar, que inclui geografia, ciência da computação, engenharia civil, sociologia, saúde pública, linguística, sistemas de informações de gerenciamento, contabilidade, comunicação, assistência social, ciências humanas digitais e assuntos públicos. Ele desenvolve teorias científicas e modelos computacionais para a dinâmica humana (incluindo interações das pessoas em redes de comunicação), big data, redes sociais e ciência de dados.

“Programas desse tipo apontam para o futuro da educação porque têm o potencial de atender a necessidades reais, em vez de serem apenas pesquisas puramente acadêmicas.”

– diz Ming-Hsiang Tsou,
Professor de Geografia da SDSU e Diretor do HDMA.

Tsou também acredita que a geografia é o segredo para entender o big data do mundo real e integrá-lo às atividades e operações diárias das pessoas, fornecendo soluções prontas para uso. Isso porque fontes de dados com base geográfica, como dispositivos de GPS, sensores ambientais e outros instrumentos de monitoramento, especificam onde as coisas ocorrem e fornecem conhecimento contextual para o big data.

“Por sua própria natureza, esses dados são volumosos, confusos, desestruturados e ruidosos. Os conceitos-chave da geografia (lugar, tempo e escala) podem ajudar os cientistas de dados a limpar o ruído, entender o contexto e responder às perguntas quando e onde. Isso pode fornecer maior insight e conhecimento para a análise de dados.”

– diz Tsou.

Por exemplo, a análise de um surto de gripe usando postagens no Twitter que incluam localização geográfica pode ajudar as agências de saúde pública a alocar vacinas para os lugares certos no momento certo.

“Nossa pesquisa se concentra na análise baseada em localização de dados de redes sociais com marcação geográfica. Isso nos permite identificar focos de problemas e comparar nossos resultados dentro dos bairros da cidade ou entre regiões locais, possibilitando a análise e ação.”

– diz Tsou.

Recentemente, o HDMA fez um projeto para determinar os padrões de uso urbano do solo em Pequim, China. Durante seis meses, o grupo coletou 9,5 milhões de mensagens com marcação geográfica da plataforma de rede social Sina-Weibo nas áreas urbanas centrais de Pequim e as comparou com 385.792 pontos de interesse (POI) comerciais do Datatang, um provedor de conteúdo de dados digitais chinês.

Para estimar os tipos e padrões de uso urbano do solo, a equipe criou uma rede de 400 x 400 metros para dividir as áreas urbanas centrais em 18.492 células.

“Ao analisar as tendências de frequência temporal das mensagens de redes sociais dentro de cada célula usando o algoritmo do método Clustering de agrupamento k-means, identificamos sete tipos de agrupamentos de uso do solo em Pequim: áreas residenciais, dormitórios universitários, áreas comerciais, áreas de trabalho, centros de transporte e dois tipos de áreas de uso misto do solo. Usamos mineração de texto, nuvens de palavras e análise de distribuição dos POI para verificar com sucesso os tipos estimados de uso do solo. Essa metodologia pode ajudar os planejadores urbanos a criar e analisar, de forma econômica, padrões atualizados de uso do solo e entender melhor os padrões de atividade humana dinâmica dentro de uma cidade.”

– explica Tsou.


Fique por dentro de todas as novidades do Portal GEO. Faça grátis sua inscrição!

Veja também:

ArcGIS Online: atualizações de outubro de 2019

Exagere nos seus mapas!

O surgimento de uma nuvem geoespacial

Descomplicando o GIS


O Big Data traduzido em informações úteis pelo GIS

O HDMA desenvolveu vários programas de computador para coletar de forma automática ou semiautomática os dados de redes sociais, como Twitter, Sina-Weibo, Google Places e Reddit. Os dados são salvos no MongoDB, um banco de dados NoSQL. O NoSQL fornece uma maneira de armazenar e recuperar dados não modelados em relações tabulares (o método usado em bancos de dados relacionais ou SQL).

Os dados também são exportados do MongoDB para a plataforma ArcGIS a fim de criar mapas de densidade de kernel e de pontos, entre outras análises. Além disso, o HDMA instalou o ArcGIS Enterprise para seus recursos de Servidor GeoEvent de GIS e ArcGIS em um projeto especial que está desenvolvendo para o Escritório de Serviços de Emergência do Condado de San Diego.

O projeto envolve a coleta e o processamento de feeds de dados de tráfego em tempo real do Waze, o aplicativo de navegação de tráfego e crowdsourcing baseado em comunidade. O Servidor GeoEvent hospedará as camadas de dados criadas para um serviço do ArcGIS Online que o condado está montando.

O centro também criou dois conjuntos de ferramentas de software para analisar e exibir os dados coletados de plataformas de redes sociais. O primeiro é o SMART Dashboard, uma ferramenta de pesquisa para mensagens de redes sociais com marcação geográfica. Ele monitora e agrega a disseminação de informações relacionadas a mudanças no comportamento social e fornece informações de como uma população local está respondendo a um evento ou situação. Ele já foi usado para rastrear a disseminação do ebola, concentrações de câncer de ovário, incêndios florestais e furacões.

GIS utilizando Big Data do comportamento de usuários nas redes sociais - imagem 1

O SMART Dashboard é uma ferramenta de pesquisa para mensagens de redes sociais com marcação geográfica. Ele fornece informações sobre como uma população local está respondendo a um evento ou situação.

O segundo é o GeoViewer, um aplicativo de mapeamento baseado na web que visualiza os resultados das análises de redes sociais com marcação geográfica feitas pelo HDMA. Suas funções geoespaciais são fáceis de usar e incluem a capacidade de exibir camadas de dados de focos de problemas e agrupamentos, armazenar imagens multimídia (incluindo fotos e vídeos) e mapear dados históricos e em tempo real das redes sociais. Tsou acredita que esse pode ser um trunfo importante na resposta a emergências.

GIS utilizando Big Data do comportamento de usuários nas redes sociais - imagem 2

O GeoViewer é um aplicativo de mapeamento baseado na web que visualiza os resultados das análises de redes sociais com marcação geográfica que o HDMA faz.

“Os metadados coletados pelas plataformas de redes sociais incluem muitas informações, como a identidade do autor, quando ocorreu a postagem, a localização da postagem com marcação geográfica, o conteúdo da própria postagem, o número de repostagens e assim por diante.”

– disse Tsou.

Embora todos esses dados sejam incrivelmente úteis, também trazem à tona preocupações sobre privacidade, e Tsou e sua equipe estão bem cientes disso.

“Durante nossa pesquisa no HDMA, nos preocupamos com questões de privacidade e tentamos proteger a privacidade dos usuários o máximo que podemos. Por exemplo, nosso software GeoViewer inclui técnicas de geomascaramento para randomizar a localização real dos usuários com marcação geográfica dentro de um raio de 100 metros, mesmo que isso reduza ligeiramente a precisão dos nossos resultados de análise espacial.”

– explica Tsou.

Tsou acha que a ciência de GIS e a ciência de dados se tornarão cada vez mais integradas.

“Isso permitirá a criação de uma nova disciplina, que eu chamo de ciência de dados geoespaciais. Eu a encaro como um campo transdisciplinar que extrairá conhecimento e insights de big data geoespacial usando recursos de computação de alto desempenho, estatísticas espaciais e não espaciais, modelos de análise espaço-temporal, algoritmos de GIS, métodos de aprendizado de máquina e ferramentas de geovisualização.”

Ele também espera que a Nuvem Geoespacial da Esri desempenhe um papel fundamental nesse novo campo, devido à sua infraestrutura cibernética abrangente.

“Sua pilha tecnológica uniforme inclui um hub de geodados para compartilhar ativos e facilitar o envolvimento da comunidade, serviços na nuvem, ferramentas analíticas online, processamento de big data em tempo real e um ótimo conjunto de opções de apresentação”, explica Tsou. “Acredito que a ciência de dados geoespaciais facilitará o pensamento espacial crítico e a resolução de problemas para várias aplicações e setores, e permitirá a exploração de novas teorias científicas.”


Você gostou desse artigo?

O Portal GEO está sempre trabalhando para trazer novidades, tendências e o que há de melhor em dicas do universo GIS. Clique abaixo e faça sua inscrição gratuita para receber com comodidade todos os nossos artigos, que tenho certeza, vão te apoiar em seu cotidiano profissional e pessoal, te deixando sempre bem informado: