Artigos Conhecimento Projeto Tecnologia

Big Data, Machine Learning e as Eleições

Mas o que tem a ver Big Data, Machine Learning e as eleições?

Muita coisa, mais do que você imagina, ou seria uma teoria da conspiração? Bem, antes vamos tratar de entender alguns conceitos, não sou expert no assunto, mas sempre tento nos meus artigos, dar uma visão particular sobre o que ando lendo e vendo.

BIG DATA

BIG DATA é um termo utilizado para descrever um imenso volume de dados, que podem estar estruturados ou não, e que de alguma forma impactam os negócios no dia a dia.  Acredito ser muitas vezes um termo mal utilizado, pois o usam para qualquer coisa que envolve este universo da ciência dos dados.

E quando a gente fala de BIG DATA, conceitualmente estamos nos referindo na verdade a um banco de dados que você manipula ele diferentemente de um banco de dados normal, pois se trabalha com uma quantidade absurda de dados, uma quantidade em grande escala e muito dinâmico.

Basicamente é uma tecnologia de armazenamento e manipulação de dados em grande escala.  Só que as pessoas acabam colocando tudo neste mesmo “guarda chuva”, quando vou usar por exemplo um MACHINE LEARNING em uma análise de texto, acabam tratando como se fosse um Big Data, mas 90% dos projetos de Machine Learning, de ciência de dados, não usam esta estrutura de Big Data.

MACHINE LEARNING

E o que seria o Machine Learning (Aprendizado de Máquina ou Máquinas Aprendendo?) que acabei de citar? São algoritmos desenvolvidos para tentar fazer o computador/sistema aprender através de algum tipo de dado, através de tentativa e erro, procurando reconhecer padrões e fazer previsões.

Como exemplo, um programa de reconhecimento facial, que agrupa os dados que são mais parecidos, para tentar chegar em uma identificação facial com mais padronização.

Técnica de aprendizado para encontrar padrão nos dados, seja através de fotos, vídeos ou textos, podendo ser usada até quando você conhece o padrão do seu problema, pois então você limita a pesquisa da sua “máquina”, enfim, existem vários tipos de aprendizado que estão sendo desenvolvidos para identificar padrões, resolver problemas, etc.

DEEP LEARNING E REDES NEURAIS

Já que falamos do ML, não poderia deixar de citar o Deep Learning que é um sub grupo do estudo de Machine Learning, que é um sub grupo da Inteligência Artificial, parece coisa futurista, mas são técnicas que estão sendo desenvolvidas para tentar fazer um computador pensar.

Deep Learning pode ser considerado também uma nova forma de chamar as Redes Neurais, e o que são redes neurais? Bom, muitos tentam criar um computador que pense, dessa forma os cientistas começaram a analisar como funcionava o cérebro dos humanos, para tentar replicar este processo para os computadores, daí surgiu esta técnica que atualmente é chamada de Deep Learning.  Deep Learning são as etapas que o computador realiza para tentar descobrir uma determinada coisa.

Etapas como camadas de aprendizado, onde cada camada define padrões (olhem eles ainda de novo) que ajudariam a máquina a identificar um objetivo, um destino, um objeto, uma foto, uma informação etc. até que ele chegue a uma decisão. E é assim que a gente também interpreta as coisas, isto é, através de várias etapas, tudo acontece muito rápido, mas os cientistas descobriram este nosso padrão e tentam replicar nas máquinas.

Mas vamos ao que interessa!

Mas voltando ao Big Data, atualmente diversas empresas usam, e um bom exemplo muito conhecido por todos é o NetFlix, se bem que ele foca mais na inteligência do tratamento que ele dá nesses dados, do que na verdade no armazenamento destes dados, o que chamaríamos de Machine Learning (confuso?), e o Netflix é um estudo de caso bem interessante, um dos mais famosos.

A parte técnica obviamente é um segredo industrial, mas é previsível que eles usem uma dezena de combinações de Machine Learning, capturando qualquer coisa que você esteja fazendo naquele ambiente, quando está vendo, consultando ou pesquisando por um filme, e mesmo quando você não assiste aquele filme, ele percebe quanto tempo você demora de um filme para o outro, as pausas que você dá durante um filme, tudo ele captura para gerar dados e tentar “imaginar” e criar um conteúdo que as pessoas tenham ou não interesse, e definitivamente a Netflix está gerando conteúdo baseado nestas informações.

A série Stranger Things é um bom exemplo disso, como também House of Cards.  Imagino que eles devem ter padrões relacionados até sobre o ritmo do filme, o que deveria e quando deveria acontecer momentos impactantes para ajudar a fazer as pessoas continuarem assistindo, ou mesmo quando ele sugere filmes, etc.

Existe também aqueles dados que a gente nem imagina que são capturados e são utilizados pelas empresas para um marketing ou fornecimento de conteúdo, revenda de dados, informação, etc., isso sem ao menos você perceber. Só em andar com celular você já está fornecendo informações, sem perceber, que serão processadas.

A velocidade que você anda, a frequência com que você pega no celular, toca na tela do celular, arrasta o dedo sobre um lugar, isso possibilita a eles inferir se determinado nicho de público é mais ansioso que outro, ou qual a tendência de comportamento, pelo que você consume de mídia, e mais o tempo que você ativa a tela do seu celular, localização geográfica, etc.  mesmo com o GPS desligado, o seu celular de alguma forma identifica sua posição.

Existem aplicativos, plugs in etc, os quais bastam passar perto de uma Starbucks por exemplo, para surgir aquela notificação.  E mais, eles acabam identificando seus gostos, o tipo de bebida que você gosta, o estilo de roupa que é mais atrativo, e vão te dando descontos em cima disso, promoção daquilo, sendo gerada através da manipulação dos seus próprios dados e atividades.  Quem nunca passou por um lugar e o Google, perguntou, “você esteve no shopping tal?” “O que achou?”

O que assusta mais ainda, é que muitas destas informações, somos nós mesmos os responsáveis por fornecer de forma voluntaria, quando nos cadastramos nas redes sociais, disponibilizando várias informações pessoais, fotos, e dados que são utilizados e forma que a gente nem imagina.

E o que as campanhas políticas tem a ver com tudo isso?

As campanhas políticas tem utilizado muito estas iterações sociais, com o objetivo em determinar perfis de possíveis eleitores de um determinado candidato.  No caso da eleição americana, isto ficou evidente, pois a Hillary Clinton era a favorita para ganhar as eleições, porém quando saiu o resultado e o Donald Trump venceu, todos ficaram se perguntando o que aconteceu, e havia uma discussão em certo momento, citando uma Cambridge Analytica, que teria sido a empresa que trabalhou no marketing do Donald Trump, fazendo campanha no Facebook, direcionando no Facebook o que um potencial eleitor de Trump gostaria de ler ou ver, e este tipo de ação não conseguiu ser computada pelos programas estatísticos que indicavam as tendências de campanha, causando desequilíbrio nas campanhas de ambos candidatos.

E é por isso que as redes sociais precisam de você cada vez mais lá dentro.  O Facebook, por exemplo, precisa cada vez mais que você permaneça interagindo na rede, para que ele consiga traçar um perfil mais claro de você.  Por isso ele fica comprando as redes sociais mais utilizadas (instagram, whatsapp, linkedin, etc) para ter cada vez acesso a uma maior quantidade de dados que cada rede social captura.

Por esta razão, ele explora certas coisas que irão prender você por lá, e boa parte dessas coisas são ligadas nas emoções, para mexer com as pessoas e fazerem elas reagirem.  Aliado a isso, surgiram as Fake News, criadas para gerarem conteúdo e consequentemente atenção que gera monetização, obviamente para influenciar as pessoas.  De acordo com um levantamento de um grupo de pesquisa da USP, cerca de 12 milhões de pessoas difundem notícias falsas sobre política no Brasil.

Se considerada a média de 200 seguidores para cada pessoa, o alcance pode chegar a toda população.  É um fenômeno recente, que já impactou eleições em outros países, como a França e Argentina, e especialmente os Estados Unidos.

E o Trump estava fazendo campanha com coisas muito pontuais e simplistas, principalmente para o americano branco pobre que se sente prejudicado pela evolução das questões dos direitos humanos, direitos da igualdade da mulher, igualdade do imigrante, ele se sente mal com a perda de poder aquisitivo, empregos, procurando sempre alguém para culpar, neste contexto, o Trump veio representar este papel, pois ele põe a culpa nas minorias, imigrantes etc e assim consegue inflar estas pessoas, deu motivo para que elas saíssem de casa e votassem.

Enfim, uma coisa é certa, nas próximas eleições brasileiras, o Fake News terá presença certa, com certeza.

E com a tendência das pessoas de se acomodar em buscar informação apenas pela internet, só fortalece o efeito que estas ferramentas causam.  A maioria não procura se aprofundar nos assuntos através de um livro, um artigo detalhado, um texto mais longo, ou até mesmo de um papo de alto nível com os amigos, muita gente optou por receber suas informações única e exclusivamente somente pela internet, assim, por trás de cada “like” e compartilhamento seu, a internet vai traçando seu perfil, de repente você começa a perceber que nos últimos tempos, seus amigos do face meio que pensam como você, as notícias que aparecem para você são aquelas que mais tem a ver com suas opiniões, compartilhando com seus anseios.

Tudo isso tem a ver com o perfil que você vai criando na internet, de acordo com as coisas que você curte, compartilha, comenta ou interage de alguma forma.  Por exemplo: você vai no Google e busca por Caribe, e em uma outra busca, quando vai abrir um site qualquer, surgem anúncios oferecendo uma ótima promoção de um cruzeiro no Caribe.

O algoritmo captura o que você faz e entrega o que você quer.  Isso é muito legal, principalmente para os anunciantes, porém acaba te limitando ou direcionando tendenciosamente para uma atmosfera que acaba sendo viciada em um determinado assunto, quando na verdade haveria muito mais a explorar, em outras palavras, você deixa de estar em contato com opiniões diferentes, notícias inesperadas, ou mesmo que não sejam do seu interesse,  ficando presos na tal “bolha de conteúdo”, criando uma maioria falsa, as chamadas “pseudomaiorias” com um discurso que acaba se consolidando, e isso para quem apenas busca informações ou se atualiza unicamente pela internet transforma as pessoas em verdadeiros bitolados alienados, muito vulneráveis a campanhas políticas, pois supõe que você comece a se interessar por um determinado candidato, e as mídias percebem e o usuário acaba sendo bombardeado apenas pelo material positivo daquele candidato, o que acaba fazendo você votar nele apenas pelas supostas informações obtidas nesta atmosfera criada pelas intricadas ferramentas de Big Data e Machine Learning, e ai temos um Trump como presidente da maior nação americana.

E quanto a realidade Brasileira?

Aqui no Brasil, vejo que existem grandes diferenças da realidade americana, e alguns podem dizer que estas diferenças de realidade podem dificultar a fazer este fenômeno influenciar no nosso processo político, mas mesmo assim, já temos brasileiro se associando com a Cambridge Analytica (empresa especializada em utilizar grandes dados para mudar o comportamento do público e foi fundamental na última campanha eleitoral americana), já se preparando para atuar nas próximas eleições.

Estes algoritmos também podem ser utilizados para criar falsos engajamentos, direcionar a discussão popular para acusações pontuais, focos em assuntos polêmicos, desviando a atenção de forma coordenada e intencionada, como citei anteriormente.

Levando em consideração o que mais vende para os eleitores no Brasil é o carisma, visto que artistas, jogador de futebol, taxista, professores, e políticos oportunistas ficam tentando vender imagem de “cara legal”, apelando para o emocional de forma calhorda, enquanto a eficiência, que deveria ser o fator principal de uma escolha, fica de lado, dá para imaginar o estrago que estes falsos engajamentos podem causar.

Outra diferença para o público americano é que aqui no Brasil o uso das redes sociais tem algumas peculiaridades.  Usamos muito Facebook e principalmente o Whatsapp, no caso do Face, vale dizer, que nem sempre é o Facebook que usa os seus dados, muitas vezes são outras empresas se utilizando de alguns subterfúgios que coletam os dados e aí o que eles podem fazer como vender, repassar ou utiliza-los para outros fins, foge completamente do que podemos prever nestes casos.

Apps que usamos no face e que autorizamos, coletam informações nossas , por exemplo, Apps que dizem que tipo de personagem sou em uma serie popular como Game of Thrones, para fazer isso, você tem que dar acesso a esses Apps, vc faz o teste compartilha com os amigos e depois esquece de desautorizar, enquanto isso, o App fica monitorando o que você faz no Face, onde você clica, o q você escreve, analisa as palavras que você mais utilizou, eles vetorizam isso e, através de algumas analises, consegue saber suas tendências políticas, que língua você fala, etc  este é um exemplo de brecha a qual ficamos expostos voluntariamente.

No caso do Whatsapp, que deixou de ser um simples comunicador de massa e eu diria ser a maior rede social utilizada no brasil, como ela é criptografada fica mais difícil, mas ainda assim, podemos ver muitas correntes, textões/fakes news sendo compartilhados, com possíveis links (scripts) para outros sites, que podem muito bem ser utilizados, já que estão fazendo  interligação com páginas eternas, para medir algum termômetro de audiência, para determinado assunto polêmico.

O Google Chrome é outro meio gigante de captura de  informações, já que a partir do momento que você se loga, fica logado para sempre, seja no PC, celular, tablet, além de levar seus dados de contatos, localização, navegação, cliques, softwares mais utilizados, para a nuvem.

Como estamos falando de política e dos impactos que o Big Data e Machine Learning podem causar, e como estas ferramentas podem influenciar negativamente em um processo decisório, vale lembrar que tudo tem um lado bom e mau, existem usos dessas mesmas ferramentas fazendo coisas bem interessantes, como por exemplo em pesquisas médico científicas, até mesmo em eventos beneficentes, onde usam os dados para direcionarem os potenciais grandes doadores para os locais corretos, na Universidade de Harvard, por exemplo, eles possuem banco de dados de todos os alunos, com seus vínculos familiares e contatos, para organizar eventos da melhor forma, direcionando doadores para as pesquisas que eles realmente possam se interessar e ajudar com contribuições, ou seja, dá para fazer isso para o bem.

Concluindo

Com o advento da internet e redes sociais, estamos à mercê dos espiões digitais, e das novas tecnologias de Inteligência Artifical, Deep Learning, Machine Learning, Big Data, etc  Esta é uma área em franco desenvolvimento, onde a cada dia novos recursos são criados para captura e manipulação de grandes dados que nós mesmos disponibilizamos, e que se eles utilizassem apenas para facilitar sua navegação ou te oferecer oportunidades comerciais, mas ao invés disso, estes dados vão se tornando ouro a ser lapidado para uso e interesse das grandes corporações e interesse políticos, os quais nem imaginamos os reais desdobramentos futuros, mas que precisamos entender o contexto, para nos prepararmos para os impactos que estas transformações tecnológicas causarão no destino das pessoas.

Links de referência:

https://olhardigital.com.br/noticia/varejista-norte-americana-descobre-gravidez-de-clientes-com-a-ajuda-de-software/24231

https://brasil.elpais.com/brasil/2017/10/11/politica/1507723607_646140.html

https://www.linkedin.com/pulse/power-big-data-machine-learning-netflix-google-ryan-starkey/

http://edition.cnn.com/2017/10/27/politics/trump-campaign-wikileaks-cambridge-analytica/index.html

Edilson Barros, PMP on EmailEdilson Barros, PMP on Linkedin
Edilson Barros, PMP

Engenheiro Mecânico, com MBA em Gestão por Projetos e Gestão Empresarial pela FGV, além de Pós Graduação em Engenharia de Petróleo e Gás pela FUNCEFET. Experiência como Gerente de Engenharia em Indústrias Multinacionais, com foco em desenvolvimento de produtos e transferência de tecnologia, nos últimos anos atuando como Gerente de projetos nacionais e internacionais, relacionados ao fornecimento de equipamentos para os setores de Petróleo e Gás, Saneamento, Indústria Química e outros diversos setores.


Comentários

Deixe uma resposta