Comprovando que Bolsonaro está mentindo sobre a suposta fraude das eleições de 2014
(Atualização 30/07/2021: Algumas pessoas apontaram que o texto está um pouco confuso, e com razão. Eu fiz um resumo no Twitter mas nem todo mundo está acessando esse texto por lá. Por isso, também resumo a questão a seguir. As demais seções depois têm a análise detalhada.)
Resumo
Um dos “indícios” de fraude nas eleições apresentadas por Bolsonaro é uma planilha apresentada por um anônimo em entrevista com a Naomi Yamaguchi (irmã da cloroquiner Nise).
Essa planilha, a princípio, analisa a “variação do incremento” dos votos de Dilma e Aécio na apuração minuto-a-minuto divulgada pelo TSE, no segundo turno de 2014. Essa “variação do incremento” pode ser interpretada como a “aceleração” do candidato na apuração: se o número de votos apurado a cada minuto está aumentando (acelerando) ou diminuindo (freiando).
A planilha compara quem tem a “aceleração” maior a cada minuto, e exibe o vencedor numa coluna, “AECIO” ou “DILMA”. O anônimo observa que, em mais de 200 linhas, há uma intercalação perfeita (AECIO / DILMA / AECIO / DILMA…), o que deveria ser quase impossível de acontecer aleatoriamente.
Eu consegui recriar a planilha e observei que a fórmula usada para calcular a “aceleração” está errada. Ao invés de usar o incremento atual menos o anterior, ele usa o total de votos menos a aceleração do minuto anterior. Essa fórmula não faz sentido algum, e faz com que a análise seja completamente inválida.
Para completar, também observei o seguinte:
- Se trocar para a fórmula certa, o padrão de intercalação desaparece, e o indício de fraude também.
- Se usar dados aleatórios de votos com a fórmula original (incorreta), a intercalação permanece. Isto é, o “indício de fraude” é consequência da fórmula incorreta.
Conclusão: Bolsonaro é um mentiroso de merda que está se borrando de medo de perder em 2022 e quer culpar o sistema eleitoral quando isso acontecer.
Se quiser mais detalhes, siga a leitura!
Introdução
Bolsonaro afirmou diversas vezes ter evidência de fraude em eleições anteriores. Contudo, nunca apresentou tais evidências.
Alguns dias atrás, porém, finalmente deu detalhes de uma suposta fraude nas eleições de 2014, onde Aécio perdeu para Dilma no segundo turno:
Ele já começa mentindo: “Em 2014, se mostrou a apuração minuto a minuto. Obviamente vocês não tiveram acesso”. Só que a apuração minuto a minuto foi divulgada pelo TSE e está disponível no G1, por exemplo.
Bolsonaro prossegue explicando a suposta fraude de forma muito confusa:
“Era Dilma ganhou, Aécio ganhou, por 271 [soluço] vezes consecutivas […] Isso dever ser a quantidade de átomos aqui na Terra. Então isso é fraude”
É difícil analisar uma acusação tão confusa, mas temos uma saída.
Bolsonaro está tentando explicar uma análise feita em um vídeo de 2018 de Naomi Yamaguchi, que entrevistou uma “pessoa” que diz ter comprovado a fraude analisando apenas aquelas mesmas parciais minuto a minuto.
Sim amigos, a grande evidência de Bolsonaro é um vídeo que ele deve ter recebido no zap. Dá para saber que é desse vídeo que que ele está falando pois o mesmo fala exatamente dessa alternância entre Dilma e Aécio nas parciais e faz a mesma comparação com o número de átomos.
Não vou linkar o vídeo para não dar mais palco a palhaços, mas ele é fácil de ser encontrado no YouTube. O vídeo chegou a ser verificado pela Agência Pública que fez um ótimo trabalho, mas não entrou nos detalhes de por que a “análise” do vídeo é falsa. É isso que faço neste texto.
(Naomi Yamaguchi foi candidata a deputada federal em 2018 pelo PSL, mas não se elegeu. Sim, ela é irmã da Nise Yamaguchi, defensora da cloroquina que depôs na CPI. Brasil não é para amadores)
A “análise” no vídeo de Naomi Yamaguchi
Vamos primeiro descrever a “análise” da “pessoa” entrevistada por Naomi no vídeo. (Adoro como nem se dão trabalho de chamá-lo de “especialista” ou algo do tipo.)
A base da “análise” são as parciais minuto a minuto. Elas mostram o total de votos apurados para a Dilma e para Aécio até aquele minuto.
A “análise” é feita em cima de uma planilha que é exibida no vídeo. Nela existem colunas adicionais baseadas nas anteriores. As colunas I e J apresentam o “Acréscimo Dilma” e “Acréscimo Aécio”. Tais valores são a diferença entre a parcial atual e anterior: a quantidade de votos apurados para a Dilma e Aécio naquela parcial. Até aí, tudo certo.
As colunas N e P apresentam a “Variação do Incremento da Dilma” e do Aécio e são a chave da “análise”.
Pelo nome, poderia se supor que as colunas contêm a variação entre o acréscimo do candidato naquela linha, e a variação na linha anterior. (Não é o que acontece, como descrevo depois.)
As colunas O e Q apresentam uma porcentagem associada à “variação do incremento”. A princípio não fica claro como as porcentagens são calculadas.
Finalmente, na coluna T há uma “Análise da Variação”. Essa coluna apresenta os nomes “DILMA” ou “AECIO” dependendo quem tem a maior porcentagem nas colunas O e Q.
A pessoa do vídeo analisa o padrão dos nomes nessa coluna, e observa que do meio para o final, os nomes “DILMA” e “AECIO” são perfeitamente intercalados por 240 linhas. A pessoa afirma que a chance disso acontecer é extremamente pequena, numa escala de um átomo dentre todos os átomos da via láctea ou algo do tipo. Dessa forma, a pessoa afirma que o resultado está seguindo uma “fórmula”.
Naomi pergunta onde está colocada essa “fórmula”. A pessoa responde que não sabe onde está, mas diz que a urna tem um módulo de criptografia que supostamente nunca foi auditado, e que ele poderia alterar o resultado do boletim de urna.
A “análise” não faz sentido
Não é nem necessário entrar nos detalhes da análise para ver que ela não faz sentido. (Mas faço isso de qualquer forma na próxima seção.)
Lembre-se como a eleição funciona: eleitores votam, e no final do dia a urna emite o boletim de urna com o total de votos que cada candidato recebeu naquela urna. A mesma informação é salva em um cartão de memória, que é levado até um computador, que envia os dados para o TSE para ser feita a totalização.
No vídeo, ao lado da “Análise da Variação”, há alguns comentários do que supostamente estaria acontecendo: “Início, sem o algoritmo acionado”; “Quando viram que o Aécio estava muito a frente, acionaram o algoritmo com forte intensidade para reverter o quadro”, etc.
Ou seja, a pessoa está afirmando que, durante a totalização, o TSE acionou um “algoritmo” para alterar o resultado e favorecer a Dilma. A pessoa também afirma que a fraude está no módulo de criptografia da urna.
Mas isso não faz sentido: se as urnas já adulteram o resultado, não é necessária nenhuma intervenção durante a totalização. É só somar tudo e pronto.
Além disso, se realmente houvesse um “algoritmo” que alterasse a totalização, isso poderia ser facilmente detectado: é só somar os boletins de urna (que são públicos) e ver se bate com o total do TSE. Dá para fazer isso estatisticamente, por amostragem, sem precisar somar absolutamente todos os BUs. De fato, foi exatamente isso que o PSDB fez, e não achou nenhum problema na totalização.
A “análise” está ERRADA
O grande problema da “análise” é que ela está simplesmente errada. Como a Agência Pública observou, a coluna “Variação do incremento” foi calculada de forma incorreta.
Na imagem acima, note por exemplo a terceira linha: a “Variação do Incremento do Aécio” é 9.218, sendo que o incremento na mesma linha foi 6.588 e na linha anterior foi 3.292. A variação deveria ser 6.588 - 3.292 = 3.296.
Se consertamos a fórmula para calcular a “Variação do Incremento” da forma correta (o Acréscimo atual menos o anterior), a coluna “Análise de Variação” muda completamente, e o padrão de intercalação desaparece. Confira na figura abaixo. Você também pode conferir a planilha completa (segunda aba).
Mas então o que é o padrão que aparece no cálculo incorreto?
(Importante: o fato da fórmula estar errada já invalida toda a análise. Aqui eu explico por que aquele padrão surge com a fórmula errada, e é meio confuso por que está analisando algo que nem faz sentido para começo de conversa. Se preferir pule para a próxima seção.)
Observando os números mostrados no vídeo eu consegui recriar a planilha da pessoa. Minha planilha é pública, é só compará-la com o conteúdo da planilha mostrado no vídeo para ver que os valores são iguais.
Como a Agência Pública observou, na planilha a “Variação do Incremento” de um candidato em uma linha é o total de votos do candidato naquela linha, menos a “Variação do Incremento” anterior. (A porcentagem nas colunas O e Q representam qual a porcentagem esse valor em relação ao total do candidato naquela linha.)
Como descrito, esse é um cálculo totalmente incorreto.
Na imagem acima, por exemplo, na linha da hora 17:05, a “Variação do Incremento da Dilma” é igual a 31.608, que é o total de votos da Dilma até então (45.158) menos a “Variação do Incremento” da linha anterior (13.550).
E por que esse cálculo errado da “Variação do Incremento” resulta na intercalação da Dilma e Aécio na “Análise da Variação”?
Para responder isso, precisamos interpretar o que representa essa “Variação do Incremento” calculada erroneamente. Dá para fazer isso algebricamente, mas fica mais fácil de entender com um exemplo.
Na imagem acima, eu selecionei os acréscimos da Dilma nas linhas “ímpares” (17:01, 17:03, etc.) até 17:07. A planilha automaticamente calcula a soma desses valores embaixo à direita, totalizando 70.227. Esse é exatamente a “Variação do Incremento da Dilma” na linha da hora 17:07!
Na imagem acima fiz algo parecido, mas com as linhas “pares” (17:02, 17:04). Novamente, a “Variação do Incremento da Dilma” é igual a soma dos acréscimos (111.843).
Desta forma, a “Variação do Incremento” de um candidato, para as linhas “ímpares”, é na verdade a soma de todos os acréscimos do candidato em linhas “ímpares” até aquela linha. Da mesma forma, a “Variação do Incremento” de um candidato, para linhas “pares”, é na verdade a soma de todos os acréscimos do candidato em linhas “pares” até aquela linha.
Essa é a primeira pista da intercalação de Dilma e Aécio na coluna “Análise da Variação”. A “Variação do Incremento” representa coisas totalmente diferentes dependendo se a linha é “par” ou “ímpar”!
Para deixar a discussão menos confusa, vou chamar esses valores de “soma dos votos pares” (isto é, a soma das parciais dos candidatos que foram divulgadas em linhas pares) e “soma dos votos ímpares”.
Na imagem acima, por exemplo, o minuto 17:03 tem-se que a “soma dos votos ímpares” da Dilma é de 6.345. Isso representa 75,15% dos votos totais da Dilma.
No minuto 17:04, a mesma coluna representa outro valor: agora é a “soma dos votos pares” da Dilma, que ali é de 13.550, representando 68,11% dos votos totais da Dilma.
Vamos chamar os valores da coluna O e Q de “proporção de votos pares” (quando a linha é par) e “proporção de votos ímpares” (quando a linha é ímpar).
Vamos agora analisar o seguinte: como deveriam se comportar as proporções de votos pares e ímpares ao decorrer da apuração?
Perceba que não há nada de especial que diferencia uma linha “par” de uma linha “ímpar”. Dessa forma, é de se esperar que a “proporção dos votos pares” de um candidato seja perto de 50%. E obviamente, a “proporção dos votos ímpares” vai ser o quanto falta para completar 100%.
E é exatamente isso o que acontece! Ao final da apuração, como se pode ver na figura acima, a “proporção de votos pares” da Dilma é de 49,75% (penúltima linha, que é par). E a “proporção de votos ímpares da Dilma” (última linha, que é ímpar) é de 50,25%, que exatamente o que falta para completar 100%. Com Aécio é parecido, com 49,60% e 50,40% respectivamente.
Note que no começo da apuração, cada parcial é proporcionalmente grande em relação ao total de votos até aquele momento, então as proporções de votos pares e ímpares começam longe de 50% e flutuam bastante. Conforme mais votos são apurados, cada parcial passa a ser uma proporção menor da soma total de votos, o que faz essa flutuação diminuir e estabiliza os valores das proporções de votos pares e ímpares.
O valor específico da proporção de votos pares/ímpares segue uma distribuição estatística. É claro que dificilmente vai ser exatamente 50%, por flutuações inerentes à contagem. Mas note que, qualquer que seja a proporção de votos pares/ímpares de um candidato, o valor fica mais difícil de ser alterado a cada parcial (devido à estabilização descrita no parágrafo anterior). Isso pode ser visto na figura acima: as proporções das duas primeiras linhas são iguais as das duas últimas linhas.
Agora considere o seguinte: a proporção de votos pares da Dilma estabilizou em 49,75%, ao passo que do Aécio estabilizou em 49,60%. Ou seja, a Dilma “ganhou” nas linhas pares e portanto a coluna “Analise da Variação” mostra DILMA para linhas pares.
Já a proporção de votos ímpares é o complemento (o que falta para 100%). Se Dilma “ganhou” nas linhas pares, obrigatoriamente ela “perde” nas linhas ímpares: Dilma estabilizou em 50,25% ao passo que Aécio estabilizou em 50,40%. Dessa forma, a coluna “Análise da Variação” mostra AECIO para linhas ímpares.
Concluímos então que a intercalação de DILMA e AECIO na “Análise da Variação” é um resultado ESPERADO, consequência do cálculo incorreto da planilha que, ao invés de calcular a “Variação do Incremento”, calcula a “Soma de votos de linhas pares” e “Soma de votos de linhas ímpares” de forma intercalada.
Para confirmar essa observação, eu copiei a planilha original e alterei os votos: para cada linha, eu dei uma valor aleatório para a Dilma entre 0 e o número total de votos para aquela parcial. Aécio naturalmente fica com o resto dos votos naquela linha. Você pode conferir essa planilha na terceira aba.
E adivinhe? Mesmo com dados aleatórios, a intercalação de DILMA e AECIO volta a aparecer! Veja na figura abaixo. Isso comprova que a intercalação não tem nada a ver com a distribuição de votos do candidato.
E a Análise da Lei de Benford?
O vídeo tem uma segunda parte onde faz uma análise da Lei de Benford que supostamente demonstra também a fraude.
A Lei de Benford diz que, para muitos conjuntos de números, a distribuição do primeiro dígito de cada número é bem específica: o dígito 1 tem mais chance de ocorrer; o dígito 2 um pouco menos, e assim por diante.
Primeiro, deve-se notar o óbvio: a Lei de Benford não se aplica em todos os casos. Em particular, não é muito eficaz em números relacionados a eleições como já levantado por especialistas da área. (Sim, usaram o mesmo argumento furado na eleição do Trump, obviamente.)
Mas a “análise” do vídeo é ainda mais burra. A pessoa usa a lista de totais de cada candidato nas parciais para fazer a análise (comprovei isso recriando o mesmo gráfico; está na quarta aba da planilha). O dígito 5 é o mais frequente por um simples motivo: foram 105 milhões de votos válidos, resultando cerca de 50 milhões de votos para candidato. E a apuração foi ficando mais lenta conforme foi avançando (o que é normal), fazendo com que exista um grande número de parciais na casa dos 50 milhões (primeiro dígito 5), e um número razoável na casa dos 40, 30, 20 e 10 milhões (primeiros dígitos 4, 3, 2, 1). Isso é exatamente o que está ilustrado no gráfico do vídeo.
Conclusão
A “análise” apresentada no vídeo é INCORRETA, e a conclusão de fraude é consequência do erro do cálculo. Arrumando o cálculo, a evidência desaparece.
Naomi Yamaguchi divulgou uma evidência FALSA de fraude nas eleições de 2014.
E Bolsonaro está divulgando essa evidência FALSA para colocar em dúvida a integridade das eleições anteriores, de forma a questionar o resultado das eleições de 2022 e ter uma desculpa para tumultar o processo quando perder e tentar roubar o poder.
Bolsonaro é um merda mentiroso genocida que está anunciando em voz alta um golpe em 2022 e precisa ser impedido.
Impeachment já! Fora Bolsonaro!
Se quiser entrar em contato, chame no Twitter.