22 de nov. de 2014

Top causas de óbitos em 1900 e 2010

Em um artigo de 2012 do New England Journal of Medicine, David S. Jones, Scott H. Podolsky e Jeremy A. Greene fizeram uma análise das principais causas de óbitos nos Estados Unidos no ano 1900 e a comparação com 2010, dissertando sobre o papel da medicina com novas doenças e diagnósticos.
No meio do artigo existe um infográfico interessantíssimo, que mostra a maiores causas de morte nos dois períodos, que eu copiei para este post:


É interessante observar como algumas doenças simplesmente desapareceram (ou se tornaram muito pequenas), como o caso da tuberculose, pneumonia e gripe, enquanto outras aumentaram (cancer) e até mesmo passaram a aparecer na estatística, como o suicídio.
Para aqueles que quiserem ler o artigo inteiro, acessem este link.

13 de nov. de 2014

Darth Vader sem James Earl Jones

Encontrei este pequeno vídeo que mostra como era a voz do ator por trás da roupa de Darth Vader... muito engraçado (e bem diferente do produto final).

11 de nov. de 2014

Estatísticas e eleições

Ultimamente muita gente fala sobre os erros das pesquisas eleitorais e acabam dando até mesmo o nome de chutometria para o que os institutos mostram, mas vamos tentar ver um pouco por que as pesquisas eleitorais erram tanto.

Em primeiro lugar, para saber realmente o resultado de uma eleição, você teria que realizá-la neste instante e o principal motivo disto é que a divulgação do resultado de uma pesquisa pode alterar o resultado da própria eleição. Como a população é um sistema aberto, ou seja, suscetível a informações externas, a própria inferência pode alterar o resultado.
Você poderia escolher votar no candidato que está em segundo lugar na pesquisa (independente de quem seja) simplesmente para forçar um segundo turno, alterando seu voto de última hora, ou mesmo oscilando seu voto entre dois candidatos durante o período de pré-eleição (eu mesmo já fiz isto). Outro exemplo é você ver que seu candidato preferido está perdendo por pouco e adiar uma viagem para poder votar nele (afinal qualquer voto pode fazer a diferença), ou mesmo o contrário (afinal meu candidato preferido já está na frente, acho que vou aproveitar para ir para a praia).

O segundo problema era que, até poucos anos atrás, os resultados das pesquisas era mostrado apenas com a margem de erro (que são aqueles 2 pontos percentuais para cima ou para baixo), mas a confiabilidade da pesquisa não era mostrada.
A confiabilidade mostra qual a probabilidade da pesquisa estar certa. Como estamos falando de amostragens e não de uma avaliação real de toda a população brasileira, sempre existe uma chance de a pesquisa estar errada. Esta é uma porcentagem que indica quantas vezes a cada 100 pesquisas idênticas existe a chance de a pesquisa inteira estar errada.
Talvez com um exemplo fique mais claro: imagine que você possui uma caixa com 100 bolinhas (50 pretas e 50 brancas) e você, aleatoriamente vai pegar 5 delas para saber qual a porcentagem de bolinhas brancas e pretas. Agora imagine que você tirou 3 bolas pretas e 2 brancas.
Este resultado pode ser apresentado de duas maneiras: na primeira, você pode dizer que existem 60% de bolas pretas, com margem de erro de 44% para cima ou para baixo e uma confiabilidade de 95%, ou você pode dizer que existem 60% de bolas pretas, com margem de erro de 5% para cima e para baixo e uma confiabilidade de menos de 1%.
Na primeira forma, você deixe uma margem grande de erro, porem atesta que com uma certeza de 95%, o resultado real está dentro deste intervalo (que no exemplo abestado acima, varia entre 26% a 100% de bolas pretas). Perceba que mesmo com este intervalo enorme, ainda existe 5% de chance de você errar a pesquisa pegando apenas 5 bolinhas (você tem, na verdade, pouco mais de 2% de chance de pegar 5 bolinhas brancas de uma vez).
Na segunda forma, você está mostrando uma margem de erro muito menor, porém, com uma confiança muito menor. Em 99% das vezes, você errará o resultado (como foi o caso de nosso exemplo).
Esta confiabilidade provém de dados estatísticos tabulados que levam em conta o tamanho da amostra retirada do universo de eleitores (quanto maior a amostra, maior a confiabilidade e menor o intervalo de confiança da pesquisa).

O terceiro problema das pesquisas é a forma da amostragem. Por caráter (acho que principalmente) econômico, as pesquisas são feitas através de uma quotização (pelo menos a do Datafolha é assim) onde os pesquisadores, baseados nos dados oficiais do Brasil (sexo, idade, localidade etc.) define quantas pessoas de cada tipo deverão ser entrevistadas. A partir daí os pesquisadores saem às ruas em pontos de fluxo e pesquisam com base em sua lista de quotas.
Isto faz com que a "escolha" do pesquisado esteja na mão do pesquisador e não através de uma real aleatorização, que seria de se esperar se tudo fosse sorteado aleatoriamente e a pesquisa viesse até sua residência.
Na minha opinião isto faz com que, embora os critérios estatísticos estejam corretos, a margem de erro possa estar errada devido a uma amostragem que possa, porventura, realmente não ser representativa da população geral.

Aqueles que sobreviveram e leram até o fim, obrigado e espero que tenham gostado.

7 de nov. de 2014

Como nosso sistema solar tornou-se plano?

Encontrei este vídeo explicando rapidamente como nosso sistema solar tornou-se plano e não tridimensional.
Achei bem interessante, então aí vai: