segunda-feira, 11 de novembro de 2013

Brasil, país de empreendedores.

Um blog puxa outro, né? Num post do Rodrigo Constantino na Veja, ele mostra pesquisa da Sage para o Financial Times que posiciona o Brasil com o maior percentual de tomadores de risco entre 16 países (incluindo os Estados Unidos) para pequenos empresários. As explicações desse fenômeno podem ser lidas nas matérias originais, aqui vamos analisar seu gráfico:



Convido você a fazer uma crítica para afiarmos juntos nossa habilidade de mostrar dados. Quais são os pontos positivos dele? O que poderia ser melhorado?

Minha lista de pontos positivos começa pela escolha do local do nome dos países, o centro. Afinal quer-se mostrar uma lista. Segundo ponto: barras verticais, boa opção para tantos países. Um terceiro aspecto é a escolha das cores nas barras representando os percentuais dentro de cada variável. As barras funcionam bem para se captar pequenas diferenças entre países. Por último, os números inscritos nas barras em cor mais clara. Ficou bom.

Vamos às melhorias. Meu primeiro incomodo é a colocação dos títulos das variáveis na vertical dificultando a leitura. Outro ponto é a posição das variáveis que deveria ser invertida pela natureza das suas polaridades. Tomadores de risco é um atributo positivo e deveria ficar à direita dos nomes. Vejamos o aspecto geral do gráfico com essas mudanças (não me preocupei em fazer o gráfico de novo, somente seu esboço).



Ficaria melhor. Paramos por aí? Não. Observe a variável "avessos a risco", para que ela serve? Do modo como é apresentada, é apenas mais uma curiosidade sobre os países, sem uso na ordenação deles. Poderíamos atribuir uma função a ela, a de desempate. Tome, por exemplo, os três países seguintes ao Brasil: Canadá, Polônia e Malásia. Eles têm o mesmos 52% de tomadores de risco mas diferentes percentuais de avessos. Eu os ordenaria do menor para o maior percentual, justamente na ordem inversa do apresentado no gráfico.

Proponho ainda mais. Uma outra forma de ordenação, levando-se em conta as duas variáveis em conjunto. Gostaria de ver os países alinhados pelos tomadores líquidos, isto é, o resto da subtração de avessos, do percentual de tomadores de risco. Isso nos dá a ideia do excesso ou falta de tomadores de risco em relação aos avessos de um país.

Fiz essa conta, reordenei os países e produzi o gráfico abaixo:



O ranking dos países muda, parece mais coerente, e já estou apostando nessa forma de análise. Mas sabe, não fiquei totalmente convencido de que nossos leitores compreenderão essa informação. Quebrei um pouco a cabeça e refiz o gráfico incluindo a subtração das variáveis na forma visual. Talvez tenha melhorado:



Preciso agora do seu feedback, deu pra entender bem esse gráfico? Seja sincero, ok? risos...

Até
Roberto


Gráficos dos leitores:

Olha só que bacana as sugestões que nossos leitores trouxeram. A Renata pede para fazermos um gráfico de dispersão com as duas variáveis:



Podemos ver a posição relativa de cada país. Note que essas variáveis são naturalmente correlacionadas (são proporções do mesmo todo).

O Roberto Nanni nos sugere um gráfico fechando em 100%. Ficou bem direto ao ponto:



Parabéns e continuem contribuindo para o Atirei!

quarta-feira, 6 de novembro de 2013

O gráfico de barras e a visualização de tendências.

O que você quer saber quando pega um gráfico com dados sobre violência? Se há alguma tendência, não é? Subiu, caiu ou estabilizou? O que será que aconteceu com o número de crimes nos últimos tempos?

Ok, então procure por essa informação no gráfico da Folha dessa última terça:



É visível que os roubos diminuíram nos últimos anos em Nova York, certo? Mas e quanto aos homicídios? Hum, deixe-me ver... É, eles caíram também.

Essa segunda resposta exige esforço. Precisa-se de observar os valores escritos no gráfico, não dá pra ver pelas barras azuis. Elas são muito pequenas para se observar quaisquer tendências.

Dizemos, nesse caso, que não há resolução gráfica. Não há porque são duas séries cujos valores têm magnitudes muito diferentes (uma na casa dos milhares e outra na das centenas) colocadas sob a mesma escala.

O que fazer então?

A primeira coisa é certificar-se que seu objetivo é mostrar tendências. Se sim, vamos recorrer a quem tem justamente esse nome, o gráfico de tendências. Vejamos, o resultado com as duas séries juntas:



Pois é, deu na mesma que o gráfico da Folha... O problema da escala ainda persiste. O jeito mais simples, então, é fazer os gráficos em separado:



Opa! Bem melhor, poderíamos parar por aqui. O leitor já teria sua informação de maneira eficiente e precisa. Em contraste ao subtítulo da Folha, os indicadores não estão estáveis. Eles caíram.

Avançando na análise, eu me perguntaria: caíram na mesma proporção? Para ver isso precisamos fazer contas. É comum (veja exemplo em Prolixidade Gráfica) plotar as variações percentuais de um ano para outro. Observe o resultado ao se fazer isso com nossos dados:



Ficou bonitinho, caprichado, desvios positivos numa cor e negativos noutra, barras bem apresentadas etc. Uma nota para esse gráfico, por favor?

Zero, um redondo zero! Cadê a informação de que a violência vem caindo nos dois tipos de crime? Não faça isso, hein? Por meio de variações não se vê claramente as tendências, ok?

Tenho outra sugestão. Opte por uma forma mais fácil e que dá bons resultados. Tome o primeiro valor de cada série como referência e atribua 100% a ele. Plote em seguida os próximos valores como percentuais desse primeiro. Você pode colocar, assim, todas as séries numa só escala e comparar a proporção de queda de cada indicador.



Gostei.

Até
Roberto

sexta-feira, 1 de novembro de 2013

Falso alarme ou erro de detecção?

Li com muito interesse hoje no caderno Folha Saúde+Ciência o artigo: "Teste evita biópsia de próstata desnecessária", porém não encontrei dados para concluir isso no gráfico da matéria:



O novo teste (Scanner) é rápido e não invasivo, muito melhor que uma biópsia, mas apresenta ainda 10% de erros. Ocorre que o texto não explica quais erros são esses. Há basicamente dois tipos: falsos alarmes e erros de detecção dependendo de qual veredito a biópsia (exame tido como correto) produziu: biópsia deu negativo, ou positivo.

Veja uma tabela mostrando esses erros:



Para eu concluir que o Scanner evita biópsias, ele teria de ser bom para garantir que um indivíduo está são. Ele não pode produzir erros de diagnóstico, dizendo que está tudo bem quando na verdade há doença. Poderíamos até suportar alguns falsos alarmes, que exigiriam a biópsia desnecessariamente.

Exemplificando a falta de dados na matéria, apresento duas situações hipotéticas extremas em que os mesmos 15 erros foram distribuídos de maneira diversa conforme os resultados das biópsias. Uma premissa que usei foi de que normalmente 40% dos teste de biópsia dão positivo na prática. Esse dado sim, está na matéria. Na primeira hipótese, coloquei todos os erros como se fossem falsos alarmes:



Veja que os 15 erros se concentram nos casos cuja biópsia deu negativo e nenhum erro ocorreu com biópsia dando positivo. A taxa de falso alarme seria de 15/90=17% e a taxa de erro de detecção seria 0/60=0%. Dessa forma, o Scanner foi bem rigoroso. Toda vez que ele disse não haver câncer, realmente não havia, apesar de algumas vezes ele ter detectado câncer quando não havia. O novo teste evitaria assim que os 75 casos em que o Scanner apontou negativo passassem pela biópsia. É uma redução de 50% de indicação para biópsia.

Veja uma segunda situação em que os erros sejam todos de detecção:



Aqui temos um sério problema. Com os 15 erros ocorrendo somente nas biópsias com resultado positivo, o Scanner deixou de detectar o câncer em 15/60=25% dos pacientes realmente doentes. Ou seja não se pode confiar quando ele fala que está tudo bem, né? Assim, qualquer diagnóstico do Scanner, seja positivo ou negativo, teria de ser confirmado. Portanto, nenhuma redução de biópsia.

Conclusão?

Folha: não dá pra não mostrar todos os dados.

Até
Roberto