segunda-feira, 15 de setembro de 2014

Gráfico de bolhas: bom recurso de análise

Na semana passada, saiu uma matéria na Folha analisando a situação dos afastamentos por uso de drogas no Brasil. A Reportagem trazia dois quadros. O primeiro mostrava o aumento de 2009 a 2013 na frequência (total e por tipo de causa) e no valor gasto em nível Brasil.



O seguinte trazia os estados ranqueados pela variação nos anos. Veja o gráfico de barras abaixo:



Como você interpretou esse último quadro? O Amapá, por ser o estado no topo, corre o maior risco de afastamentos? Em Alagoas, sendo o último da lista, a política antidrogas está funcionando? Veja os estados da região Sul, esta é a melhor região do país em afastamentos por uso de drogas?

Se você ficou em dúvida quanto às questões acima, talvez tenha sido por causa das enormes diferenças nos números absolutos entre estados. Por exemplo, São Paulo tem quase 1000 vezes mais casos que o Amapá. Como comparar coisas tão diferentes?

É simples, procure usar indicadores relativos.

Tomar os totais (Brasil) de cada ano como referência não é uma boa ideia, pois não saberíamos analisar se os aumentos foram grandes ou pequenos. Isso ocorre porque na matéria não há dados de trabalhadores empregados, só de afastados.

Fui, então, ao site da RAIS e achei os totais de empregados por estado nos anos de 2009 e 2013. Com isso, calculei o número de afastamentos concedidos por auxílio-doença para cada 100 mil trabalhadores empregados em cada ano e por estado. Veja o ranking de estados com maiores índices em 2013:



Esse gráfico nos mostra uma realidade muito diferente. Santa Catarina e Rio Grande do Sul saem da base da lista anterior para o topo desse novo ranking, passando dos 500 afastamentos para cada 100 mil empregados em 2013. No país, a média é de 277 concessões de auxílio-doença por drogas para cada 100 mil empregados.

Assim, para se fazer uma análise mais sistêmica, deveríamos ver mais de um indicador no gráfico. Um bom recurso pra isso é o gráfico de bolhas que pode receber pelo menos 3 variáveis numéricas (X, Y e tamanho da bolha) e uma categórica (cor da bolha). Como exercício, usei os seguintes indicadores para o caso em questão:

  • X: Variação percentual do índice de concessão de 2009 para 2013;
  • Y: índice de concessão por 100 mil empregados em 2013;
  • Tamanho da bolha: número de afastamentos em 2013;
  • Cor da bolha: região do país.

Veja o resultado:



Agora sim, podemos enxergar algumas coisas bem interessantes. Veja as posições de Santa Catarina e do Rio Grande do Sul, apesar de terem os maiores índices, houve recuo do indicador em 2013. Ao contrário da maioria dos estados que caminhou para pior nos índices. Alertas soam, por exemplo, para o Espírito Santo (com o maior aumento), e para Minas Gerais, (estado de grande contingente, com índice superior a da média nacional).

Fique craque na interpretação de gráficos de bolhas visitando o site do Hans Hosling: Gapminder. Lá você aprende a analisar dados de centenas de países modificando as variáveis de um gráfico de bolhas interativamente. É uma forma lúdica e didática de mostrar ao mundo como estamos e donde viemos.



Até
Roberto

Um comentário:

  1. Caro Roberto,

    Uma observação: O Distrito Federal não é estado. De qualquer forma, valeu por mais uma aula.

    Abração,


    Getulio
    22/09/2014

    ResponderExcluir