terça-feira, 22 de março de 2011

Não tire conclusões precipitadas

A folha de São Paulo do último domingo publicou, na capa do caderno B, uma matéria com a seguinte manchete:



Fico imaginando o seguinte diálogo:
- "Mamãe, hoje não vou prá escola."
- "COMO ASSIM? TÁ DONTE MEU FILHO? DEIXA EU VER SE ESTÁ COM FEBRE!"
- "Nada disso mamãe, só quero aumentar minhas chances de conseguir um emprego".
- "AHHHHH!?!?!? COMO ASSIM?"
- "Simples, olha só o que diz o jornal de domingo. Veja o gráfico!"


Brincadeiras à parte, no título da reportagem, bem mais modesto que a manchete em letras garrafais, vem o começo da explicação...



Vamos entender esse tal de efeito estatístico:
Se as pessoas estão estudando mais, é natural que haja uma parcela maior de pessoas com mais escolaridade a procura de emprego (os tais "desocupados")?

Na mesma reportagem continuam os esclarecimentos.



Tudo explicado? NÃO!

É comum vermos tabelas e gráficos que usam percentuais que não facilitam em nada o entendimento e por vezes ainda geram conclusões erradas.

Neste caso, há duas variáveis em questão:

Anos de escolaridade (0 a 4; 5 a 8; 9 a 10; 11; 12 a 14; 15 ou mais) e Situação de emprego (empregado ou desempregado).
A análise ficou pela metade, já que não vimos informações sobre o grupo dos empregados.

Podemos dizer que a situação do emprego depende dos anos de escolaridade e não o contrário. Por esse motivo, a melhor escolha seria mostrar o percentual de empregados e desempregados dentro de cada faixa dos Anos de Escolaridade.


Os percentuais de desemprego são mostrados no gráfico abaixo, da mesma reportagem. Este sim é correto para a análise e seu título "Taxa de desemprego cai para todas as faixas de escolaridade" deveria ser a manchete.



A análise completa, a escolha adequada do percentual e o gráfico podem ser esclarecedores na tentativa de convencer o estudante do diálogo inicial que estudar ainda vale a pena!

:Dani

9 comentários:

  1. Muito bom Dani, na análise de relações entre variáveis categóricas é importante definir por hipótese quem seria a variável dependente (Y) e qual seria a variável independente (X). O gráfico deveriam refletir a distribuição de Y dentro de cada categoria de X, e não o contrário. Belo exemplo de confusão provocada pela análise inversa.
    Abraço

    ResponderExcluir
  2. Dani
    De fato este tipo de manchete, com apoio em dados parciais, nos pregam peças. Eu mesma não havia percebido, mesmo com a sua brincadeira inicial, o quão enganosa estava a manchete até ver a última tabela ou gráfico.
    Obrigada pelas dicas, vou ficar mais atenta da próxima vez.
    Um abraço.
    Tania

    ResponderExcluir
  3. Olá Dani
    Belíssima análise, mais uma vez.
    Uma coisa que me chama atenção e que você poderia explorar com uma análise de odds, é que para o público de menor escolaridade, onde as taxas de desemprego em 2002 eram mais baixas, tivemos uma queda relativa ainda maior no índice para 2010. Ou seja, a mão de obra menos qualificada está "em alta", o que sugere que, num futuro próximo (senão já no presente), empregos como "empregada doméstica", "auxiliar de serviços gerais" etc. terão um aumento considerável de salário (lei da oferta e da procura) ou serão executados por pessoas com uma qualificação maior do que a atual.
    Aliás, as análises de odds são ótimas para este tipo de estudo.
    Abraços.
    Formigari

    ResponderExcluir
  4. Hoje acabei boiando um pouco, intuitivamente consigo ver que tem algo errado, mas não vejo a causa. O Sr. Roberto explicou, mas fiquei quase na mesma. O Sr. Formigari disse para fazer análise de odds que não tenho conhecimento... Dani, socorro! Estatística é só para iniciados? Desculpe o desabafo...
    Obrigado!
    Amadeu - Curitiba - PR

    ResponderExcluir
  5. Muito boa análise, Dani.
    A estorinha contada no início ilustra exatamente o que o primeiro gráfico está querendo mostrar.
    "Estude menos e tenha emprego".

    O segundo gráfico postado por você esclarece a dúvida que ficou no primeiro.

    Agora, como chegou ao percentual de emprego/desemprego por faixa de idade?

    ResponderExcluir
  6. Amadeu, o problema aqui foi a omissão do grupo dos empregados (por isso o grande ponto de interrogação) e o cálculo dos percentuais na coluna, apresentados no primeiro gráfico e reproduzidos na primeira tabela.

    A análise de ODDS sugerida pelo Formigari seria complementar, mas não substitui dois cuidados básicos que todos nós devemos ter em mente quando trabalhamos com variáveis categóricas:

    1) Nunca omitir um pedaço (ou tecnicamente falando, uma categoria). A folha omitiu a categoria dos empregados.

    2) Escolher percentuais adequados para a análise. A folha apresentou, no primeiro gráfico, os percentuais de cada faixa de escolaridade dentro da categoria desempregados, induzindo a conclusão do tipo "estude menos e tenha emprego", como citou o Frederico.

    Frederico, os percentuais de desemprego eu tirei do próprio gráfico, o das barras azuis, publicado pela folha na mesma matéria. Os percentuais de emprego eu calculei como o complementar 100% - %desemprego.

    ResponderExcluir
  7. Dani, muito obrigado pelas explicações, são muito reveladoras. Passei o final relendo o blog e vi que tem muita coisa boa e que não vimos no curso de administração. Não que ele tenha sido fraco, se é que tu me entende, né?
    Obrigado!
    Amadeu - Curitiba, PR

    ResponderExcluir
  8. Dani
    Eu faria 2 alterações no gráfico final:
    + Ajuste da escala máxima de 50 para 30
    + Retiraria as listras horizontais e os valores do eixo (pois os valores já foram plotados nas barras)
    ou
    + Deixaria o eixo com os valores, e colocaria o % da variação entre as colunas de cada categoria

    O que acha?

    ResponderExcluir
  9. Marco, poderíamos sim fazer esses pequenos ajustes no gráfico final que foi publicado pela folha. Eu ficaria com sua primeira sugestão, de mudar a escala máxima e retirar as linhas de grade.

    ResponderExcluir