segunda-feira, 28 de março de 2011

Folha x USP: muito barulho por nada

Já são 17 dias de rusgas. Uma série de reportagens provocativas e de respostas aparentemente polidas trocadas entre o jornal Folha de São Paulo e a USP, foi o cenário de uma batalha dissimulada devido a erro de análise e falta de informações. O título disso poderia ser "Muito barulho por nada", não fosse o nome de uma antológica peça de Shakespeare. Acompanhe os fatos:

10/mar/2011 – Reportagem de primeira página diz que USP é preterida por 25% dos alunos selecionados.


10/mar/2011 – Na mesma edição, segue matéria “Um em cada quatro aprovados desiste da USP” tentando explicar esse resultado através de várias hipóteses, sempre com a tendência de apontar desprestígio da universidade em função do suposto grande aumento de desistências.


11/mar/2011 – Nota no site da Fuvest contesta os dados da Folha, apresentando a tabela contendo os “treineiros” considerados indevidamente na análise, e revela que o valor que a Folha deveria ter publicado é de 16% e não de 25%. Veja em: http://www.fuvest.br/vest2011/informes/ii162011.html

16/mar/2011 – No editorial da edição, “Alerta na USP”, o jornal continua cutucando a USP. Mesmo dizendo que dados poderiam estar errados, o jornal levanta três fatores para explicar o fenômeno: alunos optando por faculdades de elite mais prestigiosas, estudantes de poucos recursos preferindo locais mais próximos de seus domicílios ou trabalho e perspectiva de inserção rápida no mercado de trabalho.

23/mar/2011 – A matéria “Fuvest convocou 479 alunos sem ensino médio para a USP” esclarece os dados equivocados: “Esses alunos inflaram dados sobre desistência na USP; mesmo assim, abandono de aprovados é recorde: 16,35%”. Note que, para a correção, usaram outro tipo de gráfico:


24/mar/2011 – Na coluna Tendências e Debates de título “A Preferência pela USP” a pró-reitora da USP, Telma Zorn, se defende explicando que “A complexidade dos fatores nos obriga a realizar uma profunda anamnese, que dê informações precisas sobre as causas do fenômeno" e afirma estar em andamento "consulta direta àqueles que não se matricularam.”

27/mar/2011 – Em “Esnobando a USP” a Ombudsman do jornal puxa a orelha da reportagem porque não seguiu o manual de redação e deveria realizar a correção na sessão “Erramos”.

Duas conclusões, então:
Pau na Análise 1) Antes de se levantar hipóteses a respeito de resultados encontrados, uma hipótese básica deve ser sempre verificada: a de que os dados podem estar incorretos.
Pau na Análise 2) Várias hipóteses foram levantadas, todas vindas de fontes muito especializadas e confiáveis, mas continuam como hipóteses. Há que se esperar o resultado da pesquisa com os desistentes para se realizar uma boa análise. Melhor seria se tivéssemos pesquisas de outros anos para comparação.

Por enquanto, meus amigos, vale mais a pena ver "Muito barulho por nada". Viva Shakespeare!

Até,
Roberto

terça-feira, 22 de março de 2011

Não tire conclusões precipitadas

A folha de São Paulo do último domingo publicou, na capa do caderno B, uma matéria com a seguinte manchete:



Fico imaginando o seguinte diálogo:
- "Mamãe, hoje não vou prá escola."
- "COMO ASSIM? TÁ DONTE MEU FILHO? DEIXA EU VER SE ESTÁ COM FEBRE!"
- "Nada disso mamãe, só quero aumentar minhas chances de conseguir um emprego".
- "AHHHHH!?!?!? COMO ASSIM?"
- "Simples, olha só o que diz o jornal de domingo. Veja o gráfico!"


Brincadeiras à parte, no título da reportagem, bem mais modesto que a manchete em letras garrafais, vem o começo da explicação...



Vamos entender esse tal de efeito estatístico:
Se as pessoas estão estudando mais, é natural que haja uma parcela maior de pessoas com mais escolaridade a procura de emprego (os tais "desocupados")?

Na mesma reportagem continuam os esclarecimentos.



Tudo explicado? NÃO!

É comum vermos tabelas e gráficos que usam percentuais que não facilitam em nada o entendimento e por vezes ainda geram conclusões erradas.

Neste caso, há duas variáveis em questão:

Anos de escolaridade (0 a 4; 5 a 8; 9 a 10; 11; 12 a 14; 15 ou mais) e Situação de emprego (empregado ou desempregado).
A análise ficou pela metade, já que não vimos informações sobre o grupo dos empregados.

Podemos dizer que a situação do emprego depende dos anos de escolaridade e não o contrário. Por esse motivo, a melhor escolha seria mostrar o percentual de empregados e desempregados dentro de cada faixa dos Anos de Escolaridade.


Os percentuais de desemprego são mostrados no gráfico abaixo, da mesma reportagem. Este sim é correto para a análise e seu título "Taxa de desemprego cai para todas as faixas de escolaridade" deveria ser a manchete.



A análise completa, a escolha adequada do percentual e o gráfico podem ser esclarecedores na tentativa de convencer o estudante do diálogo inicial que estudar ainda vale a pena!

:Dani

quarta-feira, 16 de março de 2011

O que as médias escondem

Pegando carona no comentário sobre uso de médias, que o Carlos fez no último post Enquete: Barras ou Dispersão?, vamos exemplificar o que o uso somente de médias pode esconder.

Veja os quatro conjuntos de dados abaixo:

As médias são idênticas! Mas o que isso significa? Algum desavisado, olhando somente para elas poderia cometer o grave erro de dizer que os conjuntos são iguais.

Vamos ver o que "dizem" os gráficos?


Vamos usar 4 gráficos de dispersão, um para cada conjunto.

Esses gráficos rapidamente nos revelam que os quatro conjuntos de dados são muito diferentes, cada um com um padrão específico da relação entre X e Y.

Este exemplo foi desenvolvido por Anscombe, e apresentado em seu artigo “Graphs in statistical analysis” publicado na revista The American Statistician de 27 de fevereiro de 1973.

Ele nos mostra de maneira simples, mas incisiva, que uma análise gráfica é, geralmente, mais reveladora que somente uma apresentação tabular dos dados ou uma análise das médias.

Portanto, cuidado com as médias!

:Dani

PS: aos amantes da estatística, os desvios-padrão também são idênticos! Se isso for pouco, experimente calcular os coeficientes de correlação e advinhe... são idênticos também!

quinta-feira, 10 de março de 2011

Enquete: Barras ou Dispersão?

Caro leitor, gostaria de saber sua opinião sobre a facilidade de compreender a informação abaixo. Escolha, por favor, o gráfico que melhor descreve o posicionamento da bolsa de São Paulo (Bovespa) em termos de número de aberturas e volume de captação, em relação a outras bolsas do mundo.

Gráfico 1:

Este é o gráfico escolhido pela Folha em 05/03/11 (B1) para ilustrar a matéria "Pequena empresa não chega a bolsa"

Gráfico 2:

Este gráfico foi feito a partir dos dados do gráfico 1, porém utilizando o conceito de gráfico de dispersão, ou o popular X-Y.

Agradeço se deixar sua resposta como comentário, na semana que vem a gente conversa mais a respeito.
Até
Roberto

quinta-feira, 3 de março de 2011

Publicitários, coragem! Mostrem a opinião dos clientes.

Você certamente consegue ver o gráfico na foto abaixo, não é?



Ela compõe uma peça da Bradesco Seguros que está nos jornais desta semana. Ao contrário do post "Quanto vale um Gráfico", em que abordamos o bom uso de gráficos em peças de publicidade, o de hoje vai levantar alguns questionamentos a esse respeito.
Veja a peça toda:



Ela começa dizendo que houve "crescimento", e sem os dados ao longo do tempo, temos de crer nisso (não dá pra confiar no foto-gráfico, rs). O que há é uma enxurrada de dados absolutos e pontuais de indicadores da companhia: faturamento, ativos, pagamentos efetuados, atendimentos realizados, número de segurados, valor total de pagamento de sorteios, número de autos e residência segurados. São esses os dados que me farão confiar nessa instituição? Como é que sei que há algum crescimento? Como é que sei se esses números são bons ou ruins? O gráfico criativo da foto me persuadirá para comprar um seguro da Bradesco?

Falando em persuasão, o prof. Izidoro Blikstein, no seu livro "Como falar em público: técnicas de comunicação para apresentações", diz: "Comunicar não é simplesmente transmitir informações. A comunicação tem a grande função estratégica de gerar efeitos positivos a fim de persuadir o público destinatário a confiar e acreditar no conteúdo, bem como produzir a resposta esperada pelo comunicador (aderir a uma campanha, compreender as informações, tomar uma decisão, apoiar uma iniciativa)". Baseado nisso, pergunto: quem é o destinatário dessa peça? Qual o efeito ou a resposta esperada? Os destinatários têm condições de avaliar as informações apresentadas para agir?

Gostaria de estar mais bem informado para aderir a essa campanha, por exemplo, através de dados relativos aos outros concorrentes, ao crescimento do mercado, dados ao longo do tempo. O que mais me interessa mesmo é a opinião e comportamento dos clientes. Informações de retenção, recompra, idade e intensidade de relacionamento dos clientes atuais, por exemplo. Melhor ainda seriam dados de pesquisas de satisfação de clientes (comparando também a concorrência), dados de reclamações (procons e órgãos de defesa de consumidores, "reclame aqui", imprensa etc).

Há um indicador que pra mim é "matador", o NPS (Net Promoter Score). Ele foi proposto por Fred Reichheld e é bem descrito no seu livro "A pergunta definitiva". Trata-se de pesquisa em que a questão apresentada aos clientes é parecida com "Você nos recomendaria a um amigo?". A partir das respostas, podemos fazer uma relação entre clientes promotores (aqueles que recomendam o produto ou serviço) e clientes detratores (aqueles que não recomendam). Acabei de voltar de uma viajem e respondi uma pesquisa sobre a minha experiência no site de reserva de hotéis booking.com. A pergunta estava lá:




Publicitários, coragem! Cadê essas informações?

Até
Roberto