segunda-feira, 20 de dezembro de 2010

Playfair: da Balança Comercial ao Google Imagens

Podemos dizer que o engenheiro e economista político escocês William Playfair (1759–1823) foi o inventor dos gráficos estatísticos mais usados atualmente: gráficos de tendência, de setores e os versáteis gráficos de barras. Vários autores afirmam que a publicação de gráficos estatísticos começa com o aparecimento do Commercial and Political Atlas (Playfair, 1786). Nessa publicação, os gráficos de tendência são vistos essencialmente da mesma forma que atualmente. Complementando nosso último post (Responda rápido), um assunto que motivou Playfair a inventar os gráficos de tendêcia foi como representar a Balança Comercial, veja um exemplo do resultado de seus esforços abaixo:



Para demonstrar que essa solução ainda está aí, veja o quadro publicado na FSP neste último domingo, no caderno sobre a era Lula:



O primeiro gráfico do quadro é conceitualmente idêntico ao de Playfair. Seus gráficos são quase sempre construídos para que comparações em diferentes domínios (linhas, cores, legendas etc.) não excedam a capacidade de trabalho e atenção da memória humana. As séries temporais e cores nunca excedem três ou quatro em número, as legendas são posicionadas próximo às linhas em vez de ficarem em quadros distantes. O cuidado na escolha do título, legenda dos eixos, formato, escalas, linhas de referência, não deixam dúvidas que ele intuitivamente aderiu às convenções pregadas pela moderna psicologia experimental de percepção gráfica.
Abra agora o Google Imagens e digite "Balança Comercial Brasileira".



Infelizmente vem muito lixo gráfico. Para nós isto é até bom, porque usamos o Google Imagens para nossos alunos praticarem a crítica aos gráficos. Faça você mesmo um teste, digite simplesmente "gráficos" e comece a "atirar". Mas vá com calma, advertimos que pode ser prejudicial à saúde, pois pode causar lesões por esforço repetitivo (LER), de tanta bobagem gráfica que há na internet. Até.
Ah, até o ano que vem, pois vamos dar uma paradinha de final de ano. Obrigado pela audiência e participações. No ano que vem incluiremos questões sobre a relação da habilidade em se lidar com dados e a Ciência de Melhoria.

Até!
Roberto

sexta-feira, 10 de dezembro de 2010

Responda rápido


Qual gráfico você faria no lugar deste, publicado sexta, dia 12, pela Folha de São Paulo (B2)?

Se pensou num simples e objetivo gráfico de tendência, concordo com você. Veja o resultado:

Mas espere um pouco, não seria legal compararmos também outros blocos? Encontrei as informações na mesma fonte (Ministério do Desenvolvimento, Indústria e Comércio Exterior). Neste caso teremos problemas com o efeito macarrão (veja o post Gráfico Espaguete). Então podemos repetir o gráfico, deixando de fundo o anterior, com as novas linhas mais em evidência. Veja:

Não há fórmulas prontas, mas o que vale é a informação bem passada, possibilitando que o próprio leitor tire suas conclusões.

Até,
Roberto

domingo, 28 de novembro de 2010

Meio ambiente: monitorar para preservar

Medir é geralmente difícil e custa caro, mas é fundamental para gerenciar as coisas. A Cetesb presta um enorme serviço há décadas ao avaliar sistematicamente a qualidade das praias de São Paulo. É um exemplo de constância de propósito em melhorar o meio ambiente. Neste último domingo a Folha trouxe a reportagem: "Em dez anos, S.Sebastião perde a excelência de praias" com este gráfico:



Trata-se do mesmo tipo de gráfico encontrado no site da Cetesb. Este tem sua função: a de um banco de dados que o cidadão pode consultar para decidir qual praia frequentar.

Ocorre que não é fácil notar a piora da qualidade das praias pelo excesso de cores e informações analíticas de cada praia. É preciso resumir isso. Minha sugestão é fazer um gráfico mostrando a quantidade de praias com classificação Boa ou Ótima pela Cetesb. Veja abaixo:



Aprendemos com ele que a manchete da Folha infelizmente parece ter razão. O percentual encontra-se em torno de 35%, quando já esteve em torno de 70% no início da década. Isso pode ser efeito da variação, que já abordamos aqui no post "Titirica, o filósofo". Importante é continuarmos acompanhando.

De volta aos gráficos, aqui é uma boa oportunidade para usar gráficos interativos (para publicações digitais). Trago a seguir um exemplo publicado pelo NY Times que poderia ser seguido: http://nyti.ms/dBhv4h.

O leitor tem bastante controle das informações que deseja obter navegando pelos gráficos. A Cetesb poderia usar essa tecnologia pois já coleciona muita informação a respeito de nossas praias. Pode ser um atrativo para que, com os indicadores em mãos, cada vez mais pressionemos nossos eleitos a exercer a gestão das mudanças necessárias para melhoria do nosso ambiente.
Até,
Roberto

terça-feira, 16 de novembro de 2010

Tabelas também facilitam a compreensão do leitor

Neste blog a gente foca a comunicação com gráficos, mas nem sempre essa é a melhor forma de se apresentar dados. Existem ocasiões em que uma tabela traz mais ganhos para o leitor. Elas já apareceram no post "Nada se cria, tudo se copia". Veja, também, o exemplo abaixo onde o objetivo é comparar a força bélica da Índia com a do Brasil, publicado na FSP, dia 16/11/2010, A14.


Usando um pequeno espaço, o jornal me convenceu de que a força bélica da Índia se encontra muito superior a nossa.
Se fossemos transmitir esta informação através de gráficos faríamos várias barras, como no exemplo abaixo (publicado na mesma matéria).


Seriam necessários mais oito gráficos como esse, um para cada tipo de armamento.
Portanto, tenha sempre em mente qual o objetivo do gráfico, qual a conclusão que se quer transmitir ao receptor, e depois pense nos instrumentos disponíveis, seja um gráfico ou uma tabela.

No caso analisado a tabela resumo facilita a compreensão do fato (força bélica da Índia é superior a do Brasil). Isso se deve à diferença na ordem de grandeza dos números, ao bom uso da pontuação do milhar, e ao alinhamento à direita. A tabela apresentada está, também, bem leve, isto é, com linhas horizontais finas e sem as linhas verticais desnecessárias. Mas nem tudo saiu perfeito. Há um desalinhamento das figuras com o texto a que se referem. Deve ter havido um descuido de revisão final.

Resultado: Show de tabela, mas não se esqueça da revisão!
Abraços,
Satomi

terça-feira, 9 de novembro de 2010

Não à CPMF, mas cuidado com os números!

Mesmo morta, acho que nunca a CPMF foi tão “Twittada”. Tá todo mundo apavorado com a possibilidade dela voltar, mas tem notícia precisando revisão pra não cair na leviandade.
Neste último sábado (06/11) a Folha publica em Primeira Página com letras garrafais:

Desconfiei das orações, não pela sintaxe, pois parecem duas perfeitas coordenadas sindéticas adversativas, mas fui à caça de dados ou de um gráfico na certeza de que poderiam condená-las quanto ao conteúdo. Dentro do caderno, lá estava ele boiando no meio de uma página:



O seu impacto visual leva a uma confirmação instantânea da manchete. Embora gráfico e manchete concordem entre si, vamos atirar o pau nesse gráfico, e na manchete também...
O problema, como em muitos gráficos, está na escolha da escala. Aqui há algo muito particular. Ao colocar duas curvas de magnitudes bem distantes sob a mesma escala, a visualização da variação fica bastante prejudicada. Não percebemos, por exemplo, qualquer variação na curva da despesa com saúde que é visualmente constante.

A dica neste caso é fazer as duas curvas em gráficos separados tomando um cuidado especial com a escolha das escalas. Elas deverão ter suas amplitudes calculadas em função da curva de maior variação relativa. Para a curva da receita total, temos uma variação de 4,1 pontos percentuais, ou seja, 20% relativamente ao menor valor. Para o gasto com saúde, os 0,16 pontos percentuais de variação correspondem a 10% do valor inicial. Portanto, adotaremos as duas escalas com amplitude de 20% de variação relativa. O Resultado é esse:



A conclusão visual é bem diferente daquela inicial. O gasto da saúde cresceu proporcionalmente à metade do crescimento da receita total.
Pau no gráfico e na Manchete!
Até
Roberto

quinta-feira, 28 de outubro de 2010

Boa notícia

Um gráfico é uma tentativa de se expressar dados visualmente para facilitar a compreensão dos padrões formados por eles.

Vejam um que traz uma notícia muito animadora:


A manchete da matéria, publicada ontem na página C1 da Folha de São Paulo, é “Número de assassinatos cai 13% em SP”. Observem que a queda de 13% comparada ao trimestre anterior pode ser apenas variação, já discutida pelo Roberto no post Tiririca, o filósofo. A boa notícia mesmo é o padrão da queda revelada pelo gráfico (compare o período de 2005-2006 com 2007-2010).

Daí me fiz a seguinte pergunta: Como seria o histórico anterior a 2005? Será que já vinha em queda? Ou será que houve um pico de homicídios em 2005? Fui pesquisar...

Não encontrei a base de dados, mas achei o gráfico abaixo no site do Bepa (Boletim Epidemiológico Paulista) que mostra o número de homicídios no período de 1980 a 2007 no Brasil, no Estado de São Paulo (ESP) e no Brasil excluindo o Estado de São Paulo (Brasil menos o ESP).


Vejam que a queda no número de homicídios no Estado de São Paulo começou a partir de 2001, portanto, aquele comportamento que vimos no primeiro gráfico seria até mais impressionante se tivéssemos os dados anteriores a 2005. Notícia mais animadora ainda!

Voltando a reportagem, ao lado do gráfico há uma tira que informa “Estado ainda vive epidemia de homicídios” e explica que a OMS (Organização Mundial de Saúde) considera epidemia um índice superior a dez homicídios por grupo de 100mil habitantes por ano. Mas como é que concluo isto a partir do gráfico? Veja que este apresenta apenas números absolutos.



No site do Bepa encontrei o gráfico abaixo e tomei a liberdade de incluir uma linha de referência no 10.


Sei que o número de mortes por homicídio ainda é grande, mas mesmo sem os dados exatos de 2009 e 2010 (a FSP informa taxa de 10,36 nos últimos 12 meses e o governo informa taxa 8,86 homicídios a cada 100 mil habitantes no 3º tri de 2010) fica evidente a melhoria da taxa no estado de São Paulo.

O que acham da notícia, animadora não?

Abraços,
Satomi

Uma notícia curta: Esta semana, em Salt Lake City, Utah–EUA, acontece a VisWeek 2010 que inclui a 16a Conferência de Visualização da Informação (16th IEEE InfoVis Conference).

terça-feira, 26 de outubro de 2010

Gráfico espaguete

O que fazer quando precisamos representar várias curvas num gráfico de tendência?

A Donna Wong em seu livro "The Wall Street Journal Guide to Information Graphics: The Dos and Don'ts of Presenting Data, Facts, and Figures" diz, em primeiro lugar, para não fazermos um espaguete.
Veja um exemplo: a Folha do último sábado trouxe um bom infográfico explicando a tal guerra cambial, mas junto veio uma bela macarronada como gráfico principal. Há quem veja nele algo de "Miojo"...



O gráfico traz a queda do valor do dólar em relação a várias moedas. A proposta é ótima, vemos que o dólar caiu em relação a todas as moedas rapidamente. O que dá trabalho é acompanhar o trajeto de queda em relação a uma moeda específica. Explico: todas as curvas estão da mesma grossura, com cores diferentes e com suas legendas afastadas, no alto. Isso dificulta localizá-las e segui-las ao longo do gráfico. No livro citado há três dicas: usar grossuras diferentes, tons diferentes de cinza e posicionar a legenda de cada curva proximo a ela, ou no final da curva do lado direito. Fiz um teste observado-se essas dicas e veja o que se deu:



Parece o mesmo gráfico, mas agora eu consigo identificar e percorrer cada curva muito mais facilmente. Para um daltônico, não misturar cores é fundamental (é o meu caso). Você sabia que cerca de 8% da população masculina de origem caucasiana tem daltonismo? Pense nisso antes de usar cores belas e formosas...
Outra coisa, vocês notaram que coloquei o Yuan também no gráfico? Pois bem, quem leu o infográfico da Folha viu que a todo momento se fala que o dólar não se desvalorizou frente ao Yuan, mas não o puseram no gráfico! Deslize de contexto.
Mais uma dica: nunca deixe sua curva ser suavizada pelo Excel. Num gráfico de tendência, ligue os pontos com segmentos de reta indicando que entre um ponto e outro não há informação.
É isso aí, o gráfico de tendência é um dos mais poderosos. Use-o com destreza.

Até
Roberto

quinta-feira, 14 de outubro de 2010

Pau nas pesquisas, sim!

Quem explica é Alfredo Wenzel, colega e parceiríssimo da Limite Consultoria (http://limiteconsultoria.com.br/). Como eles são especialistas em pesquisa, aí vão informações esclarecedoras e preocupantes que merecem muita atenção:

"A audiência aqui é muito boa, portanto vou colocar mais alguns ingredientes e pontos para consideração sobre alguns dos temas já abordados nesse blog e que aparecem em outros fóruns e que muitas vezes não são discutidos como deveriam principalmente nessa época onde as pesquisas estão muito em foco.

O objetivo não é avaliar a qualidade do instituto A ou B, mas levantar questões pertinentes que deveriam ser observadas e que influenciam as estimativas finais, principalmente porque no final das contas o que vale é a diferença entre essas estimativas e valores observados, vou tentar não utilizar muitos jargões estatísticos:

1-Erro Amostral: em delineamentos por Cotas não existe procedimento para calcular a margem de erro porque não é uma amostragem probabilística, aliás sempre que se estiver trabalhando com amostras não probabilísticas não existe meios de calcular margens de erros. O fato de ser probabilística é que permite admitir a distribuição de probabilidade que permite calcular tais probabilidades.

2-Cálculo de Margem de Erro: supondo uma amostragem probabilística a distribuição que deveria ser utilizada na maioria dos casos para cálculo das margens de erro em pesquisas de Opinião Pública seria a Multinomial e não a Binomial no caso de perguntas fechadas. Se a questão for aberta essa possibilidade pode ser difícil de ser modelada.

3- Erro Não Amostral: aqui incluo os entrevistadores, e basicamente eles podem errar em pelo menos duas maneiras: proposital ou preenchimento, é claro que uma equipe bem treinada, coordenadores acompanhando o trabalho e algoritmos de validação orientando o trabalho de checagem são fundamentais e minimizam bem esses problemas.

4-Inferência para os indecisos (ou eles são desconsiderados?): me parece estranho, muito simplificado e não usual fazer inferência na intenção de voto de eleitores indecisos baseado apenas na distribuição dos índices globais de cada candidato, para realização dessas inferências no mínimo deveria ser levado em consideração também o perfil demográfico, econômico, etc da pessoa indecisa bem como indicadores de rejeição aos demais candidatos e mesmo assim não é uma tarefa fácil.

5-Por fim, a questão dos votos não computados é claro que também causam efeitos nas estimativas, quando um eleitor é entrevistado ele diz qual é a intenção de voto, em uma eleição com tantos cargos é natural que muitos dos votos que deveriam ocorrer na prática não ocorram.

Vou parar por aqui, novamente volto a salientar que pesquisa não é algo simples, nem todas as variáveis estão sob controle e que uma discussão sobre o tema deveria ser bastante profunda e não se limitar “a 2% para mais ou para menos” baseado apenas na quantidade de entrevistas feitas.
Abraços e pau nesse comentário!

Alfredo"


segunda-feira, 11 de outubro de 2010

Corinthians: pior que tava, ficou.

Terminei o último post prevendo a queda do treinador do Corinthians caso ele não ganhasse do Atlético (de Goiás) ontem. Longe de mim gorar o Timão, mas gostaria de ver o que aconteceria, pois meu interesse estava nas reações das pessoas diante de resultados ruins, mas prováveis. Concluí que torcedor não tem coração pra aguentar baixas probabilidades.
Vejam os resultados dos dois técnicos ao longo do Brasileirão abaixo:

Antes da sequência fatídica de cinco jogos sem ganhar assinalada no gráfico, ninguém diria que o substituto do Mano levaria o time pra baixo. Fazendo um cálculo simplificado supondo que nada mudou no Corinthians, apareceria essa crise com 3% de probabilidade. Explico o cálculo: por hipótese, o Corinthians tem uma chance idêntica de ganhar jogos no Brasileirão de 50% (14 vitórias em 28 rodadas). Cinco rodadas sem ganhar é da ordem, então, de 1/32 (meio elevado à quinta potência).
Ninguém aguentou esse tranco. Com três rodadas adversas já estavam todos de alerta, veja notícia publicada na Folha em 06/10:

Acho um exagero querer a cabeça do técnico com três rodadas ruins, a chance disso é da ordem de 1/8. Mas é a prática comum dos clubes. Pra mim, demissão de técnico é pura expiação, descarrego, vingança contra a "Santa Variância".
Até Roberto

quinta-feira, 7 de outubro de 2010

Tiririca, o filósofo.

“PIOR QUE TÁ NUM FICA”, é provável.

O bordão do Tiririca tem um conceito profundo sobre a variação: quando um sistema, sujeito às mesmas fontes de variação, produz um resultado em particular de baixo desempenho em relação à sua média, provavelmente ele produzirá um resultado melhor em seguida, ou seja: pior que tá num fica.

Isso vale também para um momento em que o sistema produz um resultado pontual de alto desempenho, e a frase seria: provavelmente, “MELHOR QUE TÁ, NUM FICA”.
Parece um conceito óbvio, mas ele freqüentemente vai de encontro (bate de frente) com a nossa intuição e agimos de maneira equivocada diante dessas variações: ficamos preocupados e esbravejamos com um resultado baixo ou condecoramos alguém por um resultado alto. Em seguida achamos que foi uma boa bronca ou nos arrependemos do elogio dado.
O conceito vale para sistemas estáveis (sujeitos às mesmas fontes de variação). Ocorre que instabilidades provocadas por fontes de variação não presentes o tempo todo aparecem e dão seus sinais. Veja o caso do IPCA que saiu hoje: nos três meses antes das eleições, o indicador se comportou estranhamente longe do padrão normal de variação.

Walter Shewhart, nos anos 1920, desenvolveu uma ferramenta para podemos avaliar quando um sistema dá sinais que está com uma fonte de variação incomum atuando pontualmente, tratam-se dos gráficos de controle. São gráficos de tendência com referências de variação comum. Há um procedimento estatístico que usa os próprios dados do indicador para calcular tais referências. Veja o IPCA com referências de variação comum:

Note, no gráfico, que ele assinala os três meses antes das eleições. Não me parece que foi obra do acaso, o que você acha? E o valor de 0,45% que saiu agora, seria absolutamente normal de acontecer, você não concorda?
Não disse que a gente interpreta mal a variação? Veja as manchetes que alguns portais publicaram hoje a respeito desse último dado do indicador:
- Inflação tem maior alta desde abril, revela IBGE
- A despeito de aceleração do IPCA, juros futuros operam com ...
- Inflação pelo IPCA em setembro acelera para 0,45%
- Seca na Rússia influencia alta da inflação oficial em setembro‎.
Grifei as palavras que contém certo exagero sobre o resultado. O único portal que não exaltou esse número e que considero um bom comentário do ponto de vista de entendimento da variação é o Globo abaixo:

Para saber mais sobre a filosofia do Tiririca, recomendo o livro “O Andar do Bêbado. Como o acaso determina nossas vidas” de Leonard Mlodinow (Ed. Zahar, Rio de Janeiro)
A propósito, o Corinthians não vence há quatro rodadas, e as manchetes destacam a pior fase do Timão: vai cair mais um técnico no Brasileirão ou PIOR QUE TÁ NUM FICA?

Até,
Roberto

segunda-feira, 4 de outubro de 2010

Pau na Pesquisa?

Eu defendo os institutos de pesquisa: existe uma coisa que se chama tendência. Numa eleição aparentemente morna, a coisa esquentou na última semana. Um fenômeno absolutamente plausível e bom para a democracia.
Veja o gráfico dos dados do Datafolha abaixo e me diga se o resultado das urnas (últimos pontos) é, ou não, verossímil em função da evolução histórica das pesquisas de intenção de voto.

Registro aqui minha indignação com relação aos comentaristas chamados para encher lingüiça na TV com suas explicações das urnas culpando o pessoal de pesquisa por ter de mudar seus argumentos após o pleito.
Pau no blá-blá-blá!
Até,
Roberto

quinta-feira, 2 de setembro de 2010

Detalhes que ajudam o leitor

  Vi este gráfico na Folha de São Paulo do dia 31/08/10 - caderno informe publicitário p.02, e decidi aproveitá-lo para dar uma dica aqui no blog.

  Não vou comentar que não consigo ver que o Brasil é sexto no ranking ou que o gráfico de tendência é o mais indicado para acompanhar evolução ao longo do tempo. Hoje vou comentar sobre um detalhe que normalmente nos passa despercebido.
  Veja o exemplo abaixo, adaptado do teste de QI de Design Gráfico do site Perceptual Edge, e responda em qual dos gráficos os rótulos são mais fáceis de ler.

  Acredite, a grande maioria ao ler este post escolheu a letra “A”, pois trata-se da varredura natural da leitura. Quanto maior a inclinação maior a complexidade de leitura.
  Veja o exemplo abaixo, adaptado do livro The Wall Street Journal Guide to Information Graphics: The Dos and Don'ts of Presenting Data, Facts, and Figures, da especialista em visualização gráfica Dona Wong

e como ficaria o gráfico do número de navios com rótulos na horizontal:
  Portanto a dica é: procure dispor os rótulos de maneira horizontal, pois colocá-los em ângulo dificulta a leitura.
  Abraços,
        Satomi

segunda-feira, 30 de agosto de 2010

Internet móvel mais lenta que pombo-correio??

  Recentemente me chamou atenção a notícia de que o número de usuários de internet banda larga por celular superou o de usuários pela rede fixa, mas o que mais me impressionou foi que poderão ocorrer apagões na rede de banda larga móvel a partir de 2012, como mostra o gráfico veiculado pela Veja, edição 2179 - pg 119.

 
  Bom gráfico. Mostra claramente que o fluxo de dados cresce e que a capacidade limite da rede é de 700 Gbits/seg. É fácil perceber que em 2012 podemos ter problemas. Detalhe: uma das soluções propostas é a instalação da tecnologia 4G, que está prevista para 2013.
  A reportagem, na realidade, se concentrou em falar sobre a velocidade atual da rede e tinha como título “Tá lento, mas vai melhorar”. O primeiro gráfico apresentado foi este.



  Gostei do gráfico, pois tem como idéia um velocímetro e mostra uma lesma remetendo à velocidade lenta da internet no país e a conseqüente colocação que o Brasil ocupa no ranking. Outro ponto positivo é o destaque para o Brasil. Eu só alteraria a ordem das cores, isto é, verde quanto mais rápido e vermelho para os mais lentos. Caso o verde tenha sido colocado para dar maior destaque ao Brasil, alteraria o vermelho, pois tem um significado negativo, e na realidade quanto maior a velocidade melhor. Mas não leva pau no gráfico.
  Já o outro gráfico da mesma reportagem...

  O título, “Internet mais lenta que pombo correio”, me chamou muita atenção. Recentemente, no post Tudo é relativo, falamos da importância do contexto em um gráfico, mas cuidado com as análises para montar o contexto.
  Espera aí, como é que fizeram esta comparação? Ah, tomaram como base uma distância de 30 km. Mas, por que fazer este comparativo com base nessa distância? Os usuários estão a uma distância média de 30km? Acredito que não. E se transmitíssemos o dado para China, qual dado chegaria primeiro, via internet ou pombo correio?
  Resultado: Pau na análise
  Abraços,
       Satomi

quinta-feira, 26 de agosto de 2010

Ainda sobre apresentação, Hans Rosling é show!

   No seu último post, Não leve pau na apresentação, o Roberto escreveu sobre apresentação de gráficos e deu algumas dicas bem legais. Imediatamente me veio à cabeça a palestra do sueco Hans Rosling, professor do Karolinska Institutet (Suécia).
   No momento que assisti à apresentação dele fiquei impressionado com sua habilidade no uso do recurso gráfico, com a interação dele com o gráfico, com seu carisma e em como ele consegue chamar atenção para a mensagem que quer passar.
   O tema central da palestra é a divisão dos países em duas categorias: os “desenvolvidos” e os “em desenvolvimento”. Vale a pena ver o vídeo! Se quiser colocar legenda basta clicar em subtitles e terá diversas opções, inclusive português.



    Em seu livro, Now You See It, o especialista em visualização gráfica Stephen Few sugere que Hans Rosling foi a primeira pessoa na história a tornar um gráfico de dispersão fascinante para uma multidão de pessoas,
em sua primeira conferência conferência no TED (Tecnology, Entertainment, and Design). Ele acredita em dois motivos: pela própria história ser atrativa e importante, e porque as bolhas animadas trouxeram vida à história de uma maneira fácil de ser compreendida.
   O software utilizado na apresentação chama-se Gapminder e você pode utilizá-lo diretamente do site para  fazer análises com outras variáveis ou baixá-lo gratuitamente.
   Abraços,
        Satomi

terça-feira, 17 de agosto de 2010

Não leve pau na apresentação

Você já se enrolou ao apresentar um gráfico? Seus ouvintes fizeram careta e ficaram confusos com sua explicação? Então vale a pena se preparar melhor para mostrar seus resultados. Dedico esse post pra trazer algumas dicas...
Ao expor um gráfico seja rápido, mas sistemático ao descrevê-lo. Lembre-se: você é que está no comando. Comece pelo título. Aponte para ele e leia-o sem interrupções e explicações. Siga em seguida diretamente ao eixo X, faça uma descrição sucinta começando pelo nome da variável, o range de variação mostrado e como são divididos os intervalos. Siga então para o eixo Y, faça o mesmo. Isso não durou mais de cinco segundos em cada uma dessas três operações. O quarto passo é identificar elementos no interior do gráfico. Explique “o que são” cada um deles, o que representa cada linha, cada marca, cores e quebra. Pronto, você agora estará com seu ouvinte bem posicionado e agradecido pelo apoio dado. Comece, somente agora, a interpretação dos padrões encontrados nos dados. Veja um exemplo:



Na figura acima temos um gráfico cuja explicação básica poderia ser assim:

1) Mostre o título: “este é o gráfico da evolução do absenteísmo na Central de atendimento no ano de 2009”
2) Mostre o eixo X: “vejam no eixo X que os dados são mensais começando em janeiro até dezembro do ano de 2009”
3) Mostre o eixo Y: “aqui no eixo Y temos o percentual de faltas dos analistas escalados variando de zero a 16%. Note que esse indicador é do tipo quanto menor, melhor (aponte para a seta do lado direito), e nosso objetivo era reduzir abaixo de 3% (mostre a linha horizontal do objetivo)”
4) Mostre os elementos internos: “vemos neste gráfico, três linhas, a que está no meio é o absenteísmo total da central. A linha superior é relativa aos sites receptivos e a inferior é a dos sites ativos”
5) Mostre elementos complementadores: “a partir de meados de julho, começamos o projeto de melhoria”
6) Mostre o padrão encontrado mais importante: “vejam a evolução do absenteísmo total. Notem como melhorou a partir do projeto e alcançamos a meta já em outubro”
7) Mostre explicações: “conseguimos isso focando nos sites receptivos (de altos índices) e fizemos algumas mudanças, apontadas com asterisco: incentivos de assiduidade, acerto de escalas e intercâmbio de analistas”
8) Pergunte se a platéia foi esclarecida: “por favor, gostaria de saber se o gráfico ficou claro para vocês”

Agora sim, sei que você não mais vai levar pau na apresentação!

Até,
Roberto

domingo, 1 de agosto de 2010

Tudo é relativo

Uma das fontes da mídia que eu mais gosto para gráficos é o NY Times. A equipe deles, liderada por Matthew Ericson (http://www.ericson.net/), é super criativa além da execução das idéias ser absolutamente primorosa. Há vários gráficos interativos muitíssimo interessantes e vale a pena seguir o twitter deles (https://twitter.com/nytgraphics).

O Matthew deixou no seu site uma apresentação que fez na Where 2.0 do ano passado (http://www.ericson.net/infovis/InfoVis_Raster.zip). Lá pelo meio da apresentação, ele fala que sempre devemos adicionar o contexto no qual os dados aparecem. Concordo plenamente, todo mundo ao receber uma informação sempre se pergunta : "E daí? Isso é grande ou pequeno? Tá muito ou tá pouco?". Não dá para absorver um dado sem compararmos com algo, somos seres comparadores. Pudera, a gente se mede o tempo todo, haja vista o tanto de fofoca que rola por aí.

Chega de embromeixon e vamos ao gráfico. Trouxe o exemplo de contexto do Matthew aqui para analisarmos . Ele mostra três eslaides. No primeiro vemos a quantidade mensal de combatentes americanos mortos na Guerra do Iraque. Há uma linha de referência de 100 por mês. Você já vai comparando: "puxa 100 mortos é um acidente aéreo grave, por mês é bastante, hein...?"



No segundo eslaide é mostrado um gráfico emparelhado comparando com a guerra do Vietnã. A escala é mudada e logo a gente percebe que a barra dos 100 por mês fica lá em baixo. O Iraque foi "fixinha" perto dessa outra...



Achei ótima essa comparação. Ele coloca um gráfico ao lado do outro e não vê a coisa quem não quer. O terceiro gráfico é arrasador e faz qualquer um se consternar. Ele mostra a comparação dessas duas guerras com a Segunda Grande Guerra. A barra sobe para 20mil por mês. São dez Vietnãs e duzentos Iraques!



É um exemplo perfeito de contexto, se não fosse tremendamente trágico.

Não desprezando a perda que foi a guerra para os Estados Unidos, mas querendo fazer uma quadro um pouco mais abrangente, fui atrás dos dados do "outro lado", o lado dos civis iraquianos. O mesmo lado cuja "proteção contra Sadam" foi o motivo alegado pelos americanos para bombardearem o Iraque. Encontrei os dados no site http://www.iraqbodycount.org/database/
Coloquei no lado vazio do segundo eslaide um gráfico nos mesmos moldes dos propostos pelo Matthew.

E é melhor vocês mesmos verem, porque eu já não tenho mais nada a dizer...


Até,
Roberto

terça-feira, 27 de julho de 2010

Cores que ajudam

Foi publicado na Folha de São Paulo no dia 22/07/2010 uma matéria sobre eleitores analfabetos, pg. A08. Ela apresentava o seguinte quadro:



Vejam no mapa vermelho do Brasil como localizamos rapidamente as regiões com maior taxa de eleitores analfabetos ou que nunca freqüentaram escola. Esta visualização foi obtida através do bom uso da escala, utilizou-se do recurso do degradê, isto é, quanto maior a taxa de eleitores analfabetos mais escura a cor do estado.

Além disto, foi disponibilizado o mapa verde do Brasil sobre o percentual de famílias atendidas pelo Bolsa Família, e facilmente conseguimos ver uma correlação entre os mapas. Percebam como a lógica do degradê facilita esta compreensão. Não temos que ficar buscando o que cada cor significa na legenda.

Esta visualização não seria obtida caso fosse utilizado cores diferentes. Veja a ilustração abaixo, retirada do teste de QI de Design Gráfico do site Perceptual Edge, e procure pelas regiões com maiores taxas de crescimento:



Uma melhoria que poderíamos fazer no quadro publicado no jornal seria no gráfico de arco.

No gráfico de arco foi utilizada uma cor diferente para o 1° grau completo o que destacou esta classe sem necessidade. A matéria foca nos analfabetos e nos que não foram à escola. Portanto, estas deveriam ser as classes destacadas. Além disto, poderíamos utilizar um gráfico de barras que facilitaria a comparação dos percentuais entre os graus de escolaridade.



Abraços,
Satomi

sexta-feira, 16 de julho de 2010

Esteriótipos têm perna curta...

O brasileiro tem uma certa fama de ser um sujeito alegre e caloroso, que sabe levar a vida numa boa. Ao contrário dos alemães, por exemplo, que são tidos como sisudos e metódicos, mais disciplinados. A partir destes esteriótipos, me parece natural pensar que os alemães são mais estressados no trabalho, ou seja, levam mais a sério os problemas profissionais e tendem a ser mais afetados por eles... será?

Olhe o gráfico abaixo que saiu na matéria “Brasileiros estão entre os mais estressados do globo”, Folha de São Paulo, publicada no dia 14 de julho de 2010, pág. C8. Ela mostra o percentual da população economicamente ativa atingida pelo chamado “burn out”, que é o nível mais elevado de estresse, caracterizado por um esgotamento extremo, normalmente associado ao trabalho.



O gráfico mostra que o Brasil é o segundo país com maior índice de “burn out” dentre os destacados, com o Japão na liderança isolada. Não é difícil ver isso no gráfico e a visualização no mapa é agradável, inclusive porque mostra que há dados de várias regiões do planeta, e isso é interessante.

Mas tem uma coisa que me incomoda nele: o fato de comparar os países pelo tamanho do círculo associado a cada país, pois os círculos estão bastante apartados, ora com texto dentro, ora com texto fora. Não seria muito mais fácil – e simples – comparar altura de barras, como no exemplo abaixo?



De todo modo, achei bacana esta matéria porque usou muito sabiamente um gráfico para ajudar no entendimento deste estudo, que vai contra o senso comum. Eis aí um um uso muito nobre para os gráficos!

É isso aí,
Leo

Fonte dos dados: Pesquisa de 2009 do Isma-BR (International Stress Management Association no Brasil)

quinta-feira, 15 de julho de 2010

Nada se cria, tudo se copia.

O texto "Haiti está à míngua 6 meses após tragédia" foi publicado na Folha de S.Paulo do dia 12 de Julho de 2010. Junto à ele veio o quadro abaixo:




O gráfico da esquerda é daqueles que, só de ler o título, a gente vai sozinho sem explicação de ninguém. Show de gráfico! Se você o estivesse apresentando numa reunião, bastaria ler com calma o título e dizer que a largura das setas azuis representam a quantidade de migrantes. Então você poderia tranquilamente continuar sua fala: "notem que houve uma maior tendência de blá, blá, blá..."

Se você também achou o gráfico super legal, pode estar pensando que se trata de uma novidade. Concordo que a gente não o vê por aí todo dia, mas nada há de novo. Um sujeito francês genial chamado Charles Joseph Minard (http://en.wikipedia.org/wiki/Charles_Joseph_Minard), que viveu há 200 anos, fez um gráfico extremamente parecido cujo título original era "Carte figurative et approximative des quantités de vin français exportés par mer en 1864", que no português é mais ou menos "Carta fugurativa das quantidades aproximadas de vinho francês exportados via mar em 1864". Notem abaixo as semelhanças com o nosso gráfico em estudo:



Viu só? Apenas com o título a gente entende o gráfico todo. Até percebe umas curiosidades tipo não havia ainda, é claro, o canal do Panamá. E como bebiam nossos hermanos! Imagina hoje com todo aquele chocolate que a Alemanha deu na Argentina... Tá provado então: nada se cria, tudo se copia. Na maioria dos casos, isso é ótimo. Gráficos bons ensinam a gente e devem ser copiados.

Agora, nem tudo são flores. Voltem, por favor, ao gráfico original da Folha. Observem o lado direito do quadro. Que confusão é aquela? Cada leitor perde, no mínimo, um minuto indo e voltando nos "labels" das informações. Com 300 mil leitores (tiragem do jornal), 5 mil horas de leitores são perdidas, é mole?

Será que gráfico serve pra tudo? Porque os dados dos desastres são tão discrepantes, nenhum gráfico fica bom neste caso. O jeito é adotar nossa velha e boa tabela. A informação fica clara e organizada. Veja só:



Qualquer hora, quero voltar pra falar mais sobre tabelas.
Conclusão: pau no segundo gráfico! (eu já estava com saudade...)

Até...
Roberto

quinta-feira, 8 de julho de 2010

A arte de compor quadros

O quadro abaixo apareceu em 10/06/2010 no caderno cotidiano da FSP.

Um crítico de arte não chamaria isso de uma obra-prima, mas quem mexe com dados sabe que compor um quadro desses requer muita destreza. O que vemos é uma reunião de informações na forma gráfica, escrita e desenhada que prendem a atenção do leitor e mexe com seu emocional. Explico:

Primeiro o título com um ótimo gancho, o que seria um ritmo de galinha? Isso inquieta a mente do leitor que vai, automaticamente, procurar explicações dentro do quadro. Logo em seguida, é colocada a informação-tema do quadro, a crítica sobre os efeitos das obras na marginal. Note como o autor foi super direto no texto, "avenidas mais rápidas, cidade mais lenta". Ele mostra isso nos gráficos dos carros. Aliás, fazendo um parêntesis, o desenho dos carros sedimenta a idéia que o assunto é trânsito.

Em seguida, é mostrado um gráfico de tendência da velocidade média na cidade (manhã e tarde). Nele são apontados os investimentos realizados pelo governo e nenhum efeito é percebido. Ao lado, temos um gráfico comparando velocidades de bixos. Fantástico, pois põe o leitor com os pés no chão e tangibiliza o que significa andar a 15km/h, velocidade de uma galinha. Repare que as escalas desses dois gráficos estão sincronizadas, corretíssimo.

E não pára aí não, nosso mestre dos quadros puxa uma última questão: "e quanto gastamos para andar como galinhas?" Questão cuja resposta vem com uma equação (forma gráfica de fácil assimilação) e segue a comparação com coisas tangíveis como obras do metrô. Genial, e super bem humorado.

Dica: da próxima vez que você tiver de fazer uma apresentação no PowerPoint, lembre-se de que é possível usar um só eslaide. Se bem que, para fazê-lo, você vai se esforçar mais que os vinte e poucos usuais, cheios de "bullets" e "embromeixon" de uma apresentação comum.

Show de quadro, parabéns à Folha.
Até...
Roberto

quarta-feira, 7 de julho de 2010

Pizzas? Bolhas???? Confusão!

Vejam este gráfico que veiculou na Super Interessante, Edição 280 - Jun/2010, pág 42.



Este gráfico me surpreendeu. Inicialmente parece ser um gráfico de pizzas, mas as pizzas são usadas quando queremos dar a idéia de parte de um todo, isto é, fatiar a pizza. Então não era isto, pois as somas dos valores de aluguéis nada representam.

Analisando com mais atenção e vendo o restante da reportagem, percebi tratar-se de um gráfico de bolhas, mas cadê a bolha? Está representada por um quarto dela. Perceba a dificuldade para fazer as comparações entre os quartis, o aluguel do Rio Sul Shopping (RJ) é maior que do Shopping Morumbi?

Segue abaixo uma sugestão que poderia ser adotada e conseguiríamos comparar os valores de aluguéis mais facilmente.

Outro ponto é a comparação com a média do aluguel residencial que imagino contemplar todo tipo de moradia da mansão a favela. Se o intuito era mostrar que os aluguéis mais caros ficam dentro de shoppings, como está escrito no título, a comparação deveria ser realizada com as áreas residenciais e comerciais mais caras também. Por exemplo, o aluguel do m2 na Anália Franco, no Jardins, na Avenida Paulista, no Leblon, na Lagoa, etc.

Resultado: Pau no gráfico!

Abraços,

Satomi

terça-feira, 29 de junho de 2010

Vamos discutir a relação?






Na matéria “No campo da bolsa, Chile vence Brasil”, FSP – 28/06/2010 – Mercado B2, aparecem dados do desempenho das bolsas desde o início da copa nos países participantes dela. Outra informação que acompanha o gráfico é quais países se classificaram para as oitavas. Eu pergunto, o que uma coisa tem a ver com a outra? Será que o desempenho das seleções tem relação com o humor das bolsas dos respectivos países? Isto é, os jogadores ficam motivados com seus ganhos de capital e dão “tudo de si” pra recompensar essa alegria? Ou seria o contrário, quando as seleções estão indo super bem, os mercados é que ficam eufóricos? Mas, esperem, pode ser que a frustração pelos maus resultados na copa é que contamina o nervosismo das bolsas dos países desclassificados.

Está aí mais um assunto futebolístico que todo mundo tem uma explicação DEPOIS de ver os resultados. No futebol é assim, fizemos 3 x 0 no Chile e todo mundo diz que já sabia e esperava esse resultado por causa disso ou daquilo. Mas ANTES da partida, a predição nem sempre era essa. Ponha a mão na consciência...

Voltando às bolsas, o texto diz, com certo receio, que há uma relação bolsa x copa. Achei o repórter bem criativo ao tentar achar alguma relação entre mercado e futebol, mas vamos lá, ele exagerou. Alguém em sã consciência diria, ou melhor, prediria que há essa tal relação ANTES de verificar algum resultado? Alguém pode me explicar isso com alguma teoria?

Incrível. Ao se aplicar um teste de hipóteses (fiz questão de aplicá-los), realmente diríamos que a tal relação é “estatisticamente significante”. Ocorre que aplicamos o teste APÓS o fato ter acontecido. Quando garimpamos informações num bocado de dados, como agora em época de copa do mundo, às vezes achamos relações estranhas ou coincidências pitorescas, mas que não passam da obra do acaso. O problema, então, passa a ser a explicação dessas coisas.

Por outro lado, uma boa análise começa sempre com uma boa pergunta. Por exemplo, num post anterior, discutimos se os acidentes melhoraram ou não após a aplicação da “Lei Seca”. Pudemos discutir os resultados, pois havia uma questão importante a ser verificada com os dados. Quando estamos tentando, através de um conjunto de dados, achar uma relação sobre a qual previamente temos uma predição a respeito baseada numa teoria, isso é fazer uma boa análise.

Sobre a relação bolsa x copa, resta-nos aplicar o bordão de um comercial de cachaça: explica!!??

Sobre predição, predigo que vai dar Argentina e Brasil na final. Veremos!
Até,
Roberto