sexta-feira, 17 de julho de 2020

Atirei foi ao podcast Ação Eficaz!

Olá todos! Vejam (ouçam) o bate-papo super descontraído que tive com o Leo (Leonardo Andrade) sobre carreira e Análise de Dados. E não percam os outros episódios do podcast dele (Ação Eficaz) que estão demais!
Até!
Roberto

quinta-feira, 9 de julho de 2020

Cloroquina, Covid-19 e os Testes de Hipóteses

Tá uma polêmica esse negócio da Hidroxicloroquina. Neste vídeo eu aproveito para ajudar a esclarecer esse tema e mais, o vídeo é focado no aprendizado dos conceitos e lógica dos Testes de Hipóteses da Estatística. Um assunto que as pessoas sempre têm dificuldade de aprender nos cursos de Estatística que fazem.

Leis os tópicos que abordo no vídeo:

Afinal, a hidroxicloroquina funciona ou não a Covid-19? A conclusão do último estudo publicado e que foi muito bem aceito na comunidade científica internacional: Não se rejeita a hipótese de que a Hidroxicloroquina não previne a Covid-19 ao nível de 5%. E isso quer dizer o quê? Que ela previne ou não a Covid-19? Se você não entendeu essa conclusão, você precisa saber mais sobre Testes de Hipóteses!

Esse e todos os estudos padrão ouro que são bem aceitos pela comunidade científica seguem rigorosamente os protocolos da Medicina Baseada em Evidências que usam os procedimentos do Teste de Hipóteses da Estatística para organizam a coleta de dados, formalizar a análise e fornecer conclusões confiáveis a respeito dos resultados.
E você que está aqui pra aprimorar seus conhecimentos em DataLearning, ou você que está fazendo um curso comigo na Academia Anova e está aqui como pré-work para as nossas aulas simultâneas, vou falar uma coisa: é muito importante aprender a lógica, a filosofia do teste de hipóteses porque, juntamente com a Estimação de Parâmetros, são as ferramentas mais importantes da Inferência ou seja, por meio de amostras com poucos casos a gente pode generalizar conclusões para muitos casos ou populações.
Além disso os Testes de Hipóteses fazem parte de vários outros procedimentos da Estatística, por exemplo, a gente pode ajustar modelos de forma matemática, como uma machine learning qualquer, mas são os Testes de Hipóteses que nos permitem deixar apenas os fatores importantes na construção de um modelo, aqueles fatores que fazem realmente sentido e tornam os modelos mais aplicáveis porque não vou precisar de informações irrelevantes e também com a estatística, a gente calcula a precisão das estimativas obtidas com os modelos.
Então a dica é aprenda a lógica e a filosofia dos Testes de Hipótese que isso vai simplesmente te libertar para você entender qualquer outro procedimento da Estatística. Dois elementos fundamentais dos Testes de Hipóteses são importantes destacar: A Hipótese Nula e o Nível de Significância.
Pra gente fixar bem as ideias da lógica do Teste de hipótese, pense num julgamento, o que acontece num tribunal? A pergunta é: o réu cometeu o crime de que é acusado, ou não cometeu? Qual é a hipótese básica? É a de que não cometeu o crime. Todo julgamento começa com a presunção de inocência. Hipótese nula é assim, o réu é inocente, a droga não tem efeito, a modificação na máquina não melhora o processo.
O promotor (que tem o mesmo papel do pesquisador em estudos) tenta incriminar o réu mostrando provas que ele é o culpado, assim ele tenta fazer os jurados mudarem de ideia quanto a inocência do réu. A evidência mostrada nas provas equivale ao nível de significância, se forem fortes, rejeitamos a hipótese de inocência, se forem fracas, não podemos condenar o acusado.
Voltando à frase: Não se rejeita a hipótese de que a Hidroxicloroquina não previne a Covid-19 ao nível de 5%, ela é cheia de negações e parece que os pesquisadores estão meio confusos quanto ao resultado, mas não, a conclusão do teste é essa mesma.
A Hipótese Nula é aquela ideia básica em que todo mundo acredita, menos o pesquisador que tem uma teoria que, se funcionar, ela nos leva a desacreditar da tal hipótese nula. O pesquisador quer fazer com que a gente mude de opinião quanto à hipótese nula, fazendo que a gente a rejeite mostrando os dados do seu experimento ou sua pesquisa. 
No exemplo da Cloroquina, todo mundo inicialmente, acha que ela não funciona para curar a covid-19, menos o pesquisador, porque ele viu que a cloroquina funciona de verdade, mas por enquanto, só no vidrinho lá do laboratório, e aí ele especula que ela funciona também nas pessoas. Ele também não tem certeza, mas quer muito acreditar nessa ideia de que a cloroquina cura na pessoas, essa ideia a gente chama de hipótese alternativa, alternativa à nula que todo mundo acha que não funciona.
Mas pra mostrar que a hipótese alternativa dele é que é a válida, ele tem de fazer um experimento comparando quem toma e quem não toma a cloroquina e ver se há diferença nisso. E se nesse experimento, a diferença for tão grande que se torna improvável, diante da hipótese nula verdadeira, a gente rejeita essa hipótese. Improvável quanto? Normalmente ao nível de 5%, ou seja, há uma probabilidade de acontecer a diferença (ou maiores) que aconteceu no experimento, mantendo a ideia de que a hipótese nula é verdadeira, se essa probabilidade for menor ou igual a 5% (o nível de significância), a gente então rejeita a hipótese nula. A diferença que aparecer tem de ser tão grande que ficamos convencidos que o pesquisador está correto. Assim que ele nos convence a mudar de ideia.
Ocorre que neste último estudo, a diferença encontrada foi de somente 2,4 pontos percentuais, e p=0,35 ou seja há uma probabilidade de 35% de se encontrar essa diferença caso a hipótese de que a Hidroxicloroquina NÃO tem efeito seja verdade.

Veja que essa probabilidade não atingiu os 5% de significância para rejeitarmos a hipótese, então o estudo não consegue fazer que acreditemos no efeito da Hidroxicloroquina. É isso.
Até
Roberto