A escolha do teste baseia-se em:
Deve sempre questionar-se a razoabilidade do modelo. Se o modelo está errado, todo o resto também está. Tenha cuidado com variáveis que não são verdadeiramente independentes. Representações gráficas de dados contínuos e categóricos Imagem por Lecturio. Licença: CC BY-NC-SA 4.0As 3 categorias principais de testes estatísticos são:
Teste de qui-quadrado (χ2)Testes de qui-quadrado são usados frequentemente para analisar dados categóricos e determinar se 2 variáveis categóricas estão relacionadas.
Para realizar um teste qui-quadrado são necessárias 2 informações: os graus de liberdade (número de categorias menos 1) e o nível α (que é escolhido pelo investigador e geralmente definido como 0,05). Além disso, os dados devem ser organizados numa tabela. Exemplo: Se você quisesse ver se os malabaristas eram mais propensos a nascer durante uma determinada estação do ano, os dados poderiam ser registrados na tabela seguinte:
Para começar, as frequências esperadas para cada célula na tabela acima precisam de ser determinadas usando a equação: $$ Frequência\ esperada = np_{0i} $$onde n = o tamanho da amostra e p0i é a proporção hipotética em cada categoria i. No exemplo acima, n = 300 e p0i é ¼, então a frequência esperada em cada célula é 300 * 0,25 = 75 em cada célula. A estatística de teste é então calculada pela fórmula padrão do qui-quadrado: $$ \chi ^{2} = \sum _{todas\ as\ células} \frac{(observado-esperado)^{2}}{esperado} $$onde 𝝌2 é a estatística de teste que está a ser calculada. Para cada “célula” ou categoria, a frequência esperada é subtraída da frequência observada; este valor é elevado ao quadrado e depois dividido pela frequência esperada. Depois de este número ser calculado para cada categoria, os números são somados. Exemplo de cálculo de 𝝌2: Usando o exemplo acima, a frequência esperada em cada célula é 75, então o teste de 𝝌2 pode ser calculada da seguinte forma:
𝝌 2 = 1,08 + 0,653 + 0,013 + 0,12 = 1,866 Determinar se a estatística de teste é ou não estatisticamente significativa: Para determinar se esta estatística de teste é estatisticamente significativa, a tabela de qui-quadrado é usada para obter o número crítico de qui-quadrado.
Exemplo da tabela de valores críticos para o teste de 𝝌2: Exemplo de teste 𝝌2: Os malabaristas são mais propensos a nascer numa determinada estação com um nível de significância de 0,05?
𝝌2= 1,08 + 0,653 + 0,013 + 0,12 = 1,866 Como 1,866 é < 7,81 (o nosso valor crítico), precisamos de não rejeitar (ou seja, aceitar) a hipótese nula e concluir que a estação de nascimento não está associada ao malabarismo. Armadilhas comuns:
O teste exato de FisherSemelhante ao 𝝌2, o teste exato de Fisher é um teste estatístico usado para determinar se existem associações não aleatórias entre 2 variáveis categóricas.
Monta-se uma tabela de contingência 2 × 2 assim:
A estatística do teste, p , é calculada a partir desta tabela usando a seguinte fórmula: $$ p = \frac{(\frac{a+b}{a})(\frac{c+d}{c})}{(\frac{n}{a+c})} = \frac{(\frac{a+b}{b})(\frac{c+d}{d})}{(\frac{n}{b+d})} = \frac{(a+b)! (c+d)! (a+c)! (b+d)!}{a! b! c! d! n!} $$onde p = p-value; A, B, C e D são números das células numa tabela de contingência básica 2 × 2; e n = total de A + B + C + D. |