Qual teste estatistico para comparar dois grupos de frequencia

A escolha do teste baseia-se em:

Os tipos de variáveis que está a testar (tanto a “exposição” do seu teste quanto o seu “resultado”)
- Quantitativo: contínuo (idade, peso, altura) versus discreto (número de pacientes)
- Categórico: ordinal (classificações; ex.: notas, tamanho da roupa), nominal (grupos com nomes; ex. estado civil) ou binário (dados com apenas uma resposta “sim/não”; ex., vivo ou morto)
Se os seus dados cumprem ou não determinados critérios conhecidos como suposições; suposições comuns incluem:
- Os pontos dos dados são todos independentes uns dos outros.
- A variação dentro de um único grupo é semelhante entre todos os grupos.
- Os dados seguem uma distribuição normal (curva em forma de sino).

Deve sempre questionar-se a razoabilidade do modelo. Se o modelo está errado, todo o resto também está.

Tenha cuidado com variáveis que não são verdadeiramente independentes.

Representações gráficas de dados contínuos e categóricos

Imagem por Lecturio. Licença: CC BY-NC-SA 4.0

As 3 categorias principais de testes estatísticos são:

Testes de regressão: avaliam as relações de causa e efeito
Testes de comparação: comparam as médias de diferentes grupos (requerem dados de resultados quantitativos)
Testes de correlação: procuram associações entre diferentes variáveis

Tabela: Tipos de testes estatísticos

Nome de teste	O que o teste está a testar	Tipos de variáveis/dados	Exemplo
Testes de regressão
Regressão linear simples	Como é que uma alteração na variável de previsão/entrada (input) afeta a variável de resultado	Preditor: contínuo Resultado: contínuo	Como é que o peso (preditor) afeta a esperança de vida (resultado)?
Regressão linear múltipla	Como é que as alterações nas combinações de ≥ 2 variáveis preditoras podem prever alterações no resultado	Preditor: contínuo Resultado: contínuo	Como é que o peso e o status socioeconómico (preditores) afetam a esperança de vida (resultado)?
Regressão logística	Como é que ≥ 1 variáveis preditoras podem afetar um resultado binário	Preditor: contínuo Resultado: binário	Qual é o efeito do peso (preditor) na sobrevivência (resultado binário: morto ou vivo)?
Testes de comparação
Teste t (t-test) emparelhado	Compara as médias de 2 grupos da mesma população	Preditor: categórico Resultado: quantitativo	Comparar os pesos dos bebés (resultado) antes e depois da alimentação (preditor).
Teste t (t-test) independente	Compara as médias de 2 grupos de diferentes populações	Preditor: categórico Resultado: quantitativo	Qual é a diferença na altura média (resultado) entre 2 equipas de basquete diferentes (preditor)?
Análise de variância (ANOVA)	Compara as médias de > 2 grupos	Preditor: categórico Resultado: quantitativo	Qual é a diferença nos níveis de glicose no sangue (resultado) 1, 2 e 3 horas após uma refeição (preditores)?
Testes de correlação
Teste qui-quadrado	Testa a força da associação entre 2 variáveis categóricas com um tamanho de amostra maior	Variável 1: categórica Variável 2: categórica	Comparar se a aceitação na faculdade de medicina (variável 1) é mais provável se o candidato nasceu no Reino Unido (variável 2).
Teste exato de Fisher	Testa a força da associação entre 2 variáveis categóricas com um tamanho de amostra menor	Variável 1: categórica Variável 2: categórica	Igual ao qui-quadrado, mas com tamanhos de amostra menores
Teste de r de Pearson	Testa a força da associação entre 2 variáveis contínuas	Variável 1: contínua Variável 2: contínua	Comparar como o nível plasmático de HbA 1c (variável 1) se relaciona com os níveis plasmáticos de triglicéridos (variável 2) em pacientes diabéticos.

Teste de qui-quadrado (χ2)

Testes de qui-quadrado são usados frequentemente para analisar dados categóricos e determinar se 2 variáveis categóricas estão relacionadas.

O que os testes de qui-quadrado conseguem avaliar:
- Se está presente uma associação estatisticamente significativa entre 2 variáveis
- Dados analisados: normalmente dados categóricos “contados”, o que significa que você tem várias categorias nomeadas e os seus pontos de dados são os valores contados para cada categoria.
- Mais preciso em amostras grandes do que o teste exato de Fisher
O que os testes qui-quadrado não conseguem avaliar:
- A força dessa associação
- Se a relação é causal

Para realizar um teste qui-quadrado são necessárias 2 informações: os graus de liberdade (número de categorias menos 1) e o nível α (que é escolhido pelo investigador e geralmente definido como 0,05). Além disso, os dados devem ser organizados numa tabela.

Exemplo: Se você quisesse ver se os malabaristas eram mais propensos a nascer durante uma determinada estação do ano, os dados poderiam ser registrados na tabela seguinte:

Categoria (i): estação de nascimento	Frequência observada de malabaristas em cada estação de nascimento
Primavera	66
Verão	82
Outono	74
Inverno	78

Número total de malabaristas na amostra: 300

Para começar, as frequências esperadas para cada célula na tabela acima precisam de ser determinadas usando a equação:

$$ Frequência\ esperada = np_{0i} $$

onde n = o tamanho da amostra e p0i é a proporção hipotética em cada categoria i.

No exemplo acima, n = 300 e p0i é ¼, então a frequência esperada em cada célula é 300 * 0,25 = 75 em cada célula.

A estatística de teste é então calculada pela fórmula padrão do qui-quadrado:

$$ \chi ^{2} = \sum _{todas\ as\ células} \frac{(observado-esperado)^{2}}{esperado} $$

onde 𝝌2 é a estatística de teste que está a ser calculada. Para cada “célula” ou categoria, a frequência esperada é subtraída da frequência observada; este valor é elevado ao quadrado e depois dividido pela frequência esperada. Depois de este número ser calculado para cada categoria, os números são somados.

Exemplo de cálculo de 𝝌2: Usando o exemplo acima, a frequência esperada em cada célula é 75, então o teste de 𝝌2 pode ser calculada da seguinte forma:

Categoria (i): estação de nascimento	Frequência observada de malabaristas com cada estação de nascimento	(Observado – esperado) 2 /esperado
Primavra	66	(66 ‒ 75) 2 / 75 = 1,08
Verão	82	(82 ‒ 75) 2 / 75 = 0,653
Outono	74	(74 ‒ 75) 2 / 75 = 0,013
Inverno	78	(78 ‒ 75) 2 / 75 = 0,12

𝝌 2 = 1,08 + 0,653 + 0,013 + 0,12 = 1,866

Determinar se a estatística de teste é ou não estatisticamente significativa:

Para determinar se esta estatística de teste é estatisticamente significativa, a tabela de qui-quadrado é usada para obter o número crítico de qui-quadrado.

A tabela tem graus de liberdade (número de categorias menos 1) no eixo y e o nível α no eixo x.
Usando os graus de liberdade e o nível α do estudo, você encontra o número crítico no gráfico (veja o gráfico de exemplo abaixo).
O número crítico é usado para determinar a significância estatística comparando-o com a estatística de teste.
- Se a estatística de teste > valor crítico:
  - As frequências observadas estão longe das frequências esperadas
  - Rejeita-se a hipótese nula em favor da hipótese alternativa baseada neste nível α.
- Se a estatística de teste < valor crítico:
  - As frequências observadas estavam próximas das frequências esperadas
  - Não se rejeita a hipótese nula com base neste nível α.

Exemplo da tabela de valores críticos para o teste de 𝝌2:
No eixo y, V representa os graus de liberdade (ou seja, o número de categorias em estudo menos 1); os níveis de significância (níveis α) são mostrados ao longo do eixo x. Os valores críticos correspondentes são encontrados na tabela e comparados com a estatística de teste calculada.

Imagem por Lecturio. Licença: CC BY-NC-SA 4.0

Exemplo de teste 𝝌2: Os malabaristas são mais propensos a nascer numa determinada estação com um nível de significância de 0,05?

Existem 4 estações diferentes, então existem 3 graus de liberdade.
nível α = 0,05
Usando a tabela acima, o número crítico é 7,81
Portanto, rejeitaremos nossa hipótese nula se a estatística de teste for > 7,81.

Cálculos assumindo que a frequência esperada em cada célula é 75

Categoria (i): estação de nascimento	Frequência observada de malabaristas com cada estação de nascimento	(Observado ‒ esperado) 2 /esperado
Primavera	66	(66 ‒ 75) 2 / 75 = 1,08
Verão	82	(82 ‒ 75) 2 / 75 = 0,653
Outono	74	(74 ‒ 75) 2 / 75 = 0,013
Inverno	78	(78 ‒ 75) 2 / 75 = 0,12

𝝌2= 1,08 + 0,653 + 0,013 + 0,12 = 1,866

Como 1,866 é < 7,81 (o nosso valor crítico), precisamos de não rejeitar (ou seja, aceitar) a hipótese nula e concluir que a estação de nascimento não está associada ao malabarismo.

Armadilhas comuns:

Não usar o qui-quadrado a menos que os dados sejam contados.
Cuidado com tamanhos de amostra grandes, pois os graus de liberdade não aumentam.

O teste exato de Fisher

Semelhante ao 𝝌2, o teste exato de Fisher é um teste estatístico usado para determinar se existem associações não aleatórias entre 2 variáveis categóricas.

Usado para analisar dados encontrados em tabelas de contingência e determinar o desvio dos dados em relação à hipótese nula (ou seja, o p-value)
- Por exemplo: comparar 2 possíveis “exposições” (fumar versus não fumar) com 2 resultados possíveis (desenvolver cancro do pulmão versus saudável)
- As tabelas de contingência podem ter > 2 “exposições” ou > 2 resultados
Mais preciso para conjuntos de dados pequenos
O teste de Fisher fornece p-values exatos com base na tabela.
Fórmula complicada para calcular a estatística do teste, normalmente calculada com software.

Monta-se uma tabela de contingência 2 × 2 assim:

	Y	Z	Total da linha
W	A	B	A + B
X	C	D	C + D
Total da coluna	A + C	B + D	A + B + C + D (= n )

A estatística do teste, p , é calculada a partir desta tabela usando a seguinte fórmula:

$$ p = \frac{(\frac{a+b}{a})(\frac{c+d}{c})}{(\frac{n}{a+c})} = \frac{(\frac{a+b}{b})(\frac{c+d}{d})}{(\frac{n}{b+d})} = \frac{(a+b)! (c+d)! (a+c)! (b+d)!}{a! b! c! d! n!} $$

onde p = p-value; A, B, C e D são números das células numa tabela de contingência básica 2 × 2; e n = total de A + B + C + D.