Teste de Kruskal–Wallis

edsonmontoro
17 de jul. de 2020
6 min de leitura

Olá pessoal, aproveitando o "ficar em casa" e dando continuidade aos teste não paramétricos, segue mais um para compartilhar com vocês, o teste de Kruskal-Wallis, equivalente ao teste da ANOVA que é da categoria dos paramétricos.

Um grande abraço!

PS: Você pode conferir o artigo aqui pelo blog ou se preferir fazer o download do artigo.

Teste de Kruskal–Wallis

Autor: Edson Rui Montoro

Dando a sequência com os testes não paramétricos, desta vez vamos falar sobre um teste equivalente à ANOVA “one-way”.

Só para lembrar, os testes não paramétricos são um pouco mais “fracos” que os paramétricos, mas em compensação não precisa se preocupar em saber se os dados de cada grupo obedecem a um modelo de distribuição de probabilidades Normal, o que para a ANOVA é importante. Ainda como vantagem, pode usar os testes não paramétricos para dados medidos em escala ordinal e mesmo para os de escala nominal. No geral, a matemática envolvida nestes testes é muito mais simples.

O teste de Kruskal-Wallis foi criado por William Kruskal (1919 – 2005), matemático e estatístico americano e por W. Allen Wallis (1912 – 1998) economista e estatístico americano.

O teste de Kruskal-Wallis não trabalha com as hipóteses de comparação dos parâmetros, não testa a hipótese de igualdade de médias e nem testa a igualdade de medianas, como muitos acreditam. O teste de Kruskal-Wallis é indicado para testar a hipótese de que três ou mais populações têm distribuição igual ou não.

Assim quando se aplica um teste de Kruskal-Wallis, no relatório a princípio, não deveria ser apresentado médias, medianas ou gráficos com essas estatísticas. O teste de Kruskal-Wallis trabalha com postos (rank) e não com os dados coletados.

Só a título de esclarecimento, existe um outro teste não paramétrico que também trabalha com a comparação de vários grupos, que é o teste de Friedman. Este teste tem uma particular diferença, ele considera que cada grupo está usando os mesmos indivíduos em todos os tratamentos, técnica que é chamada de comparação de medidas repetidas, enquanto o Kruskal-Wallis considera que para cada grupo, os indivíduos são diferentes e independentes.

Segue um exemplo para detalhar de maneira prática o funcionamento do teste:

Uma empresa quer avaliar a eficácia de um módulo de treinamento operacional, conforme exigido por algumas normas da ISO, como a 9001, e ainda avaliar se há diferença significativa entre os turnos de trabalho. Para isso ela escolheu 28 funcionários de forma aleatória, divididos pelos seus turnos de trabalho (4 grupos em regime de turnos rotativos), ficando então 7 funcionários de cada grupo. Submeteu todos os funcionários ao módulo de treinamento com o mesmo instrutor, em seguida aplicou um teste prático nas instalações da planta relacionado ao treinamento. Após o teste, avaliou-se o desempenho de cada indivíduo em cada grupo as notas do teste encontram-se na Tabela 1.

As hipóteses para este teste são:

H0: M1 = M2 = M3 = M4;
H1: Há pelo menos um grupo diferente.

Lembrando que o nível de significância, definido previamente, é de 5% e o critério de rejeição de H0 (similar à ANOVA) é unilateral à direita, isto é, se o valor observado for maior ou igual ao valor crítico, rejeita-se H0.

Para a execução do teste, tem-se que atribuir medidas de posição (posto, ou rank rij) a cada valor experimental, para isso ordena-se todos os resultados experimentais em ordem crescente (mantendo-os em seu grupo original) e atribui-se o valor do posto. Caso haja empate, atribui-se o valor do posto médio aos valores experimentais empatados. Na Tabela 2 é apresentado os valores já ranqueados.

Há duas formas de calcular a estatística do teste H:

quando há poucos ou nenhum empate dos ranks;
quando há muitos empates (não há uma regra bem definida, mas geralmente >3).

Para cada grupo obtém-se a soma dos ranks (rij).

Quando não há empates nos valores observados das amostras, ou o nº de empates é muito pequeno, como no exemplo (somente dois resultados empataram), a estatística de teste é:

Onde,

k = Número de grupos;

N = Número total de medições experimentais;

Ri = Soma dos ranks de cada grupo;

ni = número de medidas em cada grupo;

H = valor da estatística de Kruskal-Wallis.

Substituindo os respectivos valores na fórmula se obtém:

A hipótese nula deve ser rejeitada se o valor observado da estatística H for superior ao valor crítico (teste unilateral à direita), para isso se busca esse valor crítico na tabela de Qui-Quadrado (χ2), com (4 - 1) graus de liberdade, pois são 4 grupos, e alfa de 5%; este valor é 7,81. Assim rejeita-se a hipótese nula, concluindo que existe pelo menos um grupo diferente.

Vale destacar que alguns cuidados devem ser tomados, dependendo das condições do teste, como o número de grupos e o número de medidas por grupo. Valem as regras:

Se k = 3 e ni ≤ 5, consultar tabela da distribuição exata da estatística H, sob H0.
Se k > 3 ou ni ≥ 5, H tem aproximadamente distribuição Qui-Quadrado (χ2); consultar a tabela desta distribuição.
Quando há muitos empates nos valores observados das amostras a estatística do teste a ser usada deve ser:

Sendo:

Quando se rejeita a hipótese nula H0 no teste de Kruskal-Wallis, existe evidência de que pelo menos um dos grupos é diferente dos demais. Porém, não se tem a informação de qual ou quais são diferentes. Neste caso, um procedimento de comparações múltiplas permite determinar quais grupos são diferentes, da mesma maneira que é feito para a ANOVA.

Vale ressaltar que após a rejeição da ANOVA do teste de Kruskal-Wallis, normalmente o pesquisador tem interesse em saber qual/quais o(s) grupo(s) são diferentes, pois como as distribuições de probabilidades são diferentes, interessa saber se os parâmetros desta distribuição também têm diferenças.

Mas antes disso, é interessante verificar de uma maneira mais visual, usando uma técnica também não paramétrica (a técnica do Box Plot), para os escores. Os resultados são visualizados na Figura 1.

É possível observar na Figura 1 que provavelmente não há diferença significativa entre os Grupos 1 e 2, pois o chanfro dos intervalos de confiança da mediana coincidem ( para interpretar um Box Plot, ver artigo sobre boxplot publicado anteriormente ). Os grupos 3 e 4 são diferentes dos grupos 1 e 2, enquanto parece que entre os Grupos 3 e 4 também existe uma diferença. Como a coincidência dos chanfros entre os Grupos 3 e 4 têm uma pequena coincidência, pode-se ficar na dúvida dessa conclusão. Só será possível responder com mais certeza usando um teste de comparações múltiplas mais formal, que será apresentado a seguir. Mas antes ainda é possível obter mais algumas conclusões dos Box Plots, os Grupos 1 e 2 obtiveram os menores escores, enquanto o Grupo 4 parece ter um escore mediano maior que os outros.

Alguém pode perguntar, mas e o Box plot das medidas de posição (ranks ou postos), as conclusões seriam as mesmas?

Pode-se ver na Figura 2, que os grupos se comportam de maneira muito parecida com os grupos do Box plot dos valores originais.

Já tendo a análise visual, pode-se efetuar os testes de comparações múltiplas, calculando as diferenças entre as somas dos ranks de cada grupo, e rejeita-se a comparação de igualdade quando a diferença em módulo for maior ou igual a um valor crítico (Cij), dado pela fórmula:

Onde,

ni e nj são os tamanhos da amostra de cada grupo i e j, respectivamente;

N = Número total de medições, N = n1 + n2 + ... + nk;

Ri. e Rj. É a soma dos postos (ranks) de cada grupo sendo comparado, i e j, respectivamente;

|Ri. - Rj.| é a diferença observada de cada comparação par a par; e χ(α,k-1)2 é o mesmo valor crítico usado no teste de Kruskal-Wallis, que no nosso exemplo é 12,837.

Efetuando os cálculos para testar cada sub hipótese (6 no total), têm-se os resultados apresentados a seguir.

O valor crítico é o mesmo para todos os grupos, pois todos têm o mesmo número de medidas, isto é, 7 medições experimentais cada. Se os grupos tiverem número de medidas diferentes, para cada sub hipótese deverá ser calculado um valor crítico.

1. H0: Mediana do Grupo 1 = Mediana do Grupo 2

Como a diferença em módulo não é maior que o valor crítico, não se rejeita a primeira sub hipótese, isto é, não há diferença significativa entre o Grupo 1 e o Grupo 2, confirmando a conclusão da comparação dos respectivos Box plots.

2. H0: Mediana do Grupo 1 = Mediana do Grupo 3