MANOVA - Endossando IA
Tipos de IA - Exemplos
Como Iremos Trabalhar no Verão
Dados Originais
Cat. | IMC | Corr | Kcal |
ATLETA | 20,2 | 60,7 | 3200 |
ATLETA | 21,3 | 54,8 | 3100 |
ATLETA | 19,3 | 49,6 | 2800 |
ATLETA | 21,1 | 52,3 | 3300 |
SEMIAT | 22,4 | 14,9 | 2600 |
SEMIAT | 21,9 | 17,8 | 2700 |
SEMIAT | 23,8 | 18,6 | 3200 |
SEMIAT | 24,1 | 15,1 | 3300 |
SEDENT | 27,3 | 2,5 | 2700 |
SEDENT | 23,4 | 4,3 | 2300 |
SEDENT | 25,2 | 2,3 | 2600 |
SEDENT | 26,4 | 2,6 | 3200 |
PROFES | 26,2 | 4,1 | 2600 |
PROFES | 24,2 | 2,1 | 2700 |
PROFES | 25,4 | 1,9 | 2650 |
PROFES | 24,9 | 2,1 | 2700 |
Media Aritmética das Categorias
Categoria | IMC | Corrida | Kcal |
ATLETA | 20,48 | 54,35 | 3100 |
PROFES | 25,18 | 2,55 | 2663 |
SEDENT | 25,58 | 2,925 | 2700 |
SEMIAT | 23,05 | 16,6 | 2950 |
ANOVA e Tukey - Saída Gráfica
(Melhor Robust ANOVA)
Programa SAS para ANOVA e Tukey:
Num próximo exemplo substituir somente o que está em fonte vermelha
data imc_dat;
input cat $ imc corr kcal;
cards;
AT 20.2 60.7 3200
AT 21.3 54.8 3100
AT 19.3 49.6 2800
AT 21.1 52.3 3300
SEM 22.4 14.9 2600
SEM 21.9 17.8 2700
SEM 23.8 18.6 3200
SEM 24.1 15.1 3300
SE 27.3 2.5 2700
SE 23.4 4.3 2300
SE 25.2 2.3 2600
SE 26.4 2.6 3200
PR 26.2 4.1 2600
PR 24.2 2.1 2700
PR 25.4 1.9 2650
;
proc anova;
class cat;
model imc corr kcal = cat;
means cat / tukey lines;
run;
Programa SAS para Fazer Machine Learning Não Supervisionado: Cluster Analysis
Num próximo exemplo substituir somente o que está em fonte vermelha
data pessoas;
input Categor $ IMC Corrida Kcal;
cards;
ATLETA 20.48 54.35 3100
PROFES 25.18 2.55 2663
SEDENT 25.58 2.925 2700
SEMIAT 23.05 16.6 2950
;
proc cluster data=pessoas outtree = arvore method = average;
var IMC Corrida Kcal;
id Categor;
run;
PROC TREE DATA = arvore;
RUN;
Resultado Gráfico de Cluster Analysis - Slides
Programa SAS para Fazer MANOVA
Para testar se as distancias multivariadas são significativas estatisticamente
Num próximo exemplo substituir somente o que está em fonte vermelha
data imc_dat;
input cat $ imc corr kcal;
cards;
AT 20.2 60.7 3200
AT 21.3 54.8 3100
AT 19.3 49.6 2800
AT 21.1 52.3 3300
SEM 22.4 14.9 2600
SEM 21.9 17.8 2700
SEM 23.8 18.6 3200
SEM 24.1 15.1 3300
SE 27.3 2.5 2700
SE 23.4 4.3 2300
SE 25.2 2.3 2600
SE 26.4 2.6 3200
PR 26.2 4.1 2600
PR 24.2 2.1 2700
PR 25.4 1.9 2650
;
proc print;
run;
proc glm;
class cat;
model imc corr kcal = cat;
contrast " Atl e Semiat Vs Seden e Prof" cat 1 -1 -1 1;
contrast " Professor Vs Sedentario" cat 0 1 -1 0;
contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
manova h=_all_ / printe printh;
contrast " Atl e Semiat Vs Seden e Prof" cat 1 -1 -1 1;
contrast " Professor Vs Sedentario" cat 0 1 -1 0;
contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
run;
Conclusão:
· Não existe diferença estatisticamente significativa entre as categorias Professor e Sedentário ( p < 0,99 ). Assim os professores são sedentários em função das três variáveis preditoras estudadas (IMC, Corrida/Caminhada e Quilocalorias ingeridas por dia)
· Existe diferença significativa entre os dois grupos (clusters), o primeiro integrado pelas categorias Professor e Sedentário e o Segundo integrado pelas categorias Atleta e Semiatleta ( p < 0,0001 ).
· Existe diferença estatisticamente significativa entre as categorias do grupo dois, Atleta e Semiatleta ( p < 0,0001).
contrast " Atl e Semiat Vs Seden e Prof" cat 1 -1 -1 1;
Pega a ordem alfabetica dos niveis dos fatores para os coeficientes
dos contrastes
Se colocar o contraste depois do comando MANOVA faz os contrastes univariados
tambem
Correlação Residual MANOVA:
Partial Correlation Coefficients from the Error SSCP Matrix / Prob > |r| | |||
DF = 11 | imc | corr | kcal |
imc | 1.000000 | 0.017729 0.9564 | 0.697770 0.0116 |
corr | 0.017729 0.9564 | 1.000000 | 0.132496 0.6814 |
kcal | 0.697770 0.0116 | 0.132496 0.6814 |
Outro Exemplo de Contrastes, Ordem Alfabética:
- Análise Multivariada Exemplos:
var imc corr kcal; ==> Kruskal Wallis
Machine Learning Não Supervisionado
- Pesquisar Data:
- Mining
- Crunching
- Analysis
e Cluster Analysis
Esse tipo de abordagem é utilizado nas áreas de Inteligencia de Negócios (BI), Sistemas de Informação ( Data Mining, Data Crunching, Decision Support Systems-DSS e Big-Small Data) e Pesquisa Cientifica
Aqui apresentamos o nosso objetivo, elaborarmos um dendrograma, que é a representação gráfica da saída do procedimento Cluster Analysis do Programa SAS:
Tabela Dinâmica
em Excel
( Pivot Table )
Podemos ver nesse exemplo que temos vários representantes de cada categoria, são exatamente 4 (ou quatro repetições de cada categoria)
Cluster Analysis do SAS. Como fazer para trocar
somatória para medias?:
Veja que os dados são de soma, um IMC de 100, praticamente não existe ( 81,9 ; 100,7 ...)
· Pressionar o botão direito do mouse
· Escolher a opção: “Configurações do Campo de Valor”
Veja que agora temos Média de ICM para cada categoria.
Nenhum comentário:
Postar um comentário