Dinâmica IA Indutiva Não Supervisionada para Classificação - Linguagem SAS
Programa SAS - Rodaremos esse programa numa versão gratuita muito poderosa na Nuvem.
A linguagem de menor custo de aprendizagem para Ciência de Dados e Inteligência Artificial, também a mais respeitada e valorizada.
Codificação para rodar IA Indutiva Não Supervisionada para Classificação em Linguagem SAS
data pessoas;
input cat $ imc corr kcal;
cards;
AT 20.5 54.4 3100
PR 25.3 2.7 2650
SE 25.6 2.9 2700
SEM 23.1 16.6 2950
;
proc cluster data=pessoas outtree = arvore method = average;
var imc corr kcal;
id cat;
run;
PROC TREE DATA = arvore;
RUN;
ML Não Supervisionado para Clasifiação - Cluster Analysis - ANOVA and MANOVA
UML - Unsupervised Machine Learning: Machine Learning Não Supervisionado
Dados:
- Categoria: Variável Classificatória
- IMC: Primeira Variável Preditora - Indice de Massa Corporal
- Movim: Segunda Variável Preditora - Movimentação caminhando ou correndo por semana (Km)
- KCal: Quilocalorias consumidas por dia
Categ | IMC | Movim | KCal |
ATL | 20,? | 60,? | 32?? |
ATL | 21,3 | 54,8 | 3100 |
ATL | 19,3 | 49,6 | 2800 |
ATL | 21,1 | 52,3 | 3300 |
SEMI | 22,4 | 14,9 | 2600 |
SEMI | 21,9 | 17,8 | 2700 |
SEMI | 23,8 | 18,6 | 3200 |
SEMI | 24,1 | 15,1 | 3300 |
SEDE | 27,3 | 2,5 | 2700 |
SEDE | 23,4 | 4,3 | 2300 |
SEDE | 25,2 | 2,3 | 2600 |
SEDE | 26,4 | 2,6 | 3200 |
PROF | 26,2 | 4,1 | 2600 |
PROF | 24,2 | 2,1 | 2700 |
PROF | 25,4 | 1,9 | 2650 |
Obter as Médias por Data Crunching - Pivot Table
Categor | IMC | Movim | Kcal |
ATL | 20,65 | 54,4 | 3114,75 |
PROF | 25,27 | 2,7 | 2650 |
SEDE | 25,58 | 2,925 | 2700 |
SEMI | 23,05 | 16,6 | 2950 |
\t para trocar o tab por espaço em Linux
- No Editor
Caractere de Tabulação em Word (Windows)
Obtaining Cluster Analysis
data People;
input Categ $ IMC Movim Kcal;
cards;
;
proc cluster outtree = Dendrog method = average;
var IMC Movim Kcal;
id Categ;
run;
PROC TREE DATA = Dendrog;
RUN;
Program to do ANOVA
data People;
/* BMI: body mass index --> Índice de M. Corporal = Peso / (Altura * Altura)
Movm: Movement (Km por semana)
KCal : Kilocalories (ingeridas por dia)
ATL: Athletes
SEMI: Semi-athletes
SEDE: Sedentary
PROF: Professor
*/
input Categ $ IMC Movim Kcal;
cards;
ATL 20.2 60.7 3200
ATL 21.3 54.8 3100
ATL 19.3 49.6 2800
ATL 21.1 52.3 3300
SEMI 22.4 14.9 2600
SEMI 21.9 17.8 2700
SEMI 23.8 18.6 3200
SEMI 24.1 15.1 3300
SEDE 27.3 2.5 2700
SEDE 23.4 4.3 2300
SEDE 25.2 2.3 2600
SEDE 26.4 2.6 3200
PROF 26.2 4.1 2600
PROF 24.2 2.1 2700
PROF 25.4 1.9 2650
;
Proc ANOVA;
Class Categ;
Model IMC Movim Kcal = Categ;
Means Categ / Duncan Lines;
Run;
Arithmetic Averages of Categories
Categ IMC Movim Kcal
AT 20.5 54.4 3100
PR 25.3 2.7 2650
SE 25.6 2.9 2700
SEM 23.1 16.6 2950
Program to do MANOVA
data imc_dat;
input cat $ imc corr kcal;
cards;
ATL 20.2 60.7 3200
ATL 21.3 54.8 3100
ATL 19.3 49.6 2800
ATL 21.1 52.3 3300
SEMI 22.4 14.9 2600
SEMI 21.9 17.8 2700
SEMI 23.8 18.6 3200
SEMI 24.1 15.1 3300
SEDE 27.3 2.5 2700
SEDE 23.4 4.3 2300
SEDE 25.2 2.3 2600
SEDE 26.4 2.6 3200
PROF 26.2 4.1 2600
PROF 24.2 2.1 2700
PROF 25.4 1.9 2650
;
proc print;
run;
proc glm;
class cat;
model imc corr kcal = cat;
contrast " Atl e Semiat Vs Seden e Prof" cat 1 -1 -1 1;
contrast " Professor Vs Sedentario" cat 0 1 -1 0;
contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
manova h=_all_ / printe printh;
contrast " Atl e Semiat Vs Seden e Prof" cat 1 -1 -1 1;
contrast " Professor Vs Sedentario" cat 0 1 -1 0;
contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
run;
Elaboração de Contraste:
AT PR SE SEM
1 -1 -1 1 Atleta e Semiatleta Vs Professor e Sedentario
0 1 -1 0 Professor Vs Sedentario
1 0 0 -1 Atleta Vs Semiatleta
3 -1 -1 -1 Atleta Vs Outras Categorias
Nenhum comentário:
Postar um comentário