segunda-feira, 7 de agosto de 2023

Dinâmica IA Indutiva Não Supervisionada para Classificação - Linguagem SAS

 Dinâmica IA Indutiva Não Supervisionada para Classificação - Linguagem SAS


Programa SAS - Rodaremos esse programa numa versão gratuita muito poderosa na Nuvem.

 

A linguagem de menor custo de aprendizagem para Ciência de Dados e Inteligência Artificial, também a mais respeitada e valorizada. 

 



Codificação para rodar IA Indutiva Não Supervisionada para Classificação em Linguagem SAS

data  pessoas;
input cat $ imc corr kcal;
cards;

AT 20.5 54.4 3100

PR 25.3 2.7 2650

SE 25.6 2.9 2700

SEM 23.1 16.6 2950

;
proc cluster data=pessoas outtree = arvore method = average;
var imc corr kcal;
id cat;
run;
PROC TREE DATA = arvore;
RUN;








 ML Não Supervisionado para Clasifiação - Cluster Analysis - ANOVA and MANOVA


UML - Unsupervised Machine Learning: Machine Learning Não Supervisionado


Dados:

    - Categoria: Variável Classificatória

    - IMC: Primeira Variável Preditora - Indice de Massa Corporal

    - Movim: Segunda Variável Preditora - Movimentação caminhando ou correndo por semana (Km)

    - KCal: Quilocalorias consumidas por dia


Categ

IMC

Movim

KCal

ATL

20,?

60,?

32??

ATL

21,3

54,8

3100

ATL

19,3

49,6

2800

ATL

21,1

52,3

3300

SEMI

22,4

14,9

2600

SEMI

21,9

17,8

2700

SEMI

23,8

18,6

3200

SEMI

24,1

15,1

3300

SEDE

27,3

2,5

2700

SEDE

23,4

4,3

2300

SEDE

25,2

2,3

2600

SEDE

26,4

2,6

3200

PROF

26,2

4,1

2600

PROF

24,2

2,1

2700

PROF

25,4

1,9

2650


Obter as Médias por Data Crunching - Pivot Table


Categor

IMC

Movim

Kcal

ATL

20,65

54,4

3114,75

PROF

25,27

2,7

2650

SEDE

25,58

2,925

2700

SEMI

23,05

16,6

2950




\t para trocar o tab por espaço em Linux

    - No Editor

Caractere de Tabulação em Word (Windows)



Obtaining Cluster Analysis

data  People;
input Categ $ IMC Movim Kcal;
cards;

DADOS TABELA DINÁMICA

;
proc cluster outtree = Dendrog method = average;
var IMC Movim Kcal;
id Categ;
run;
PROC TREE DATA = Dendrog;

RUN; 







Program to do ANOVA


data People;

/* BMI: body mass index --> Índice de M. Corporal = Peso / (Altura * Altura)
     Movm: Movement (Km por semana)
     KCal : Kilocalories (ingeridas por dia)
     ATL: Athletes
     SEMI: Semi-athletes
     SEDE: Sedentary
     PROF: Professor

*/
input Categ $ IMC Movim Kcal;
cards;
ATL 20.2 60.7 3200
ATL 21.3 54.8 3100
ATL 19.3 49.6 2800
ATL 21.1 52.3 3300
SEMI 22.4 14.9 2600
SEMI 21.9 17.8 2700
SEMI 23.8 18.6 3200
SEMI 24.1 15.1 3300
SEDE  27.3 2.5 2700
SEDE 23.4 4.3 2300
SEDE  25.2 2.3 2600
SEDE  26.4 2.6 3200
PROF 26.2 4.1 2600
PROF 24.2 2.1 2700
PROF 25.4 1.9 2650
;
Proc ANOVA;
     Class Categ;
      Model IMC Movim Kcal = Categ;
     Means Categ / Duncan Lines;
Run;




Arithmetic Averages of Categories

Categ IMC Movim Kcal

AT 20.5 54.4 3100

PR 25.3 2.7 2650

SE 25.6 2.9 2700

SEM 23.1 16.6 2950













Program to do MANOVA

data imc_dat;

input cat $ imc corr kcal;
cards;
ATL 20.2 60.7 3200
ATL 21.3 54.8 3100
ATL 19.3 49.6 2800
ATL 21.1 52.3 3300
SEMI 22.4 14.9 2600
SEMI 21.9 17.8 2700
SEMI 23.8 18.6 3200
SEMI 24.1 15.1 3300
SEDE  27.3 2.5 2700
SEDE 23.4 4.3 2300
SEDE  25.2 2.3 2600
SEDE  26.4 2.6 3200
PROF 26.2 4.1 2600
PROF 24.2 2.1 2700
PROF 25.4 1.9 2650
;
proc print;
run;
proc glm;
 class cat;
 model imc corr kcal  = cat;
 contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;
 contrast " Professor Vs Sedentario" cat  0 1 -1 0;
 contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
 manova h=_all_ / printe printh;
 contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;
 contrast " Professor Vs Sedentario" cat  0 1 -1 0;
 contrast " Atleta Vs Semiatleta" cat -1 0 0 1;
run;

Elaboração de Contraste:



AT PR  SE SEM
1  -1 -1   1 Atleta e Semiatleta Vs Professor e Sedentario
0   1 -1   0 Professor Vs Sedentario
1   0  0  -1 Atleta Vs Semiatleta
3  -1 -1  -1  Atleta Vs Outras Categorias

Nenhum comentário:

Postar um comentário