Dinâmica de IA Indutiva Supervisionada para Classificação - Ratos - Weka
Arquivo Hantavirus/Ratos para download:
Dinâmica de IA Indutiva Supervisionada para Classificação - Ratos - Weka
Arquivo Hantavirus/Ratos para download:
Parcerias Futuras - Posibilidades
https://sites.google.com/usp.br/ia-cd-esalq-cena
Horários de Consulta
Horários de Consulta: Sextas das 21:30 as 22:30 e sábados das 19 às 20 horas. No link:
https://meet.google.com/xgf-jman-pyv
Whatsapp do Gabriel : 019-988-627-438
Pauta:
-
Prova – Prazos – Compensação no Verão ( presença, exercícios, seminário em inglês,
e prova);
-
Data de Prova e Criterio de Avaliação
- Datas de prova 28/11 ou 5/12, se não puder marcamos individual por Internet.
- Marcarmos prova, peso 2 (Ex. 4, Semin. 2 Prticipa. 2)
Ou se não participação mínima: Prova 3, Ex. 4,5 Semin. 2,5
Calculo as duas medias e dou a maior.
- Se entrega Ex. e Semin. está aprovado. Até dia 3/12.
- Se falta frequência, dezembro, janeiro e fevereiro HC. 1 HC = 0,5 presença
Se não contentes com nota prova em 15 de fevereiro
- Retifico nota e frequência em final de fevereiro
Parcerias Futuras - Posibilidades
https://sites.google.com/usp.br/ia-cd-esalq-cena
Dinâmica de IA Indutiva Supervisionada para Classificação - Ratos - Weka
Arquivo Hantavirus/Ratos para download:
- Laboratório de IA para Ecologia e Biologia
- Iniciaremos o protótipo a partir de janeiro, presencial e por
Internet
- Temos 4 trabalhos de pós-graduação em analise (PPGI-Ecologia Aplicada
- Programa de pós-graduação Inter Unidades ESALQ-CENA) e um de graduação
- IA+: Projeto de pesquisa do CNPq (eu sou vice coordenador)]
- Oriento no PPGI-EA pós-graduação
- Posso apresentar outros orientadores
- Posso ser coorientador
Sim, com
certeza! Vamos explicar o conceito de Inteligência Artificial Indutiva
Supervisionada para Classificação ou Machine Learning de uma forma simples
e didática.
🤖 O Conceito Principal
Imagine
que você está ensinando uma criança a distinguir entre fotos de gatos e cachorros.
1. Indutiva: O
aprendizado é por indução, ou seja, você mostra exemplos e a
criança (ou o algoritmo) aprende uma regra geral a partir desses
exemplos. Ela não recebe a regra pronta ("gatos têm orelhas pontudas e
cachorros não"), mas sim induz a regra observando muitas fotos.
2. Supervisionada: Você
atua como o supervisor. Para cada foto que mostra, você diz a resposta
correta (o rótulo): "Esta é um Gato," "Este é
um Cachorro."
o Dados
Rotulados: Os dados
que você usa para treinar o sistema (as fotos) são rotulados, ou seja,
cada entrada (foto) tem sua saída desejada (a classe: "Gato" ou
"Cachorro") já definida.
3. Classificação: O
objetivo final é classificar um novo item em uma de duas ou mais categorias
discretas (classes). No nosso exemplo, as classes são "Gato" e
"Cachorro".
o O que o
algoritmo faz: Ele aprende a relação entre as características da foto (cores, formas,
texturas) e o rótulo ("Gato" ou "Cachorro").
🧠 Como Funciona o Processo
O
processo de aprendizado supervisionado para classificação é dividido em duas
fases principais: Treinamento e Predição.
1. Fase de Treinamento (O Aprendizado)
2. Fase de Predição (O Teste)
🎯 Resumo Didático
|
Componente |
Função |
Exemplo
Simples |
|
Inteligência
Artificial |
Campo
amplo que faz máquinas imitarem a inteligência humana. |
O
objetivo de fazer o computador "ver" e "identificar". |
|
Machine
Learning |
Subconjunto
da IA que permite que o sistema aprenda com dados, sem programação explícita. |
O
método usado para que o aprendizado aconteça. |
|
Supervisionado |
O
aprendizado usa dados que já têm a resposta correta (rótulos). |
Mostrar
fotos de animais dizendo se é Gato ou Cachorro. |
|
Indutivo |
A regra
de classificação é inferida ou induzida a partir dos exemplos. |
O
algoritmo descobre por conta própria as características que definem
"Gato" e "Cachorro". |
|
Classificação |
O
objetivo de prever uma categoria discreta. |
Prever
se um email é SPAM ou NÃO-SPAM. |
Em essência: O aprendizado supervisionado para classificação é
como ensinar por exemplos rotulados (supervisão) para que a máquina
possa induzir regras e separar novos itens em caixas
(classificação).
Pauta:
- IAI S para Classificação
- Data da Prova ==> 10/12 --> 19:30 confirmar pelo blog
hoje ou segunda
- Enviou exercícios e seminário e está
aprovada/o
- Melhorar nota e frequência, horários de
consulta continuam nas férias e prova fila de fevereiro
Dinâmica de IA Indutiva Supervisionada para Classificação - Ratos - Weka
Arquivo Hantavirus/Ratos para download:
Exercícios e Seminário
Ilustração, modelo de exercício pratico
Fazer individualmente ou em duplas os exercicios praticos.
Exercicios teoricos individuais.
Seminario individual.
Whatsapp do Gabriel: 019-988-627-438
Enviar os exercícios e seminario para o e-mail da disciplina.
E-Mail da Disciplina:
biologia.inteligente.10@gmail.com
Colocar no Assunto do e-mail o Nome Completo tipo de exercício (pratico ou teórico) número do exercício ou seminário.
Seminário
Escolha um assunto entre os exercícios teóricos e práticos e elabore um seminário com 14 slides, em português, inglês ou espanhol. DL: 10/11. Enviar o seminário no e-mail de exercícios com seu nome, trabalho individual.
Exercícios Práticos podem ser feitos em dois ou três pessoas.
Exercício Teórico 1
Elabore 7 slides sobre os assuntos:
- I Artificial: conceito, tipos, utilização
- I Artificial na Biologia e Ecologia
- Robótica
- Bots
De 4 a 6 slides.
Prazo: 17/10
Exercício Teórico 2
- Machine learning. Conceito, tipos
- Matriz de Confusão. Utilidade
- Exemplos práticos de aplicação de Machine learning
- De 8 a 12 slides.
DL: 24/10
Exercício Teórico 3
- Ciência de Dados, conceito, tipos e utilidade.
- Estatística Robusta Uni e Multivariada
- De 8 a 12 slides.
DL: 17/10
Exercício Teórico 4
- Gestão Sistêmica de Organizações: ONG, Laboratório, Projeto de Pesquisa ou Extensão, Instituto de Pesquisa, Empresa etc. Quais são (definição) e quem é responsável numa organização da gestão: Estratégica, Tática ou Operacional.
Vocês têm a melhor formação para gestão sistêmica, estudam os sistemas mais complexos, ecossistemas, fisiologia e anatomia de animais e plantas etc. DL: 24/10
Exercício Teórico 5
- Enumere e explique os parâmetros que são obtidos a partir da matriz de confusão na IAI Supervisionada para Classificação. Apresente um exemplo. De 8 a 12 slides.
DL: 24/10
Exercício Teórico 6
Como o Biólogo pode se beneficiar da IA profissionalmente, 6 slides. DL: 31/10
Exercícios Praticos
Exercício Prático 1 – Resolva no Excel ou LO Calc. A distancia afeta a concertracao de As no biomonitor? Prazo: 29/8/2025
Distan. | As |
(m) | (mg/kg) |
100 | 0,98?? |
200 | 0,95??? |
300 | 0,85 |
400 | 0,86 |
500 | 0,59 |
600 | 0,45 |
700 | 0,32 |
800 | 0,15 |
900 | 0,11 |
1000 | 0,09 |
Exercício Pratico 2. Resolva no Excel ou LO Calc. A distancia afeta a concertracao de As no biomonitor? Agora com o outlier (dado fora de contexto, atipico). Prazo: 29/8/2025.
Distan. | As |
(m) | (mg/kg) |
100 | 0,98?? |
200 | 0,95??? |
300 | 0,85 |
400 | 0,86 |
500 | 0,59 |
600 | 0,45 |
700 | 0,32 |
800 | 0,15 |
900 | 0,11 |
1000 | 0,09 |
1100 | 2,99 |
Outlier
Exercício Pratico 3 - Resolva com Regressão Robusta em SAS. A distancia afeta a concertracao de As no biomonitor? Agora com o outlier (dado fora de contexto, atipico). Prazo: 5/9/2025.
Distan. | As |
(m) | (mg/kg) |
100 | 0,98?? |
200 | 0,95??? |
300 | 0,85 |
400 | 0,86 |
500 | 0,59 |
600 | 0,45 |
700 | 0,32 |
800 | 0,15 |
900 | 0,11 |
1000 | 0,09 |
1100 | 2,99 |
Outlier
Arquivo de Resultados e Discussão
Outro arquivo com Resultados e Discussão
Exercício Pratico 4. Regressão Multipla em Excel ou LOffice Calc, SAS (proc reg e robustreg) e Weka. Dead Line 10/9.
Resultado do Ex. 4
Exercício Pratico 5 - aplicar IAIN para Redução de Dimensão no Exercício Pratico 4. DL: 19/9/2025
data biodiv;
input DBO ICobV ICArb Bcont Dis_Pl IBD_A;
datalines;
1.604 89 60 11 9 90.??
0.385 90 61 10 8.9 91
0.216 91 62 9 9.1 92
0.303 90 59 10 8.8 89
1.961 20 12 81 0.2 20
0.782 21 14 79 0.3 22
0.57 22 15 78 0.25 23
2.187 22 12 77 0.2 24
0.764 59 35 41 6 60
0.273 60 32 40 6.5 61
1.883 64 33 38 5.8 63
0.581 62 32 37 5.6 62
0.18 79 50 21 8.2 80
0.007 80 49 20 7.8 79
2.028 80 48 18 8.2 81
2.431 79 47 21 7.7 78
0.216 92 61 9.1 9.5 23
;
proc print;
run;
proc prinqual plots=(MDPref);
transform identity(DBO ICobV ICArb Bcont Dis_Pl IBD_A);
ods select MDPrefPlot;
run;
Ex. Pratico 6 - Procurar um banco de dados na Internet para aplicar Regressão Robusta e IA I Não S para Redução de Dimensão PCA-Biplot. DL: 3/10
Ex. Pratico 7 - IAI Não Supervisionada para Agrupamentos e Distâncias Multivariados. DL: 10/10
Inteligência artificial indutiva não supervisionada (Machine Learning) para classificação - Cluster analysis
Cidade | Regiao | Cid_reg | Habitantes | IDH | Rend_Cap | Cap_Empr | Teci_Emr | Gov_Descn | Org_Prod | Ins_Compet | Edu_Empr |
Piracicaba | SE | Pir_SE | 439 | 0,785 | 1,14 | 0,54 | 0,695 | 0,796 | 0,598 | 0,761 | 0,004 |
Sao_Car | SE | SC_SE | 252 | 0,805 | 1,08 | 0,686 | 0,653 | 0,812 | 0,564 | 0,788 | 0,002 |
Sao_Jose | SE | SJ_SE | 461 | 0,797 | 1,17 | 0,613 | 0,73 | 0,648 | 0,597 | 0,769 | 0,011 |
Mon_Clar | SE | MC_SE | 409 | 0,77 | 0,65 | 0,481 | 0,651 | 0,696 | 0,549 | 0,666 | 0,124 |
Rondono | CO | Ron_CO | 232 | 0,755 | 0,84 | 0,452 | 0,509 | 0,626 | 0,567 | 0,651 | 0 |
Anápolis | CO | Aná_CO | 387 | 0,737 | 0,79 | 0,481 | 0,645 | 0,695 | 0,562 | 0,708 | 0 |
Camp_Gra | NE | CG_NE | 410 | 0,72 | 0,63 | 0,458 | 0,565 | 0,683 | 0,571 | 0,59 | 0,584 |
Petroli | NE | Pet_NE | 349 | 0,697 | 0,61 | 0,419 | 0,43 | 0,678 | 0,528 | 0,57 | 0,009 |
Rio_Bran | Norte | RB_Norte | 407 | 0,727 | 0,74 | 0,342 | 0,47 | 0,663 | 0,486 | 0,503 | 0,0009 |
Boa_Vista | Norte | BV_Norte | 399 | 0,752 | 0,79 | 0,338 | 0,458 | 0,538 | 0,502 | 0,585 | 0,082 |
Maringa | S | Mar_S | 424 | 0,808 | 1,2 | 0,652 | 0,753 | 0,791 | 0,611 | 0,765 | 0,01 |
Cax_Sul | S | CS_S | 347 | 0,75 | 0,95 | 0,446 | 0,715 | 0,654 | 0,559 | 0,715 | 0,046 |
| |
Inteligência artificial indutiva (Machine Learning) não supervisionada para classificação - Cluster analysis
Cluster e Dendrograma de todas as cidades, programa SAS:
data cidades;
/* variaveis foram semaciondas por significancia com Robust Anova */
input Cid_reg $ IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;
cards;
Pir_SE 0.785 1.14 0.54 0.695 0.598 0.761??
SC_SE 0.805 1.08 0.686 0.653 0.564 0.788
SJ_SE 0.797 1.17 0.613 0.73 0.597 0.769
MC_SE 0.77 0.65 0.481 0.651 0.549 0.666
Ron_CO 0.755 0.84 0.452 0.509 0.567 0.651
Ana_CO 0.737 0.79 0.481 0.645 0.562 0.708
CG_NE 0.72 0.63 0.458 0.565 0.571 0.59
Pet_NE 0.697 0.61 0.419 0.43 0.528 0.57
RB_Norte 0.727 0.74 0.342 0.47 0.486 0.503
BV_Norte 0.752 0.79 0.338 0.458 0.502 0.585
Mar_S 0.808 1.2 0.652 0.753 0.611 0.765
CS_S 0.75 0.95 0.446 0.715 0.559 0.715
;
proc print;
run;
proc cluster data=cidades outtree = arvore method = average;
var IDH Rend_Cap Cap_Empr Teci_Emr Org_Prod Ins_Comp;
id Cid_reg;
run;
PROC TREE DATA = arvore;
RUN;
Ex. Pratico 8 - IAI Não Supervisionada para Agrupamentos e Distâncias Multivariados, seleção de variáveis preditoras, equalização e detecção de outliers. ANOVA, RobustANOVA, Box and Wisker Plot. DL: 23/10
Relatorio para download:
Dados em Planilha Eletrônica:
Categ | IMC | Movim | Kcal |
AT | 20,2 | 53,7 | 28?? |
AT | 21,3 | 54,8 | 2700 |
AT | 19,3 | 49,6 | 2800 |
AT | 21,1 | 52,3 | 2900 |
AT | 24,1 | 30,3 | 2700 |
SEM | 22,4 | 14,9 | 2600 |
SEM | 21,9 | 17,8 | 2700 |
SEM | 23,8 | 18,6 | 3200 |
SEM | 24,1 | 15,1 | 3300 |
SE | 27,3 | 2,5 | 2700 |
SE | 23,4 | 4,3 | 2300 |
SE | 25,2 | 2,3 | 2600 |
SE | 26,4 | 2,6 | 3200 |
PR | 26,2 | 4,1 | 2600 |
PR | 24,2 | 2,1 | 2700 |
PR | 25,4 | 1,9 | 2650 |
PR | 21,1 | 20 | 2650 |
PR | 25,2 | 3,1 | 2650 |
PR | 24,8 | 2 | 2675 |