domingo, 23 de agosto de 2020

Tomada de Decisão Utilizando Inferência Estatística Indutiva

 





Tomada de Decisão Utilizando Inferência Estatística Indutiva – Endossada com Margem de Erro e Margem de Confiança


Base para entender:


---> Ciência de Dados ou Bioinformatica

--> Machine Learning (parte muito importante da IA, que faz parte da Ciência de Dados e da Bioinformatica)




Videoaula 1






Videoaula 2






Livro Básico - Infer. Estat. Indutiva - Download



Exemplo de Aplicação de Inferência Estatística Indutiva e Inferência por Machine Learning - Covid-19




Onde fala Machine Learnig podemos colocar Ciência de Dados, seria mais correto.

Gabriel






Outros Exemplos em Biologia






Mais Exemplos em Biologia













Exemplo Prático para Utilizar Macro em Excel (Excel Avançado) em Biologia








- Exemplo: Arquivo do Excel para Download:

           







Aparentemente há diferenças, as medias aritméticas são diferentes, umas maiores ou menores que as outras. Por exemplo o DBO da Área Urbana é 9,7 mg/l e da Área Semiurbana 7,2 mg/l. Essa informação é suficiente para tomar a decisão de falar que são diferentes?

Não, essa diferença de medias aritméticas é matemática, 


não estatística, para falar que são diferentes devemos


 aplicar um teste de hipótese estatístico (que faz parte da


 Inferência Estatística Indutiva), por exemplo o Teste T de


 Student (se os dados tiverem distribuição Normal) ou U de


 Mann–Whitney (Estatística Robusta) se tivermos problemas


 de normalidade, heterocedasticidade ou presença de 


outliers (dados fora de contexto), o se simplesmente não


 quisermos ou podermos, testar todas essas pressuposições.


Esses testes nos fornecerão uma Margem de Erro (probabilidade) e uma Margem de Confiança, para tomarmos a decisão da melhor maneira possível, por exemplo em ciência (teses, papers, congressos. Etc.) não são aceitas as tomadas de decisão sem os endossos probabilísticos. Tambem é assim na área de gestão, desde a segunda gerra mundial (E. Deming), em EUA e Japão.


OK, vamos fazer a primeira analise desses dados no Excel, utilizando macros analíticas (programas dentro do programa Excel). Uma dessas macros é Teste T de Student para Duas Amostras Independente com Variâncias Desconhecidas.

O teste T é a ferramenta mais importante para a tomada de decisão em gestão, inteligência e certificação internacional da qualidade.
Na área de pesquisa a principal ferramenta de tomada de decisão é ANOVA. ANOVA é uma generalização do Teste T, quando existem mais do que dois níveis do fator tratamentos, o Teste T é somente para dois níveis.



Em primeira instancia devemos ativar as macros analíticas do Excel, normalmente compramos o Excel e utilizamos somente uma parte dele, o mais frequente é não estarem ativadas (como comprar um apartamento de 3 quartos e utilizar somente um ou dois), nos departamentos, laboratóriosempresas, etc.





·      Ho: Hipótese de Nulidade ou de Igualdade
o    DBO Reg. Urbana = DBO Reg. Semiurbana
o    DBO Reg. Urbana - DBO Reg. Semiurbana = 0
o     
·      H1:  Hipótese de Alternativa
o    H1a: Uni caudal: 
§  DBO Reg. Urbana > DBO Reg. Semiurbana
o    H1b: Bicaudal:
§  DBO Reg. Urbana    ≠ DBO Reg. Semiur.
·         H1a: Uni caudal - Demanda Informação Confiável Previa
·         H1b: Bicaudal - Sem Informação Previa

Teste-t: duas amostras presumindo variâncias diferentes
DBO - Urbana
DBO Semiurbana
Média
9,666667
7,166666667
Variância
2,333333
1,583333333
Observações
3
3
Hipótese da diferença de média
0
gl
4
Stat t
2,187975
P(T<=t) uni-caudal
0,046952
Margem de Erro
t crítico uni-caudal
2,131847
P(T<=t) bi-caudal
0,093904
Margem de Erro
t crítico bi-caudal
2,776445


Margem de Erro Uni caudal =4,7 %      
  • Demanda Informação Previa Confiável
    • Publicação (Academia)    
    •  Sumario Executivo (Empresa Privada)                                     

                                                                                                         
Margem de Erro Bi caudal = 9,4   %       

  • Não Demanda Informação Previa Confiável                

Resultados e Discussão (de um documento cientifico – Iniciação, TCC, Mestrado, Doutorado, Pós-doutorado, publicação):
Com Informação Previa Confiável:
A média aritmética para DBO dos ribeirões da região urbana (9,7 mg/l) foi maior significativamente ( p <  0,04695) do que media dos ribeirões da região semiurbana ( 7,2 mg/l).
Sem Informação Previa Confiável:
Não foram conseguidos argumentos suficientes para se rejeitar a hipótese de igualdade ( p < 0,093904151)

Sumario Executivo (Empresa):
Com Informação Previa Confiável:
O DBO da área urbana (9,7 ) é maior do que o DBO da área semiurbana (7,2) com 95,3% de confiança;

Sem Informação Previa Confiável:
Não existe evidencia significativa de diferença na quantidade de DBO nas duas situações analisadas (margem de confiança insuficiente 91%)

Nenhum comentário:

Postar um comentário