sábado, 21 de janeiro de 2017

Introdução breve a estatística

Medidas numéricas: dão informação a partir de um número sobre todo o conjunto de dados.
  • Medidas de localização: média, moda, mediana e quantis.
    • Central
      • Média
      • Moda – valor da variável em análise que aparece com maior frequência.
      • Mediana – valor da variável ordenada até ao qual se encontram, pelo menos, 50% dos participantes. Valor central da variável quando os valores de todos os indivíduos estão ordenados por ordem crescente.
o   Não central
      • Quantis e Percentis


  •  Medidas de dispersão: desvio-padrão, amplitude, coeficiente de variação e erro padrão, frequências.
    • Absolutas:
      • Amplitude
      • Variância: Avalia o grau de dispersão das observações em torno da média.
      • Desvio-padrão: raiz quadrada da variância.
        • Baixo desvio padrão – dados tendem a estar próximos da média;
        • Alto - dados estão espalhados.
      • Coeficiente de Variação: comparação do grau de concentração em torno da média de sequências distintas. Muito utilizado para comparação entre amostras.
    • Relativas:
      • Dados não classificados
      • Coeficiente de Variação de Pearson


Medidas de assimetria: avaliam até que ponto a distribuição da variável na amostra em causa é ou não simétrica, tomando como centro da distribuição a média dos valores da variável na amostra.


Medidas de Achatamento ou Curtose: refere-se ao grau de achatamento da curva, o qual está relacionado com a menor (curva mais pontiaguda) ou maior (curva mais achatada) dispersão dos resultados em torno da média da amostra na variável em causa.


Polígono de Frequências: geralmente são usados quando se pretende mostrar mais de uma distribuição ou a classificação cruzada de uma variável quantitativa contínua com uma qualitativa ou quantitativa discreta num mesmo gráfico.
O ponto que tiver mais altura num polígono de frequência representa a maior frequência, ao passo que a área abaixo da curva inclui a totalidade dos dados existentes. Convém lembrar que a frequência é a repetição menor ou maior de uma ocorrência, ou a quantidade de vezes que um processo periódico se repete por unidade de tempo.


 Z teste 1 amostra: estimar a média de uma população e compará-la a um valor alvo ou de referência quando o desvio padrão da população é conhecido. Este teste permite:
Determinar se a média de um grupo é diferente de um valor especificado.
Calcular um intervalo de valores que provavelmente inclui a média de uma população.

Teste Kolmogorov-Smirnov – teste de ajustamento: avaliação da diferença existente entre a função distribuição empírica e os valores da função de distribuição modelo.
·         Dados contínuos e não agrupados.
·         Desconhecidos - Lilliefors

Testes Paramétricos: dimensão das amostras >30 teorema do limite central
·         ANOVA Fatorial
·         ANOVA Medidas Repetidas
·         Teste T Amostras Emparelhadas
·         Teste T Amostras Independentes

Testes Não Paramétricos: + flexíveis e robustos, amostras pequenas
·         Wilcoxon
·         Mann-Whitney
·         Kruskall-Wallis

Teste Levene – Homogeneidade das variâncias
Scheffe's Test ( mais adequado porque as dimensões das amostras são diferentes )
Tukey's Honest Significance Test – Comparação entre pares entre médias de grupos

Regra de Sturges     
Classes= 1+3*log(n) quantas classes vamos fazer
n= número de indivíduos
Amplitude= Vmáx. – Vmin. / nº de classes = x
[1,2; x[  1,2+x

A amplitude interquartil dá mais informações que a amplitude amostral.

Sem comentários:

Enviar um comentário