Como faço para calcular estas estatísticas?

votos
12

Eu estou escrevendo um aplicativo para ajudar a facilitar algumas pesquisas, e parte disso envolve fazer alguns cálculos estatísticos. Agora, os pesquisadores estão usando um programa chamado SPSS . Parte da produção que eles se preocupam com esta aparência:

[Parte

Eles são realmente apenas preocupado com o Fe Sig.valores. Meu problema é que eu não tenho nenhuma experiência em estatísticas, e eu não consigo descobrir o que os testes são chamados, ou como calculá-los.

Eu pensei que o Fvalor pode ser o resultado do teste F , mas depois de seguir os passos indicados na Wikipedia, eu tenho um resultado que era diferente do que SPSSdá.

Publicado 04/08/2008 em 23:56
fonte usuário
Em outras línguas...                            


6 respostas

votos
4

Este site pode ajudá-lo um pouco mais. Também este .

Eu estou trabalhando a partir de uma memória bastante enferrujada de um curso de estatística, mas aqui vai nada:

Quando você está fazendo a análise de variância (ANOVA), você realmente calcular a estatística F como a razão das variações médias quadrados "entre os grupos" e as variações médias quadrados "dentro dos grupos". O segundo link acima parece muito bom para este cálculo.

Isso faz com que a medida estatística F exatamente como poderoso seu modelo é, pois a variância "entre os grupos" é poder explicativo, e "dentro dos grupos" variância é erro aleatório. Alta F implica um modelo altamente significativo.

Como em muitas operações estatísticas, você back-determinar Sig. usando a estatística F. Aqui é onde a sua informação Wikipedia vem em pouco acessível. O que você quer fazer é - usando os graus de liberdade dada a você por SPSS - encontrar o valor P adequado no qual uma tabela F lhe dará a estatística F que você calculou. O valor P quando esta acontece [F (tabela) = F (calculado)] é a significância.

Conceitualmente, um valor de significância menor mostra uma muito forte capacidade de rejeitar a hipótese nula (que para esses fins meios para determinar o seu modelo tem poder explicativo).

Desculpe a quaisquer pessoas de matemática se nada disto é errado. Eu vou ser a verificação de volta para fazer edições !!!

Boa sorte para você. Stats é divertido, apenas talvez não esta parte. =)

Respondeu 05/08/2008 em 00:32
fonte usuário

votos
3

Presumo de sua pergunta que seus colegas de pesquisa deseja automatizar o processo pelo qual certas análises estatísticas são realizadas (ou seja, eles querem conjuntos de dados processo em lote). Você tem duas opções:

1) SPSS é agora programável através de python (a partir da versão 15) - ir para spss.com e procurar python. Você pode escrever scripts python para automatizar análises de dados e extrair valores da chave de tabelas dinâmicas, e depois processar as respostas de qualquer jeito que você gosta. Isto tem a virtude de permitir uma comparação exata entre os resultados de seu script Python e os esforços calculados mão em SPSS dos seus colaboradores. Assim, você não terá que realmente sabe todas as estatísticas para fazer este trabalho (que é uma das principais vantagens)

2) Você poderia fazer isso em R, um ambiente statistics, que provavelmente poderia ser script. Isto tem a desvantagem de que você terá que aprender estatísticas para garantir que você está fazendo isso corretamente.

Respondeu 22/09/2008 em 04:29
fonte usuário

votos
2

Em suma: não faça isso por software existente lado, link / uso. E a resposta de sain_grocen está incorreto. :(

Estes são todos os testes para a importância das estimativas dos parâmetros que são normalmente utilizados em multivariada resposta regressões múltiplas. Estes não seriam coisas simples de fazer fora de um ambiente de programação estatística. Gostaria de sugerir ou recebendo a saída de um programa estatístico pré-existente, ou usar um que você pode ligar e usar esse código.

Tenho medo de que a primeira resposta (sain_grocen de) vai levar você para o caminho errado. Sua explicação é provavelmente de um caso especial de que você está realmente lidando. O anova explicou em seus links é para uma única resposta variate, em um design equilibrado. Estas não são as estatísticas F que você está vendo. Os nomes em sua saída (traço de Pillai, rastreamento de Hotelling, ...) são algumas das versões multivariadas disponíveis. Eles têm distribuições F sob determinados pressupostos. Eu não posso explicar uma pena livros de texto de material aqui, eu aconselho você a começar por olhar para "Análise Multivariada Estatística Aplicada" por Johnson e Wichern

Respondeu 17/09/2008 em 00:17
fonte usuário

votos
2

A estatística é :-) duro. Após um ano de leitura e os livros e papéis da leitura re-e só posso dizer com confiança que eu entendo o básico do básico do mesmo.

Você pode querer investigar bibliotecas prontas para qualquer linguagem de programação que você está usando, porque são muitos gotcha em matemática em geral e estatísticas em particular (arredondamento erros sendo um exemplo óbvio).

Como um exemplo, você poderia dar uma olhada no projeto de P , que é ao mesmo tempo um ambiente interativo e uma biblioteca que pode ser usado a partir de seu código C ++, distribuído sob a GPL (ou seja, se você estiver usando-o apenas internamente e publicar apenas os resultados, você não precisa abrir o seu código).

Respondeu 18/08/2008 em 07:01
fonte usuário

votos
0

Aqui está uma explicação de MANOVA ouptput, a partir de um site muito bom em estatísticas e em SPSS:

Saída com a explicação: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Como e por que fazer MANOVA ou multivariada GLM: (mesmo caminho acima, mas terminando em '/manova.htm')

Escrever software a partir do zero para calcular estas saídas seria tanto demorado e difícil; há muitos problemas numéricos e inversões de matriz para fazer.

Como disse Henry, usar scripts Python, ou R. Eu sugiro trabalhar com alguém que sabe SPSS se scripting. Além disso, a própria SPSS é capaz de exportar as tabelas de saída para arquivos usando algo chamado OMS. Um script dentro SPSS pode fazer isso.

Descubra quem em seu grupo de pesquisa sabe SPSS e trabalhar com eles.

Respondeu 22/12/2009 em 02:56
fonte usuário

votos
0

Você pode explicar mais por si SPSS não é uma solução muito bem para o problema? É que ele gera tabelas dinâmicas como saída que são difíceis de manipular? É o custo do programa?

F-estatísticas podem surgir a partir de qualquer número de testes particulares. A F é apenas uma distribuição (vagamente: uma descrição das "frequências" de grupos de valores), como uma normal (Gauss), ou uniforme. Em geral, eles surgem de relações de variâncias. Opinião: muitos estatísticos (eu incluído), encontrar testes baseados-F a ser instável (jargão: não robusta ).

As estatísticas de saída particulares (traço de Pillai, etc.) sugerem que a análise original é um exemplo MANOVA, que, como outros cartazes descrevem é um complicado e difícil conseguir procedimento correto.

Estou acho também que, com base na MANOVA, eo uso de SPSS, este é um projeto de psicologia ou sociologia ... se não por favor esclarecer. Pode ser que outros modelos, mais simples pode realmente ser mais fácil de entender e mais reproduzível. Consulte o seu grupo de consultoria estatística universidade local, se você tiver um.

Boa sorte!

Respondeu 17/09/2008 em 14:48
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more