O que é Análise de Regressão e como ela é definida?
Psicologia. Principais Definições Começar / / September 28, 2023
Doutor em Psicologia
A análise de regressão é possivelmente a técnica estatística multivariada mais amplamente utilizada para determinar a relação entre uma, ou um grupo, de variáveis independentes e uma dependente para que a primeira possa prever a mudança no segundo-
Quase inatamente, o ser humano tenta dar explicações aos acontecimentos que acontecem naturalmente. no dia a dia, “aquela pessoa fuma porque está estressada”, “comer demais leva ao aumento do peso corporal”; Contudo, sabemos que as explicações que damos a tais acontecimentos nem sempre são corretas. Daniel Kahneman em seu livro “Thinking Fast, Thinking Slow” descreve como, embora as pessoas tendam a fazer uso de todos os elementos cognitivos que possuem, possuem, sempre cometerão erros ao tentar explicar algum acontecimento, o que é completamente normal numa realidade onde coexistem múltiplos fatores. metade. Então, como poderíamos tentar explicar os eventos com a maior precisão possível? Nas ciências sociais e da saúde é possível fazê-lo através da análise de dados; que é definido como um conjunto de procedimentos que são auxiliados por técnicas estatísticas descritivo e inferencial, a fim de extrair informações de uma amostra empírica de dados e desenvolver conclusões. Dentro da análise de dados, a técnica que nos permitirá dar explicações confiáveis aos eventos é uma técnica multivariada chamada Análise de Regressão.
A análise de regressão tem uma série de variantes, como análise de regressão linear, análise de regressão múltipla, regressão logística, análise de mediação, análise de moderação e até modelos de equações estruturais poderiam ser considerados (SEM). Porém, todas essas variantes seguem a mesma lógica operacional, uma ou mais variáveis de entrada, que podem ser conhecidas como preditores, variáveis independentes, variáveis. variáveis explicativas ou antecedentes, prevêem a maior quantidade possível de variância de uma variável de saída, que pode ser conhecida como variável dependente ou simplesmente critério; Quando existe mais de uma Variável Independente, a análise de regressão também determina qual delas tem maior influência na Variável Dependente.
Para entender como ocorrem essas relações, devemos recorrer à seguinte equação, que apresenta um modelo de regressão linear simples:
y = Bqualquer +BEi x e
Onde,
bqualquer = Origem da inclinação
bEi = Grau de inclinação da linha (inclinação)
X = valor VI
e = Resíduos (erro)
Simplificando, esta equação indica o grau em que a presença de um preditor (variável independente) produz uma mudança no critério (variável dependente). É necessário mencionar que embora a equação mencione o resíduo (erro) ele não é estimado dentro do modelo, elemento pelo qual esta técnica pode ser criticada, mas que seus modelos de equações estruturais (SEM) de “evolução” compensa.
Uma vez estimada a equação, ela pode ser visualizada usando o seguinte plano bidimensional, denominado linha de regressão.
Linha de regressão ou inclinação
Fonte: Dagnino (2014)
Este gráfico, além de apresentar a relação das variáveis envolvidas (através da nuvem de pontos), expõe uma linha que dá o nome a este diagrama e indica o grau em que os dados empíricos se ajustam ao valor da regressão (o valor de B).
Embora B nos diga o grau da inclinação, na verdade não é muito útil para interpretação porque Ela é expressa na mesma métrica das variáveis e, portanto, seus valores podem ser muito extensos. Dessa forma, ao padronizar B com base nos Z Scores, obtém-se o coeficiente beta (β), cujos valores podem estar entre 0 e 1, tanto positivos quanto negativos e que permite sua interpretação. Assim, um valor beta negativo indicará que a variável preditora prediz negativamente o critério, ou seja, quanto maior a presença do preditor, menor será a probabilidade da presença do critério; Pelo contrário, um beta positivo indica que a presença do preditor favorece a presença do critério.
Como outras técnicas estatísticas inferenciais, a interpretação de uma regressão dependerá do contraste de hipótese, ou o valor de significância (p), que nas ciências sociais é tipicamente p > .05.
Por fim, um conceito elementar da análise de regressão é o valor R2, que se refere à variância explicada pelo modelo. regressão, que pode ser interpretada diretamente ou multiplicando-a por 100 para obter a porcentagem de variância explicou.
Regressão logística
Como mencionado no início, existem diferentes análises de regressão; a regressão foi abordada anteriormente linear simples e múltiplo, estes assumem que tanto as variáveis preditoras quanto o critério são contínuos. Porém, quando as variáveis não são contínuas, ou seja, são categóricas, deve-se utilizar a análise de regressão logística; Sendo esta a única diferença com os restantes modelos de regressão.
Referências
Dagnino, J. S. (2014). Regressão linear. Revista Chilena de Anestesiologia, 43, 143-149.Hayes, F. PARA. (2018). Introdução à mediação, moderação e análise condicional de processos. Uma abordagem baseada em regressão. (2º. Edição). Imprensa Guilford.