Sei sulla pagina 1di 18

UNIVERSIDADE FEDERAL DE SANTA CATARINA

CENTRO SÓCIO ECONÔMICO


PROGRAMA DE PÓS-GRADUAÇÃO EM ADMINISTRAÇÃO

Diego Wander Demetrio


Fabricio Michell Soares
Gabriela Furtado Carvalho
Lourenço Kawakami Tristão

CEC 3214 - ANÁLISE ESTATÍSTICA


Profº Dr. Marcelo Menezes Reis
TRABALHO 2

2018
1 INTRODUÇÃO

Selecionou-se o artigo “Gestão da Evasão na EAD: modelo estatístico preditivo


para os cursos de graduação a distância da Universidade Federal de Santa Catarina”
de Fernanda Cristina da Silva para essa resenha. Alguns motivos embasaram a
escolha dessa pesquisa para o presente trabalho, entre eles o fato de que é uma
pesquisa atual, realizada em 2017 e de que o tema, evasão em cursos EAD, é
bastante relevante para a gestão da universidade e para a área de Administração.
Procurou-se realizar uma síntese dos pontos mais importantes da dissertação
nas quatro próximas seções, e uma crítica nas três seguintes. Em relação às críticas,
procurou-se relacionar o que foi apresentado pela autora com as teorias vistas em
sala e com a bibliografia sugerida. Ponderamos aqui, entretanto, que as mesmas
devem ser consideradas como sugestões de pontos que poderiam ser aprimorados
em estudos futuros, e não falhas na pesquisa da autora, uma vez que a avaliação a
posteriori permite uma visão facilitada a quem lê, privilégio este que o pesquisador
nem sempre dispõe.
2 DESCRIÇÃO DA DISSERTAÇÃO

Nas próximas subseções serão abordadas as questões referentes à descrição


da dissertação.

2.1 Objetivo geral do artigo, indicando seu campo de aplicação (incluindo país,
região ou qualquer outra subdivisão geográfica ou política).

De acordo com Silva (2017), a evasão seria um dos principais problemas


enfrentados pelo ensino superior brasileiro. Em números, pode-se verificar a diferença
robusta entre os ingressantes no ensino superior e os que efetivamente se graduam.
De acordo com o INEP (2015 apud Silva, 2017, p.25), no período de 2010 a 2013
houveram, respectivamente, 6.4, 6.7, 7.0 e 7.3 milhões de matrículas em cursos de
graduação nas modalidades presencial e à distância (EAD), no entanto somente
991.010 pessoas concluíram o ensino superior em 2013. Para a autora isso ocorre
principalmente em função da evasão dos estudantes.
A autora (ibid, p.26) também destaca a importância dos cursos na modalidade
EAD ao citar o caso da UFSC, onde entre 2005 e 2014, as matrículas em cursos EAD
totalizaram 15% das matrículas realizadas na instituição.
Em função dessas constatações, Silva (ibid, p.27) elaborou sua pesquisa com
o seguinte objetivo geral e específicos:

Objetivo geral: Propor modelos estatísticos preditivos para a gestão da evasão


dos cursos de graduação ofertados a distância pela UFSC.

Objetivos específicos:
a) Identificar os principais aspectos que impactam na evasão dos cursos dos
cursos de graduação a distância da UFSC.
b) Construir modelos estatísticos preditivos de evasão para os cursos de
graduação a distância da UFSC.
c) Aplicar nos cursos de graduação a distância da UFSC os modelos
estatísticos preditivos de evasão construídos.
Em relação ao campo de aplicação, foram analisados somente os dados
relativos aos cursos de EAD em Administração, Administração Pública, Filosofia,
Letras Espanhol e Matemática da Universidade Federal de Santa Catarina, que
possuem polos em diversas regiões do estado. O curso de Filosofia, porém, foi
excluído da análise por não estar mais ativo. Além das análises que geraram os
modelos, tais modelos também foram aplicados aos cursos de EAD listados.

2.2 Técnica de análise multivariada empregada no artigo, mostrando os seus


detalhes, especialmente a razão pela qual o(s) autor(es) decidiu (decidiram) usá-
la.

A pesquisa é classificada como sendo de natureza aplicada, quantitativa,


descritiva e um estudo de caso com bases bibliográficas. Já em relação à estatística
utilizada para a análise dos dados, a autora aplicou a Regressão Logística Binária,
baseada nos conceitos de Barbetta (2014), Fávero (2015) e Hair et al. (2009) (SILVA,
2017).
Nesse método, uma variável dependente qualitativa é transformada em uma
variável qualitativa dicotômica. Tanto Hair et al. (2009) quanto Hosmer e Lemeshow
(1989), concordam que uma alta correlação entre as variáveis independentes não é
recomendada, uma vez que as estimativas dos coeficientes de regressão geradas ao
se trabalhar com variáveis altamente correlacionadas podem ser demasiadamente
descomedidas.
No caso da pesquisa em questão, referente a evadir ou não, é analisada
partindo-se das variáveis independentes que podem afetar o fato dos estudantes
evadirem do curso. O resultado é apresentado na forma de um modelo matemático
que indica a probabilidade de um evento ocorrer considerando as variáveis
independentes.
Esse modelo é resultado da aplicação do logaritmo natural em
𝑝𝑖
(razão conhecida como “chance”) igual a 𝛼 + 𝛽1𝑥1𝑖 + 𝛽2𝑥2𝑖 + ⋯+ 𝛽𝑘𝑥𝑘𝑖
1−𝑝𝑖

(conhecido como logito Z). Essas operações garantem que os resultados de 𝑝𝑖


assumirão valores entre 0 e 1. O software utilizado pela autora para realizar a análise
estatística foi o R.
Silva (2017) postulou duas hipóteses para sua análise, sendo que o critério
para rejeitar H0 foi o de ao menos uma das variáveis ser menor que o nível de
significância valor-p (p-value). As hipóteses em questão são:

H0: β1 = β2 = ... = βk = 0
H1: existe ao menos um βj ≠ 0

Para a seleção das variáveis, baseando-se nos conceitos de Hocking (1976) e


Hosmer e Lemeshow (1989), a autora utilizou o método stepwise com grau de
confiança de 95%, método que pode ser utilizado tanto na forma backwise (quando
se inicia com todas as variáveis e elas vão sendo eliminadas até alcançar-se o modelo
desejado) quanto forward (quando se inicia com nenhuma variável e vão se
adicionando variáveis até alcançar-se o modelo desejado). Para analisar o impacto de
variáveis específicas, foi utilizada a “razão de chances”, onde se compara a chance
de um evento acontecer em relação a outro. Assim, foi possível verificar o impacto de
cada variável ceteris paribus.
Entretanto, a autora somente explica como a técnica funciona e cita autores
que a utilizaram em seus estudos, sem apresentar em nenhum momento as razões
que a levaram a escolher esta técnica em relação à outras.

2.3 Descrição dos dados coletados: primários ou secundários, quantas


variáveis, seus níveis de mensuração, coletados por censo ou amostragem,
instrumento de pesquisa utilizado.

Em relação aos dados coletados, Silva (2017, p.68) afirma que os cursos
selecionados foram os que obteve autorização da coordenação de cada curso para o
estudo: Administração, Administração Pública, Filosofia, Letras Espanhol e
Matemática, todos na modalidade EAD. Entretanto, os dados do curso de Filosofia
foram eliminados da amostra pois o curso não está mais ativo. Os dados para a
análise foram fornecidos pela Superintendência de Governança Eletrônica e
Tecnologia da Informação e Comunicação (SeTIC) e Comissão Permanente do
Vestibular (Coperve), configurando-se, portanto, como dados secundários. Além
disso, foram utilizados somente os dados a partir do ano de 2008, pois a oferta dos
cursos EAD antes desse período foi considerada insipiente e poderiam destoar dos
dados após 2008.
Para a realização das análises, Silva (2017, p.75) considerou inicialmente as
seguintes variáveis:
a) Com origem no CAGR:
i. Situação da matrícula;
ii. Sexo;
iii. Idade;
iv. Cor;
v. Estado civil;
vi. Estado de residência;
vii. Estado do polo de apoio presencial;
viii. Categoria de ingresso;
ix. Pontos no vestibular;
x. Índice de aproveitamento acumulado (IAA);
xi. Se o estudante reside na cidade do polo.

b) Com origem no questionário socioeconômico aplicado no momento de


inscrição do vestibular:
i. Renda total mensal familiar (valor de referência – 1 (um) salário
mínimo);
ii. Número de pessoas que residem com você (incluindo você);
iii. Qual o tempo aproximado que você leva para chegar até o polo de
ensino a distância de sua cidade;
iv. Concluiu a maior parte do ensino médio em (escola pública ou
particular);
v. Em relação ao ensino superior (experiência);
vi. Já realizou algum curso a distância;
vii. Com que frequência você utiliza o computador;
viii. Onde você tem acesso a computador conectado à internet;
ix. Como é sua conexão com a internet;
x. Como é seu conhecimento sobre a utilização do computador e da
internet.
Com isso, obtiveram-se as seguintes amostras finais:

Tabela 01 – Amostras finais


Matrículas Matrículas não ativas
ativas (usada para a amostra de
Curso (usada para a teste) Total
amostra de
Formados Evadidos
estimação)
Administração 314 204 928 1446
Administração Pública 82 170 370 622
Letras Espanhol 74 67 304 445
Matemática 19 24 435 478
465 2.037
Totais 489 2991
2502
Fonte: Adaptado de Silva (2017, p.77)

Silva (ibid, p.77-78) realizou uma série de agrupamentos em relação às


respostas do questionário socioeconômico. O objetivo desses agrupamentos foi o de
garantir que cada variável tivesse ao menos 5 observações, conforme sugerido por
Hair et al. (2009 apud Silva, 2017). As seguintes categorias foram agrupadas:

a) Variável “cor”: categorias “preta”, “amarela” e “indígena” agrupadas, dando


origem à categoria “outra”;
b) Variável “Estado civil”: agrupadas as categorias “casado” e “união estável”;
agrupadas as categorias “divorciado”, “separado” e “viúvo”; agrupadas as
categorias “não informado” e “outro”;
c) Variáveis “UF residência” e “UF polo”: agrupadas nas categorias “Região
Sul” e “Outra”;
d) Variável “Categoria de ingresso”: agrupadas em “Classificação geral” e
“Programa de Ações Afirmativas”;
e) Variável “Renda familiar (Questão 1)”: agrupadas nas faixas “de 1 a 3
salários”; “de 4 a 8 salários” e “acima de 8 salários”;
f) Variável “Tamanho da família (Questão 2)”: agrupadas nas faixas “de 1 a 2
pessoas”, “de 3 a 4 pessoas” e “5 ou mais pessoas”;
g) Variável “Tempo de deslocamento até o polo (Questão 3)”: agrupadas nas
faixas “até 30 minutos”, “entre 30 minutos e 1 hora” e “acima de 1 hora”;
h) Variável “Local de acesso à internet (Questão 15)”: agrupadas as categorias
“amigo”, “parente”, “não tenho acesso” e “outro”; agrupadas as categorias
“escola” e “trabalho”;
i) Variável “Nível de conhecimento para o uso do computador e da internet
(Questão 18)”: agrupadas as categorias “pouco” e “nenhum”.

Como há variáveis não-métricas como independentes no estudo, a autora


utilizou para o banco de dado da amostra de teste a definição da categoria de
referência para cada variável qualitativa. Para isso, utilizou como critério que a
categoria referência seria aquela com maior frequência apurada.

2. 4 Resultados/conclusões encontrados pelos autores.

Em relação aos principais resultados, Silva (2017) realiza para cada curso a
análise de regressão logística binária de acordo com as seguintes etapas para a
definição do teste: determinação da categoria de referência para cada variável não-
métrica; ajuste dos dados pelo modelo linear generalizado (MLG) com o software R;
aplicação do método stepwise no sentido forward/backward pelo software R; novo
ajuste dos dados pelo MLG (considerando somente as variáveis consideradas
pertinentes pelo método stepwise); e, eliminação das variáveis cujo p-value resultante
era superior aos 5% de significância determinados pela pesquisadora. Em seguida,
com as matrículas ativas, utilizadas como amostras de estimação, faz-se uma análise
preditiva das probabilidades de evasão.
Foram identificados pela autora os seguintes resultados para cada curso:

a) Administração:
 Variáveis do modelo final: IAA, Pontos no vestibular e reside na
cidade do polo;
 71% dos alunos com matrículas ativas têm probabilidade igual ou
superior a 50% de evasão.
b) Administração Pública:
 Variáveis do modelo final: IAA.
 43% dos alunos com matrículas ativas têm probabilidade igual ou
superior a 50% de evasão.

c) Letras espanhol:
 Variáveis do modelo final: IAA e idade.
 30% dos alunos com matrículas ativas têm probabilidade igual ou
superior a 50% de evasão.

d) Matemática:
 Variáveis do modelo final: IAA.
 100% dos alunos com matrículas ativas têm probabilidade igual ou
superior a 65% de evasão.

O principal resultado identificado por Silva (2017, p.118) diz respeito a variável
IAA, sendo esta a única variável que foi relevante para todos os modelos identificados.
A autora conclui, então, que o desempenho dos alunos é o fator mais importante e
que este precisaria ser acompanhado pelos cursos para evitar a evasão dos
estudantes. A autora também destaca o alto grau de possibilidade de evasão, caso
seu modelo se confirme, para os cursos da UFSC. Os resultados obtidos são muito
superiores aos 27,45% estimados pelo INEP (2014; 2015 apud SILVA, 2017, p.54;
p,59) entre os anos de 2010 e 2013 em relação ao EAD nacional.
3 CRÍTICA DO ARTIGO

Nas próximas subseções serão abordadas as questões referentes às críticas


da dissertação.

3.1 Opinião do grupo sobre a adequação da técnica usada pelos autores para
atingir os objetivos propostos.

Quando uma análise multivariada tem sua variável dependente do tipo não-
métrica, e suas variáveis independentes métricas e não-métricas, duas técnicas
estatísticas seriam as mais apropriadas, a análise discriminante e a regressão
logística. Dessa forma, a análise discriminante poderia trabalhar com mais de dois
grupos de classificação da variável dependente, enquanto a regressão logística seria
limitada a dois grupos (HAIR et al., 2009, p.224).
No caso desta pesquisa, Silva (2017) utiliza variáveis independentes do tipo
categóricas, questão que não foi tratado pelo autor. Field (2009, p.221), entretanto,
afirma que a regressão logística pode utilizar variáveis independentes métricas ou
categóricas. Hair et al. (2009, p.225) também afirma que “quando as suposições
básicas de ambas são atendidas, elas oferecem resultados preditivos e classificatórios
comparáveis e empregam medidas diagnósticas semelhantes”.
Apesar desses pressupostos, e de ter o autor em questão como uma de suas
principais referências na pesquisa, Silva (2017) não realiza nenhuma explicação sobre
os motivos de escolher a regressão logística como técnica para sua análise. A autora
se detém em identificar alguns autores e suas respectivas pesquisas que fizeram uso
de regressão logística, além de afirmar que “pode-se inferir que modelos preditivos
para a evasão se apresentam como uma alternativa que deve ser considerada para
identificação de alunos em risco de abandono”. Depois, explica o funcionamento da
técnica em si, as fórmulas envolvidas, e as etapas do processo de análise; mas em
nenhum momento discute a escolha da técnica em relação aos seus objetivos ou em
relação à outras técnicas que poderiam ser utilizadas.
Hair et al. (2009, p.283) afirma que alguns dos motivos que poderiam levar à
escolha da regressão logística em detrimento da análise discriminante poderiam ser:
a) A necessidade para a análise discriminante de que as amostras atendam
as suposições de normalidade e de igualdade entre as matrizes de
variância-covariância, sendo que a regressão logística não necessitaria
desses pressupostos;
b) A similaridade da regressão logística com a regressão múltipla, permitiria
uma série de tratamentos parecidos que poderiam ser mais adequados
aos objetivos dos pesquisadores.
Assim, é possível que a escolha de Silva (2017) esteja relacionada a alguma
dessas questões supracitadas. A falta de explicação dos motivos, entretanto, dificulta
a verificação da adequação da técnica em questão.
Esse problema poderia ter sido superado com uma análise exploratória dos
dados, e a apresentação dessa análise exploratória no corpo do trabalho. Cálculos e
gráficos de questões importantes, do conjunto de dados das variáveis utilizadas, para
a diferenciação entre as técnicas de análise discriminante e regressão logística, como
a normalidade e a igualdade entre as matrizes de variância-covariância, poderiam ter
sido apresentados. Tal etapa parece ter sido suprimida da pesquisa em questão.
Outro ponto que diz respeito à técnica utilizada, e que carece de evidências
conceituais, foi o agrupamento por categorias realizado. Silva (2017) afirma que os
agrupamentos foram realizados para atender o pressuposto apontado por Hair et al.
(2009) de existir ao menos 5 observações para cada categoria de uma variável. Não
foram explicados, no entanto, nenhum aporte conceitual que corroborasse os
agrupamentos em si, implicando que os agrupamentos podem possuir
representatividade estatística, mas não necessariamente conceitual.
Dessa forma, é possível que a técnica esteja adequada para o objetivo geral
“propor modelos estatísticos preditivos para a gestão da evasão dos cursos de
graduação ofertados pelo EAD da UFSC”, uma vez os modelos propostos procuram
encontrar uma variável dependente dicotômica (evadir ou não evadir) partindo de uma
série de variáveis independentes métricas e dicotômicas.
3.2 Opinião do grupo sobre a adequação dos dados coletados para uso da
técnica de análise multivariada escolhida.

Em relação ao tamanho das amostras, Hair et al. (2009, p.83) afirma que o
tamanho “tem o efeito de aumentar o poder estatístico por redução de erro de
amostragem”, “reduzindo efeitos nocivos da não-normalidade”. Esses efeitos nocivos
seriam minimizados em amostras com mais de 200 observações. Reis (2008, p.257)
afirma que, em geral, amostras com mais de 30 observações já são suficientes para
minimizar esses efeitos. Embora a técnica utilizada na pesquisa, regressão logística,
não necessite da pressuposição de normalidade, todas as amostras contaram com
mais de 200 observações, de forma que estão adequadas para o estudo por ambos
os critérios.
Já de acordo com Vieira e Ribas (2011, p.195) porém, a exigência de amostras
grandes para aumentar a precisão da regressão logística necessita de 20 casos por
variável independente, sendo que o tamanho mínimo não pode ser inferior a 60 casos.
Por esse critério a quantidade de casos não seria satisfeita para o curso de Letras
Espanhol, uma vez que foram utilizadas 21 variáveis iniciais e 371 casos na amostra,
valor inferior aos 420 casos necessários.
Quanto à escolha por dados secundários para as finalidades da pesquisa, um
dos pontos que chamou a atenção foi a quase inexistente discussão sobre a
pertinência da utilização das variáveis contidas nos dados fornecidos pela SeTIC em
comparação com as variáveis sugeridas na bibliografia, levantadas na revisão
bibliográfica pela própria autora. Na opinião do grupo, as variáveis apresentadas na
bibliografia apresentariam maior robustez na apresentação de resultados mais
contundentes.
Hair et al. (2009, p.39) afirmam que durante as definições do problema de
pesquisa, dos objetivos e da técnica a ser utilizada para a construção de modelos
multivariados, é importante que o pesquisador “primeiro identifique as ideias ou
tópicos de interesse, em vez de se concentrar nas medidas específicas a serem
usadas” para minimizar a chance de “conceitos relevantes serem omitidos no esforço
de desenvolver medidas e de definir as especificidades do plano de pesquisa”.
Aparentemente a pesquisa em questão peca justamente nesse ponto levantado
pelo autor. Embora as variáveis importantes para a pesquisa tenham sido levantadas
durante a revisão bibliográfica, elas foram desconsideradas durante a análise. A
mesma focou somente nos dados secundários que foram fornecidos pela SeTIC sem
qualquer consideração a respeito dessa discrepância.
No quadro abaixo procurou-se realizar uma comparação entre as variáveis
listadas na bibliografia (primeira coluna) e as fornecidas pela SeTIC (segunda coluna).
Mesmo que algumas apresentem dados que poderiam ser interpretados como
similares, ainda parece existir a necessidade de discutir o quanto essa similaridade é
adequada para os objetivos da pesquisa. Também chama a atenção que a maior parte
das variáveis listadas como importantes para a pesquisa não foram contempladas
pelos dados fornecidos pela SeTIC, o que sugeriria a necessidade de realizar a coleta
de dados primários, ou ao menos a sugestão de que esses dados fossem incluídos
no questionário socioeconômico e/ou CAGR.

Quadro 01 - Comparação entre as variáveis levantadas na bibliografia e as abordadas


na pesquisa.
Variáveis bibliografia Variáveis utilizadas na pesquisa
 Metodologia de ensino
 Infraestrutura deficitária de laboratórios, salas  Estado do polo de apoio presencial
de aula, bibliotecas, etc.  Estado de residência
 Currículos desatualizados
 Rígidas cadeias de pré-requisitos
 Aspectos pedagógicos – instituições e
professores
 Atuação dos professores
 Índice de aproveitamento acumulado (IAA)
 Processo avaliativo
 Pontos no vestibular
 Greves
 Ausência ou pequeno número de programas
 Categoria de ingresso
institucionais para o estudante
 Imaturidade  Idade
 Casamento e filhos  Estado civil
 Mudança de cidade
 Número de pessoas que residem com você
(incluindo você)
 Situação financeira  Renda total mensal familiar
 Concluiu a maior parte do ensino médio em
(escola pública ou particular).
 Pressão e aprovação familiar em relação ao
curso
 Sexo
 Preconceito – gênero e raça
 Cor
 Conciliação entre trabalho e estudo
 Opção equivocada. Falta de conhecimento
prévio
 Não adaptação à vida acadêmica
 Custo x benefício
 Em relação ao ensino superior (experiência)
 Formação escolar anterior / Despreparo
 Já realizou algum curso a distância
 Valorização profissional
 Reprovação
 Faltas / Frequência
 Com que frequência você utiliza o
computador
 Onde você tem acesso a computador
conectado à internet
 Como é sua conexão com a internet
 Dificuldade de acompanhamento  Como é seu conhecimento sobre a
utilização do computador e da internet
 Qual o tempo aproximado que você leva
para chegar até o polo de ensino a distância
de sua cidade
 Se o estudante reside na cidade do polo
 Aprovação em outros cursos ou naquele não
pretendido
 Mudança de interesse
 Transferência para curso gratuito
 Decepção acadêmica
 Percepção da qualidade do curso
 Comprometimento e integração com a
instituição
 Concorrência entre instituições privadas
Fonte: Adaptado de Silva (2017)

3.3 Opinião do grupo sobre os resultados/conclusões encontrados pelos


autores.

Silva (2017) afirma que a principal variável, que afetou os modelos para todos
os cursos EAD analisados em relação à evasão, seria o IAA.
Em nossa análise, no entanto, o resultado parece ter sido insuficiente para
colocar luz na questão da evasão nos cursos EAD analisados, pois embora os
resultados estatísticos da análise de regressão logística encontrados de fato apontem
o IAA como a variável responsável pela evasão, conceitualmente o IAA parece ser
somente um sintoma, cujas causas podem ser diversas.
Assim, embora os resultados estejam corretos do ponto de vista do cálculo
estatístico utilizado, conceitualmente parece que o IAA precisaria ser desvelado nos
diversos fatores que poderiam influenciar seu resultado.
De fato, o IAA é um tipo de variável chamada de índice, ou seja, um valor que
procura representar um agrupamento de diversas outras variáveis já compiladas e
analisadas. Como se pode observar na figura a seguir, um índice se localiza no topo
da pirâmide de informações:

Figura 01 – Pirâmide de Informações de Hammond

Índices

Indicadores

Dados analisados

Dados Primários

Fonte: Hammond et al. (1995 apud Van Bellen, 2002, p. 31)

Dessa forma, o fato de ter-se trabalhado com um índice pode explicar o porquê
de o resultado ter apresentado para quase todos os modelos somente uma variável
significante, pois esse índice representaria diversos outros fatores que ficaram ocultos
na pesquisa.
Ao verificar-se, por exemplo, os atributos levantados por Silva (2017) na sua
fundamentação teórica, percebe-se que muitos daqueles critérios poderiam afetar o
IAA de um estudante. Conforme conhecimentos empíricos na área, considerar o aluno
como Evasão é um ato formal e burocrático, pois quando o aluno é considerado como
evadido, ele já teve suas rotinas acadêmicas interrompidas há um tempo maior.
Justamente por isso que o IAA do aluno desistente é tão baixo. Não foi contemplada
uma análise que permita uma análise por IA (Índice Acadêmico Semestral), apenas
por IAA e sem definição do momento da análise (há alunos que estavam em fases
diferentes no teste quando foi aplicado para estimação do percentual). Já na definição
do modelo foram utilizados apenas o índice de desempenho final quando o aluno ou
estava formado ou estava fora do curso.
É importante ressaltar que significância estatística e significância prática não
são sinônimos. Dessa forma, um determinado resultado pode ser estatisticamente
significativo, mas não ter relevância, podendo-se entender que “a substancialidade
não se esgota nos valores de p obtidos” (LOUREIRO; GAMEIRO, 2011, p.153).
Hair et al. (2009, p.37) abordará essa questão quanto trata de diretrizes para
análises multivariadas e interpretação ao afirmar que é necessário “estabelecer
significância prática, bem como significância estatística”.
Quanto a avaliação do momento que o recorte da análise foi realizado sob a
vida do aluno também não teve discussão ao longo do trabalho, percebamos, por
exemplo, que pode existir uma maior tendência de evasão nas fases iniciais dos
cursos e que a amostra para o teste usa alunos em suas condições limites (graduados
ou evadidos), já na amostra para estimação há alunos em variadas fases e momentos
acadêmicos distintos.
Uma importante avaliação que não foi explicitado no estudo analisado é o IAA
considerado para alunos formados e que podem ocasionar distorções no modelo final.
Conhecimento empírico demonstra que os alunos quando próximos de sua formatura
no ensino a distância têm suas notas de disciplinas reprovadas sobrepostas com
apenas a nota da aprovação final. Caso essa constatação seja verificada como um
erro de medida para o banco de dados avaliado, haverá distorções no modelo final
proposto.
Por fim, o grupo acredita que os resultados poderiam trazer mais variáveis
preditoras críticas se houvesse reconsideração do corte temporal da pesquisa para
obter informações do ambiente operacional que registra as interações dos alunos no
ensino a distância dos cursos avaliados, o Moodle. Mesmo que essa decisão
diminuiria a amostra para o teste, haveria dados importantes e que poderiam
corroborar melhor as variáveis bibliográficas de motivos de evasão. O Moodle poderia
fornecer variáveis mais operacionais e que permitiriam uma significância prática para
a operação da coordenação de tutoria no ensino a distância, por exemplo, como o
relacionamento do tempo entre as interações do tutor-aluno, aluno-Moodle, assim
como aspectos pedagógicos. Há ainda a necessidade de avaliação de variáveis não
controláveis diretamente como greves ou crises nos cursos.
4 CONCLUSÕES

Durante a elaboração da resenha crítica, procurou-se comparar a teoria


apresentada nas disciplinas e na bibliografia apresentada com o que foi realizado na
pesquisa.
Algumas questões principais foram levantadas, elas dizem respeito a ausência
de uma análise exploratória dos dados, que poderia ter melhorado a justificativa pela
escolha da técnica, ao apresentar análises de normalidade e igualdade de matrizes
de variância-covariância. As divergências entre as variáveis levantadas nas
referências bibliográficas consideradas por outros autores como importantes para
discutir-se a evasão no EAD e as variáveis utilizadas durante a análise de fato. E o
resultado de um modelo baseado somente na variável independente Índice de
Aproveitamento Acadêmico, que parece ocultar outros fatores que poderiam tornar as
ações mais efetivas no esforço contra a evasão.
Em relação aos métodos estatísticos utilizados, entretanto, verificou-se que a
autora seguiu corretamente os procedimentos necessários, e que embora não tenha
ocorrido uma melhor exploração dos motivos pela escolha da técnica, está não se
demonstrou inadequada para os critérios e objetivos desejados.
REFERÊNCIAS

FIELD, Andy. Descobrindo a estatística usando o SSP. Porto Alegre: Artmed, 2009.

HAIR, Joseph F.; BLACK, Bill; BABIN, Barry; ANDERSON, Rolph E.; TATHAM,
Ronald L. Análise multivariada de dados. Porto Alegre: Bookman, 2009.

HOCKING, R. R. A Biometrics Invited Paper. The Analysis and Selection of Variables


in Linear Regression. In: Biometrics, 32. 1-49. Março, 1976. Arlington, 1976.

HOSMER, D.; LEMESHOW, S. Applied Logistic Regression. Nova Iorque: John


Wiley & Sons, 1989.

LOUREIRO, Luís Manuel de Jesus; GAMEIRO, Manuel Gonçalves Henriques. Critical


interpretation of statistical results: beyond statistical significance. Rev. Enf.
Ref., Coimbra, v. serIII, n. 3, p. 151-162, mar. 2011.

REIS, Marcelo Menezes. Estatística aplicada à administração. Florianópolis:


Departamento de Ciências da Administração/UFSC, 2008.

SILVA, Fernanda Cristina. Gestão da evasão na EAD: modelo estatístico preditivo


para os cursos de graduação a distância da Universidade Federal de Santa Catarina.
Dissertação (Mestrado em Administração) – Programa de Pós-graduação em
Administração, Universidade Federal de Santa Catarina, Florianópolis, 2017.

VAN BELLEN, Hans Michel. Indicadores de sustentabilidade: uma análise


comparativa. Rio de Janeiro: Editora FGV, 2002. 253 p.