Sei sulla pagina 1di 50

UFPB Universidade Federal da Paraba

MINICURSO: Introduo ao GoldVarb X: uso e interpretao


PBLICO-ALVO: Alunos e Professores de Letras (20 vagas)
PROFESSORA: Josane Moreira de Oliveira (UEFS)
Data: 14 e 15 de julho de 2014
Carga horria: 8 horas/aula

PLANO DE ENSINO

1 OBJETIVOS
a) Conhecer e utilizar a ferramenta GoldVarb X;
b) Codificar, processar e analisar dados lingusticos;
c) Desenvolver habilidades para a interpretao dos resultados emitidos pelo GoldVarb X.

2 CONTEDO PROGRAMTICO
A sociolingustica quantitativa
O corpus
O GoldVarb X
o Origem
o Instalao
o Uso
Arquivos de dados
Grupos de fatores
Arquivo de especificaes
Arquivo de condies
Arquivo de clulas
Varbrul pesos relativos
o Interpretao dos resultados
o Apresentao dos resultados tabelas e grficos

3 METODOLOGIA
Exposio participada com direcionamento dos contedos para a aplicao prtica a partir do uso
do programa GoldVarb X no computador.
4 AVALIAO
Avaliao processual considerando a frequncia e a participao efetiva dos alunos nas aulas;
Exerccios constantes;
Processamento de dados das pesquisas dos alunos.
REFERNCIAS
CEDERGREN, H. J.; SANKOFF, D. Variable rules: performance as a statistical reflection of
competence. Language, 50:2. 1974, p. 333-355.
GUY, G. R. Advanced varbrul analysis. In: FERRARA, K; BROWN, B.; WALTERS, K.;
BAUGH, J. (Ed.). Linguistic change and contact. Austin: University of Texas, 1988, p. 124-136.
GUY, G. R.; ZILLES, A. M. Sociolingustica quantitativa: instrumental de anlise. So Paulo:
Parbola, 2007.
MILROY, L.; GORDON, M. Sociolinguistics: method and interpretation. Oxford: Blackwell,
2003.
MOLLICA, M. C.; BRAGA, M. L. (Org.). Introduo sociolingustica: o tratamento da variao.
So Paulo: Contexto, 2004.
PAOLILLO, J. Analyzing linguistic variation: statistical models and methods. Stanford CA: CSLI,
2002.
RAND, D. & SANKOFF, D. GoldVarb: a variable rule application for Macintosh. 1990.
ROBINSON, J.; LAWRENCE, H.; TAGLIAMONTE, S. GoldVarb 2001: a multivariate analysis
application for Windows. Users manual. 2001.
SANKOFF, D. Linguistic variation: models and methods. New York: Academic Press, 1978.
SANKOFF, D.; LABOV, W. On the uses of variable rules. Language in Society, 8 (2). 1979, p.
189-222. SANKOFF, D. Variable rules. In: AMMON, U.; DITTMAR, N.; MATTHEIR, K. J.
(Ed.). Sociolinguistics: an international handbook of the science of language and society.
Berlin/New York: De Gruyter, 1988, p. 984-998.
SANKOFF, D.; TAGLIAMONTE, S.; SMITH, E. GoldVarb X a multivariate analysis
application. 2005. Toronto: Department of Linguistics; Ottawa: Department of Mathematics.
Disponvel em: http://individual.utoronto.ca/tagliamonte/ Goldvarb/GV_index.htm#ref. Acesso em:
20 out. 2011.
SCHERRE, M. M. P.; CARDOSO, C. R. Guia rpido do GoldVarb X. Disponvel em:
http://geasunb.blogspot.com.br/. Acesso em: 6 fev. 2014.
TAGLIAMONTE, S. A. Analyzing sociolinguistic variation. Cambridge: Cambridge University
Press, 2006.
UFPB Curso GoldVarb X
Profa. Josane Oliveira

A sociolingustica quantitativa

Muito antiga a constatao de que a lngua se diversifica em seu uso. A viso da lngua como um
sistema heterogneo e instvel prioriza uma anlise lingustica voltada para o estudo de modos alternativos
de dizer a mesma coisa. A sociolingustica postula que a condio normal de uma comunidade de fala a
heterogeneidade e que essa heterogeneidade estruturada.
A diversificao lingustica est documentada tanto diatpica como socialmente. As lnguas
humanas esto em constante variao. Algumas variaes se propagam gradativamente por perodos mais
ou menos longos em diversos eixos sociais e podem levar a mudanas. Como praticamente impossvel a
demarcao exata e ntida de fronteiras geogrficas e sociais, prefervel falar em tendncias a empregos
de certas formas lingusticas motivadas por condicionamentos vrios.
Tendo sido largamente demonstrado e discutido o carter social da lngua, j se dispe de um
campo da cincia lingustica especificamente voltado para a covariao entre fenmenos lingusticos e
sociais, a sociolingustica, equivalente, para outros, a uma dialectologia urbana ou vertical. Por ser
impossvel desvincular a lngua de sua funo scio-comunicativa, a sociolingustica entendida como um
espao de investigao interdisciplinar que estuda e correlaciona aspectos dos sistemas lingusticos e dos
sistemas sociais, focalizando empregos concretos da lngua.
Labov (1972) questiona a justificativa para a dicotomia lingustica versus sociolingustica, uma vez
que de todos conhecido sobretudo depois de Saussure o fato de que a lngua essencialmente um
sistema de comunicao social, mas admite o uso desse termo sociolingustica, para que se diferenciem
estudos baseados em dados intuitivos (lingusticos) daqueles baseados em dados reais obtidos atravs de
gravaes de interaes orais ou de recolha de textos escritos (sociolingusticos).
Entretanto a razo maior para que se distingam esses dois tipos de estudo da lngua parece residir
nos objetivos, pois, enquanto a chamada lingustica interna, sobretudo o estruturalismo e o gerativismo,
busca estudar e descrever um sistema homogneo e abstrato de lngua, a sociolingustica ou lingustica
externa , focalizando a lngua no contexto em que se concretiza, analisa a heterogeneidade do sistema.
Alm de ocupar-se da diversidade da lngua nas situaes ou contextos em que ocorre, diversidade esta
atestada seja na variao, seja na mudana lingustica, a sociolingustica procede tambm ao estudo dos
juzos e das atitudes do falante sobre o comportamento verbal no s dele prprio mas tambm da sua
comunidade de fala.
A sociolingustica apresenta uma relao estreita com a rea da lingustica histrica, uma vez que,
estudando a variao da lngua dentro da estrutura social da comunidade em que ocorre, identifica e prev
processos de mudana em curso, que, obviamente, so decorrentes dessas variaes.
Ora, sendo a lngua um meio de interao entre o indivduo e a sociedade em que ele atua, est
claro que h foras sociais que agem sobre essa interao. E esse relacionamento casual entre lngua e
sociedade que constitui o objeto de anlise da sociolingustica.
Labov (1972) insiste na relao entre lngua e sociedade e na possibilidade, virtual e real, de
investigar e descrever a sistematicidade da variao existente e prpria das lnguas. O modelo de anlise
lingustica proposto pelo autor tambm rotulado de sociolingustica quantitativa, pois, como, em se
tratando de variao, no se pode reduzir os fatos a uma questo de tudo ou nada, opera com nmeros e
tratamento estatstico dos dados coletados.
O problema central que se coloca para a teoria da variao a avaliao do quantum com que cada
categoria postulada contribui para a realizao de uma ou outra das variantes lingusticas em concorrncia.
Na verdade, na fala concreta, a operao de uma regra varivel o resultado da atuao simultnea de
vrios fatores, ou seja, as categorias no so isoladas, pelo contrrio, elas se apresentam conjugadas.
atravs de modelos quantitativos que se podem estabelecer correlaes entre fatos lingusticos e
socioculturais, o que proporciona uma melhor viso da variao da lngua, que descrita em termos de
regras variveis, s quais se podem atribuir valores probabilsticos (ou pesos relativos) que predizem a
ocorrncia das variantes independentemente do corpus observado1.

1
Os resultados finais da anlise propiciariam a formulao de regras gramaticais variveis. Trata-se, portanto, de um sistema
lingustico de probabilidades (composto de formas em relao de concorrncia). Dessa forma, seria incorporado gramtica o
Os fatores que desencadeiam a mudana lingustica so numerosos e diversificados; podem ser
explcitos e perceptveis, ou, ao contrrio, invisveis e inacessveis percepo do falante. Podem ainda ser
externos ou internos ao sistema da lngua (MARCHELLO-NIZIA et alii, 2003).
A sociolingustica, como disciplina independente e com uma metodologia prpria, desenvolveu-se
principalmente a partir dos anos 60, nos Estados Unidos e no Canad. Seu objetivo descrever a relao
entre os fatos lingusticos e os fatos sociais, portanto exteriores lngua, tais como idade, sexo/gnero,
nvel de escolarizao, classe social, etnia, profisso, contexto estilstico ou situacional etc.
A varivel idade revela-se de fundamental importncia no estudo dos fenmenos variveis, uma
vez que essa varivel que vai indicar se determinado fenmeno de variao lingustica est estvel ou
est em progresso num estudo em tempo aparente. Tambm se sabe que, nos eixos sociais, por exemplo,
em geral, os falantes mais jovens so mais inovadores e os falantes mais velhos costumam preservar
formas mais antigas.
A varivel sexo/gnero tambm focalizada pela sociolingustica, pois, do ponto de vista social,
homens e mulheres tm papis diferentes e esto, portanto, expostos a situaes diversas. Assim, esse fator
pode influenciar a escolha de uma ou outra forma lingustica. Estudos comprovam que, nos processos de
variao estvel, so os homens que utilizam as variantes inovadoras, porm, nos casos de mudana, so as
mulheres que esto frente do processo.
A varivel escolaridade mostra-se pertinente, por exemplo, no momento em que se observa a
existncia de formas lingusticas de prestgio ou estigmatizadas. H fenmenos que so alvo do ensino
escolar e outros que no o so. Como as gramticas escolares e os manuais de ensino e estudo da lngua
julgam as formas estigmatizadas rotulando-as de erros ou vcios de linguagem, o grau de instruo do
falante pode condicion-lo ao uso de determinada(s) forma(s) lingustica(s). Tambm essa varivel se
revela importante quando do estudo da lngua escrita.
A classe ou o grupo social ou o nvel socioeconmico a que o falante pertence se reflete
tambm na sua linguagem. Quanto mais estratificada socialmente uma comunidade, maior o ndice de
variao das formas lingusticas. Os estudos sociolingusticos de Labov mostram que muitas inovaes
lingusticas surgem nas camadas mais populares e sobem pela escala social. A mudana comea a se
efetivar nas classes intermedirias, pois, quando uma variante concorrente, normalmente no prestigiada,
atinge as classes mais altas, muito provavelmente a mudana se implementa. Outros estudos, porm,
mostram resultados diversos que refletem, provavelmente, diferentes formas de organizao social.
A etnia tambm uma varivel considerada pelos sociolinguistas. sobretudo em estudos da
variao na lngua inglesa da Amrica que esse fator tem se tornado mais conhecido para a explicao de
fenmenos variveis. No caso do portugus do Brasil, entretanto, essa varivel no tem sido muito
considerada.
Para a sociolingustica, pode haver uma correlao entre o tipo de atividade profissional
desenvolvida por uma pessoa ao longo de sua vida e a necessidade do uso de formas lingusticas de
prestgio. Assim, tem-se considerado tambm a varivel profisso para compreender fenmenos
variveis, uma vez que h profisses que se servem mais da lngua do que outras. Entre falantes que atuam
em profisses do primeiro tipo (por exemplo, professores, advogados, jornalistas...), podem ocorrer mais
variantes de prestgio, j que tm acesso mais direto e mais constante ao cdigo lingustico, o que pode no
acontecer com falantes que exercem profisses do segundo tipo.
A varivel estilo de fala diz respeito forma como as pessoas se comunicam sobre determinado
assunto em determinado lugar, observadas as relaes sociais particulares entre elas. Os falantes possuem
um repertrio lingustico que varia a depender do local, do interlocutor, do assunto, do ambiente. Em
situaes descontradas, mais informais, entre pessoas com as quais se tem mais intimidade, comum que
se usem formas lingusticas vernculas, ao passo que em ambientes de maior formalidade, entre pessoas
que no se conhecem ou de posies hierrquicas diferentes, em situaes de conscincia da prpria
linguagem, os falantes so capazes de adaptar sua maneira de falar e usar com maior frequncia variantes
de prestgio. Ou seja, a fala formal se aproxima mais da norma standard e a fala informal dela se afasta,
deixando transparecer o coloquial, espontneo. Diferenas de contexto formal e informal levam os falantes
a empregar, respectivamente, estilos tambm formais ou informais. atravs do estilo informal, que deixa
transparecer mais o vernculo, que muitas mudanas se implementam.

conceito de regra varivel ao lado das regras categricas da lingustica estrutural e gerativo-transformacional , cuja aplicao
apresentaria uma frequncia condicionada a fatores internos e/ou externos lngua.
No estudo da mudana lingustica, Weinreich, Labov & Herzog (1968) formulam cinco questes
tericas centrais: os condicionamentos, a transio, o encaixamento, a avaliao e a sua implementao.
Esses cinco problemas so explicados resumidamente a seguir:
a) o problema dos condicionamentos (the constraint problem) alguns fatores determinam
mudanas possveis numa dada direo. Assim, cada restrio pressupe uma explicao que
diz respeito causa da mudana. Pode-se, ento, saber quais so as mudanas possveis e se so
de ordem universal;
b) o problema da transio (the transition problem) essa questo objetiva responder como uma
lngua muda, ou seja, como ela passa de um estgio para outro. Isso implica tambm a
transmisso de regras de uma gerao a outra e, portanto, a localizao social do falante na
comunidade de fala. Numa escala social, h grupos mais inovadores e menos inovadores.
Localizar que grupo lidera a mudana tambm, portanto, uma questo crucial. H que se
levantar hipteses para o funcionamento de cada nvel lingustico num estudo sincrnico e
diacrnico, na tentativa de entender os sistemas intermedirios, que dizem muito mais sobre as
mudanas do que os estgios inicial e final;
c) o problema do encaixamento (the embedding problem) deve-se observar como uma mudana
se encaixa no sistema lingustico e na matriz social da comunidade. H que se investigar como
uma mudana pode desencadear outra, num efeito domin, dentro do sistema lingustico;
d) o problema da avaliao (the evaluation problem) a avaliao social diz respeito forma
como os falantes julgam a mudana e qual o efeito desse julgamento sobre a mudana. Isso
implica o nvel de ateno do falante em relao fala;
e) o problema da implementao (the actuation problem) a propagao da mudana se d em
determinados ambientes estruturais e se difunde progressivamente a partir de ambientes mais
favorveis. H que se investigar que fatores propiciam que uma determinada mudana ocorra
em uma lngua em uma determinada poca e no em outra. Essa parece ser a questo mais
difcil a ser respondida pela teoria. Para a sua resoluo deve ser considerada a combinao dos
resultados para todos os problemas anteriores.
Conjugando, pois, estudos sincrnicos e diacrnicos (de longa e de curta durao) tem-se mais
embasamento para uma descrio fiel e segura de uma dada lngua. Todavia, devido ao fato de no ser
possvel resolver determinados problemas histricos, j que os dados so fragmentados, pode-se utilizar a
observao emprica do presente para explicar o passado e do passado para explicar o presente. Essa
observao pode ser produtiva na medida em que est baseada no princpio do uniformitarismo (LABOV,
1994). Ele uma condio necessria reconstruo histrica assim como o uso do presente necessrio
para explicar o passado, j que as foras e restries que regem as mudanas numa lngua no presente so
as mesmas que impulsionaram mudanas j concludas.
Finalmente, no h distino entre origem e propagao da mudana (LABOV, 1975), pois uma
lngua s muda quando uma forma foi transmitida de um falante para outro e foi aceita como uma
conveno social.
Enfim, os objetivos desse tipo de anlise so descrever e analisar a variao numa lngua,
depreendendo a sistematizao que lhe inerente e comparando os resultados das anlises com vistas
projeo de possveis rumos que as variantes tomaro.
Assim, a concepo e o alcance do modelo sociolingustico so, ao mesmo tempo, sincrnicos e
diacrnicos, uma vez que toda mudana implica uma variao. Nesse modelo, a estrutura de uma lngua
somente ser totalmente entendida medida que se compreendam efetivamente os processos histricos de
sua configurao.
Teoricamente, uma amostra sincrnica de dados, isto , dados de um tempo real na histria de uma
lngua, permite estudar a dinmica da mudana em curso de implementao, dado que um estado de lngua
a face sincrnica da mudana lingustica. Entretanto, procedendo a um recorte transversal da amostra
sincrnica em funo da faixa etria dos informantes, acrescenta-se uma dimenso diacrnica anlise.
Assim, tem-se o que se chama de tempo aparente.
O tempo aparente serve como um procedimento atravs do qual se pode projetar o tempo real
futuro, ou seja, estudando-se a transio e a implementao de variveis uma anlise acurada de uma
comunidade sociolingustica com seu componente de variao e de mudana , pode-se dimensionar
historicamente uma varivel, no s em relao ao passado mas tambm em relao a um possvel
comportamento no futuro.
Analisando a correlao entre as variantes e os fatores internos e considerando o fator idade, pode-
se observar a estratificao das mesmas. Se, por exemplo, a variante inovadora for mais frequente entre
falantes mais jovens, decrescendo em relao idade dos outros informantes, tem-se indcios de uma
mudana em progresso.
Uma vez aventada a hiptese de mudana com base em dados do tempo aparente, pode-se proceder
tambm a uma anlise histrica da varivel no tempo real, isto , deve-se recorrer a dados de outra(s)
sincronia(s) para que, atravs de comparaes, se possa melhor entender o valor e a direo da varivel na
comunidade (LABOV, 1994).
Em tempo real, o estudo da mudana possibilita analisar aspectos que no podem ser detectados em
tempo aparente e permite distinguir mudanas que se produzem gradualmente em toda a comunidade das
que caracterizam a trajetria de comportamento lingustico individual (PAIVA & DUARTE, 2003).
Os estudos no tempo real de longa durao que requerem um interstcio de sculos apresentam
dificuldades quanto coleta de dados, sobretudo de pocas pretritas, pois no h registros orais e os
escritos no so to sistemticos. a que se exige do pesquisador uma maior ateno para que consiga
fazer um bom uso dos chamados maus dados (LABOV, 1994; PAIVA & DUARTE, 2003).
J os estudos no tempo real de curta durao geralmente com um interstcio de duas ou trs
dcadas fornecem evidncias mais seguras sobre o estatuto dos padres de variao em um dado
momento da lngua e podem se apresentar de duas maneiras, estudo de tendncia (trend study) ou estudo
de painel (panel study) (LABOV, 1994). O primeiro compara em sincronias diferentes uma mesma
comunidade de fala, ou seja, gravam-se informantes diferentes de uma mesma comunidade em momentos
diferentes, com o intuito de depreender a direcionalidade do sistema na comunidade e a relao entre as
mudanas lingusticas (sua propagao, estabilizao ou recuo) e a configurao social de um grupo.
Assim, focaliza-se a continuidade/descontinuidade na prpria lngua, que pode se refletir no
comportamento do indivduo. O segundo estuda o comportamento lingustico dos mesmos informantes em
momentos sincrnicos diferentes, com o intuito de distinguir mudana geracional de mudana na
comunidade. Nesse tipo de estudo, est em jogo a continuidade/descontinuidade no comportamento
lingustico do indivduo sem reflexos no sistema (LABOV, 1994).
Assim, correlacionando fatores lingusticos e extralingusticos, sincrnicos e diacrnicos, tenta-se
desvendar o mistrio da variao e da mudana.
Como bem colocam Paiva & Duarte (2003), conjugando esses tipos diferentes de estudo, obtm-se
subsdios para a questo da implementao e do encaixamento da mudana. Ao comparar duas sincronias,
surgem indcios para a identificao de como uma dada mudana progride na lngua, qual a sua trajetria
estrutural e social e quais as relaes de causa e efeito entre diferentes processos de mudana. Ou seja, esse
confronto permite descobrir como as mudanas esto associadas entre si, j que no so frutos do acaso.
Teoricamente, quando uma mudana se implementa, ela no s consequncia mas tambm possibilita o
aparecimento de outra, isto , faz parte de uma matriz de mudanas mais gerais. Enfim, pressupe-se que
as mudanas nas lnguas naturais no so isoladas ou independentes.
A metodologia da teoria da variao constitui uma ferramenta que pode ser usada para o estudo de
qualquer fenmeno varivel nos diversos nveis e manifestaes lingusticas. mais um instrumento que
se apresenta ao linguista para o entendimento das lnguas humanas.

(Extrado de: OLIVEIRA, Josane Moreira de. O futuro da lngua portuguesa ontem e hoje: variao e
mudana. Rio de Janeiro: UFRJ, Faculdade de Letras, 2006. Tese de Doutorado em Lngua Portuguesa. p.
44-51)
UFPB Curso GoldVarb X
Profa. Josane Oliveira

O corpus

Uma anlise sociolingustica uma anlise quantitativa de dados. Por isso, a escolha do corpus
muito importante no trabalho. Claro que preciso primeiramente dedicar-se a um determinando fenmeno
lingustico varivel e proceder leitura de material bibliogrfico sobre o tema!
Em se tratando de lngua falada, escolhe-se uma comunidade de fala. Buscam-se, a seguir,
informantes que dela sejam representativos. Um dos critrios ser nascido no local, filho de pais do local e
que no tenha se afastado por muito tempo do local. Da preciso equilibrar as clulas quanto ao
sexo/gnero, quanto faixa etria, quanto escolarizao etc. Segue um exemplo de estratificao dos
informantes de uma comunidade:

Homens Mulheres
Nome Faixa etria Escolaridade Nome Faixa etria Escolaridade
Pedro 1 S Maria 1 S
Joo 1 S Ana 1 S
Mrio 1 N Paula 1 N
Andr 1 N Andria 1 N
Antnio 2 S Jlia 2 S
Jlio 2 S Carla 2 S
Joaquim 2 N Joana 2 N
Mateus 2 N Alice 2 N
Felipe 3 S Cludia 3 S
Carlos 3 S Vera 3 S
Manuel 3 N Marta 3 N
Ricardo 3 N Adriana 3 N

Assim teramos 24 informantes, sendo 12 homens e 12 mulheres, 12 escolarizados e 12 analfabetos,


8 da faixa 1 (25 a 35 anos), 8 da faixa 2 (36 a 55 anos) e 8 da faixa 3 (56 anos ou mais).
Da faramos as gravaes e levantaramos os dados do fenmeno sob anlise controlando essas
informaes.
Em se tratando de lngua escrita, tambm os dados devem ser controlados. Por exemplo,
trabalhando com jornais, teramos de controlar qual o jornal, qual o tipo de texto, qual a cidade, qual a data
etc. para controlar essas informaes na coleta dos dados.
muito importante colocar essas informaes de forma abreviada, mas decodificvel, aps o dado.
Montado o corpus, passa-se ao levantamento e codificao dos dados para a anlise quantitativa.
Trabalha-se com cdigos (de preferncia mnemnicos) que alimentaro o Programa GoldVarb. Veremos
como fazer isso mais adiante!
UFPB Curso GoldVarb X
Profa. Josane Oliveira

Exerccio 1

Instalando o GoldVarb X

1. Crie uma nova pasta com o nome GoldVarb X na sua rea de Trabalho (Desktop) usando o boto
direito do mouse.
2. Baixe o Programa da Internet (GOLDVARB30B3), digitando-o no Google. Os links so:
http://individual.utoronto.ca/tagliamonte/Goldvarb/GV_index.htm ou
http://individual.utoronto.ca/tagliamonte/goldvarb.htm. O manual da verso anterior (GoldVarb
2001) pode ser encontrado em:
http://www.york.ac.uk/depts/lang/webstuff/goldvarb/manual/manualOct2001.html (no h manual
para a verso X).
3. Voc j tem todos os arquivos executveis do programa!

Utilizando o GoldVarb X

1. D um duplo click na Pasta GoldVarb X e um duplo click na primeira pasta GoldVarb30b3.


Depois, d um duplo click no aplicativo GoldVarb.
2. V ao menu e clique em File. Ento crie um arquivo de dados (New New Tokens) ou abra um
arquivo j existente (Open).
3. A voc pode comear a digitar os seus dados. Primeiro coloque a cadeia de codificao precedida
de ( . Aps a cadeia de codificao, d um espao e coloque o seu dado. No feche os parnteses.
Cada dado (com a respectiva cadeia) deve vir em uma linha diferente. Deixe uma linha em branco
entre os dados.

(I2d3i2PpbA/AddPaU//S7EJnA Tal comisso VAI FAZER uma espcie de radiografia


do INPS para apontar ao Sr. Jlio Barata os males que afetam o mastodntico
instituto. [T2 J 70 SSA]

(F1c3i2FpnE/XndPaU//S7EJnC ste, se a comisso nomeada pelo Ministro fr de


bons clnicos, SER o diagnstico. [T2 J 70 SSA]

bom destacar o dado examinado dentro do contexto. A varivel dependente deve ser sempre a
primeira na cadeia de codificao. Ao final do exemplo, coloque a fonte (localizao) do dado. Nos
exemplos acima, T2 texto 2, J jornal, 70 anos 70 e SSA Salvador. Ao terminar, d um nome
ao arquivo (File, Save As). A extenso desse arquivo .tkn (de token, que significa dado). Da
prxima vez, para abrir o seu arquivo de dados, clique em File, Open e selecione o arquivo a ser
aberto. Ao digitar os dados, no use parnteses (se for o caso, substitua-os por colchetes). Tambm
no use barras (se for o caso, substitua-as por trao).

Voc pode digitar os dados no Word e us-los depois no GoldVarb X. Voc pode copiar e colar
todo o arquivo ou salv-lo no Word como Texto sem formatao. Neste caso, ele ter a extenso
.txt. Ento, na hora de abri-lo no GoldVarb X, preciso selecionar (ao lado da linha do nome do
arquivo) All Files em vez de Token Files. Lembre-se de salvar o arquivo como .tkn, para facilitar o
uso posteriormente. Use File Save As e d um nome. Ele ser .tkn.

4. Como codificar os dados


a) comece pela varivel dependente
b) evite repetir muito os mesmos smbolos
c) evite num mesmo grupo maisculas e minsculas
d) tente colocar um cdigo que lembre o fator especificado (cdigo mnemnico)
e) nunca use caracteres do tipo inserir smbolos
Exemplo de codificao:

Grupos de fatores Variantes Cdigos


G1: Varivel dependente Futuro simples (farei) F
Futuro perifrstico (vou fazer) I
Presente (fao) P
G2: Conjugao verbal 1 conjugao 1
2 conjugao 2
3 conjugao 3
G3: Paradigma verbal Regular r
Irregular i
G4: Tipo de sujeito Agente (eu lavarei os pratos) A
Experienciador (eu verei a luz) E
Paciente (o livro ser lido) P
No se aplica (haver paz) /
G5: Tipo de futuro Prximo p
Distante d
Indefinido i
G6: Sexo/gnero do informante Feminino M
Masculino H
G7: Faixa etria 25 a 35 anos 1
45 a 55 anos 2
65 anos em diante 3
G8: Escolaridade Nvel superior s
Nvel mdio m
Nvel fundamental f

Agora, prepare os seus dados. Crie os seus grupos de fatores e codifique os dados num papel
parte. Cada grupo de fatores corresponde a uma coluna no programa (o GoldVarb X aceita at 120
colunas). Mantenha sempre em mos os seus grupos de fatores num papel separado.
bom ler o texto:
SCHERRE, M. M. P.; NARO, A. J. Anlise quantitativa e tpicos de interpretao do Varbrul. In:
MOLLICA, M. C.; BRAGA, M. L. (Org.). Introduo sociolingustica: o tratamento da variao. So
Paulo: Contexto, 2004, p. 147-177.

Os arquivos do GoldVarb X:

Os arquivos lidos pelo GoldVarb X tm extenses .tkn, .res, .cnd, .cel.

.tkn: arquivos de dados

.cnd: arquivos de condies

.cel: arquivos de clulas

.res: arquivos de resultados (especificaes, percentagens, pesos relativos, tabulaes cruzadas...)

Todos os resultados gerados pelo programa durante uma sesso ficam em um arquivo .res nas janelas
abaixo ou ao lado da janela do arquivo de dados. Se quiser mant-los, precisar salv-los em Save As.
UFPB Curso GoldVarb X
Profa. Josane Oliveira

Exerccio 2

Arquivo de dados pronto (.tkn)

Agora que o arquivo de dados (tokens) est pronto, voc precisa criar o arquivo de especificaes,
ou seja, precisa informar ao programa todos os seus grupos e todos os fatores de cada grupo.
Observao: para inserir algum comentrio sobre os dados, voc pode usar o ponto e vrgula (;) no
incio da linha. Exemplo:

(P2r1 Eu LAVO os pratos depois.


; neste exemplo, considera-se que o presente tem valor de futuro, j que indica uma ao que ocorrer aps
o ato de fala.

(F1i3 Ele VIR mais cedo hoje.

Exemplo de arquivo de dados no GoldVarb X:

Criando o arquivo de especificaes e checando erros de codificao

Para criar o seu arquivo de especificaes, na tela principal, clique em Tokens e, a seguir, em
Generate Factor Specifications. Clique em OK. Aparecer uma telinha com o nmero total de dados.
Clique em Ok. A seguir, aparecer uma tela com os grupos, os valores e o Default. Cada grupo tem um
Default, um fator que deve ser um dos fatores daquele grupo. Pode ser qualquer fator, apenas uma
referncia para o programa saber qual o fator mais esperado por voc. Confira se os grupos tm pelo
menos 2 fatores e se os valores esto corretos. Se houver erros de codificao, preciso corrigi-los. Voc
pode ver todo o arquivo de especificaes tambm clicando em Tokens Show Factor Specifications.
Verifique se em cada grupo h pelo menos 2 fatores. Se houver algum grupo com apenas 1 fator,
acrescente mais um fator qualquer. Depois, clique em Modify Group.

Agora v tela dos dados e clique em Tokens No recode (no recodificar). Aparecer a tela com
o arquivo de condies, em que constam todos os grupos de fatores. Voc far a primeira rodada com
todos os grupos e todos os fatores para um resultado inicial.
Na tela do arquivo de condies, clique em Cell Load cells to memory. O programa perguntar se
quer gerar o arquivo de clulas a partir do arquivo de dados e do arquivo de condies em tela. Clique em
Yes. Aparecer ento uma telinha com o total de dados e de linhas checados. Clique em Ok. Aparecer
outra tela com Choose application value(s). O programa pede a regra de aplicao. Ele apresenta a ordem
das variantes (varivel dependente) na ordem em que aparecem no arquivo de dados.

Voc pode mudar essa ordem, a depender do que esteja estudando. Por exemplo, estudando o
futuro verbal, temos 4 variantes (futuro simples F, futuro perifrstico com ir no presente I, futuro
perifrstico com ir no futuro R e presente do indicativo P). Pela ordem em que aparecem nos dados, o
programa me mostra: PIFR. Mas prefiro a ordem FIRP. Ento posso alterar. Clique em OK e aparecer o
primeiro arquivo de resultados, com os percentuais. Salve-o como Save As e faa uma primeira anlise.
Aparecem tambm um telinha com o total de clulas (clique em OK) e uma tela com o arquivo .cel (que
no nos interessa). Eis uma imagem do arquivo de clulas com os percentuais:
Imprima o seu arquivo de clulas para fazer uma primeira anlise. Possivelmente, haver alguns
KnockOuts. O KnockOut acontece sempre que h regra categrica (0% ou 100% dos dados) em algum
fator. Eles tero de ser retirados da rodada, mas fornecem uma informao lingustica importantssima.
No deixe de informar, na sua anlise, os casos categricos! Pode acontecer tambm o Singleton Group,
grupo que contm apenas um fator. Este tambm deve ser retirado da rodada.
Vejamos um exemplo desses casos em um arquivo de clulas:

CELL CREATION 07/02/2014 19:00:41


Name of token file: A Tarde1.tkn
Name of condition file: Untitled.cnd
(
(1 (P (COL 1 P))
(I (COL 1 I))
(F (COL 1 F))
(I (COL 1 R)))
(2)
(3)
(4)
(5)
(8)
(12)
(14)
(15)
(16)
(17)
)
Number of cells: 410
Application value(s): FIP
Total no. of factors: 39

Group F I P Total %
----------------------------------------------
1 (2) F I P
2 N 126 55 81 262 42.5
% 48.1 21.0 30.9

4 N 22 19 45 86 13.9
% 25.6 22.1 52.3

3 N 37 46 22 105 17.0
% 35.2 43.8 21.0

1 N 137 8 19 164 26.6


% 83.5 4.9 11.6

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
2 (3) F I P
3 N 190 91 125 406 65.8
% 46.8 22.4 30.8

6 N 120 17 37 174 28.2


% 69.0 9.8 21.3

4 N 11 18 3 32 5.2
% 34.4 56.2 9.4

1 N 1 2 2 5 0.8
% 20.0 40.0 40.0

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
3 (4) F I P
1 N 79 86 87 252 40.8
% 31.3 34.1 34.5

2 N 224 25 64 313 50.7


% 71.6 8.0 20.4

3 N 19 17 16 52 8.4
% 36.5 32.7 30.8

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
4 (5) F I P
r N 97 100 116 313 50.7
% 31.0 31.9 37.1

i N 225 28 51 304 49.3


% 74.0 9.2 16.8

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
5 (8) F I P
A N 65 91 94 250 42.0
% 26.0 36.4 37.6

E N 157 34 69 260 43.7


% 60.4 13.1 26.5

P N 82 1 2 85 14.3
% 96.5 1.2 2.4

Total N 304 126 165 595


% 51.1 21.2 27.7
----------------------------------------------
6 (12) F I P
P N 78 97 107 282 45.7
% 27.7 34.4 37.9

E N 35 17 18 70 11.3
% 50.0 24.3 25.7

F N 208 14 42 264 42.8


% 78.8 5.3 15.9

C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
7 (14) F I P
P N 123 42 103 268 43.4
% 45.9 15.7 38.4

X N 143 74 23 240 38.9


% 59.6 30.8 9.6

I N 44 9 32 85 13.8
% 51.8 10.6 37.6

A N 11 3 8 22 3.6
% 50.0 13.6 36.4

D N 1 0 1 2 0.3
% 50.0 0.0 50.0 * KnockOut *
Total N 322 128 167 617
% 52.2 20.7 27.1
----------------------------------------------
8 (15) F I P
o N 50 31 34 115 18.6
% 43.5 27.0 29.6

i N 84 17 31 132 21.4
% 63.6 12.9 23.5

u N 153 66 85 304 49.3


% 50.3 21.7 28.0

d N 35 14 17 66 10.7
% 53.0 21.2 25.8

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
9 (16) F I P
c N 322 128 167 617 100.0
% 52.2 20.7 27.1 * Singleton Group *

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
10 (17) F I P
T N 10 9 22 41 6.6
% 24.4 22.0 53.7

M N 231 96 63 390 63.2


% 59.2 24.6 16.2

N N 34 16 76 126 20.4
% 27.0 12.7 60.3

E N 9 0 0 9 1.5
% 100.0 0.0 0.0 * KnockOut *

A N 20 1 0 21 3.4
% 95.2 4.8 0.0 * KnockOut *

H N 12 0 3 15 2.4
% 80.0 0.0 20.0 * KnockOut *

Q N 0 1 2 3 0.5
% 0.0 33.3 66.7 * KnockOut *

R N 4 5 1 10 1.6
% 40.0 50.0 10.0

C N 2 0 0 2 0.3
% 100.0 0.0 0.0 * KnockOut *

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
TOTAL N 322 128 167 617
% 52.2 20.7 27.1

Name of new cell file: .cel

Como dito antes, para a rodada final, o arquivo de clulas precisa estar sem nenhum problema.
Precisamos resolver os casos de No Factors, de Singleton Group e de Knockouts.
UFPB Curso GoldVarb X
Profa. Josane Oliveira

Exerccio 3

Como interpretar os resultados do arquivo de clulas

Como j se disse, o 1 arquivo de clulas, no caso de ter havido algum problema (KnockOut,
Singleton Group ou No Factors), deve ser guardado, pois o problema deve ser comentado na anlise dos
dados. Todavia esse arquivo ter de ser refeito at que no haja mais problemas. S ento ele poder ser
submetido ao clculo dos pesos relativos.
O arquivo de clulas j permite uma anlise dos dados, pois ele informa a quantidade de
ocorrncias e os percentuais para cada variante em relao a cada fator considerado nos grupos de fatores.
Por exemplo, observe os resultados do grupo abaixo, extrado do arquivo de clulas anterior:
----------------------------------------------
4 (5) F I P
r N 97 100 116 313 50.7
% 31.0 31.9 37.1

i N 225 28 51 304 49.3


% 74.0 9.2 16.8

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------

Este Grupo (Paradigma verbal) possui 2 fatores (r = verbo regular / i = verbo irregular).
Transformando esses resultados em tabela, temos:

Tabela 1: Variao na expresso do futuro na escrita e paradigma verbal


Paradigma Futuro simples Futuro perifrstico Presente Total
verbal
No de Percentual No de Percentual No de Percentual
dados dados dados
Verbo regular 97 31% 100 32% 116 37% 313
Verbo irregular 225 74% 28 9% 51 17% 304
Total 322 128 167 617

Assim, podemos ver que o futuro simples foi mais utilizado (52%) do que o futuro perifrstico
(21%) e do que o presente (27%) em toda a amostra, que contm 617 dados. Comparando os dois
paradigmas verbais, vemos que nos verbos irregulares prevaleceu o futuro simples, enquanto que os verbos
regulares foram mais usados com o futuro perifrstico e com o presente.
Este s um exemplo. A estruturao e a leitura da tabela podem variar, a depender do que se
queira chamar ateno.
Mas, voltemos aos problemas! Para retirar os casos de Singleton Group, No Factors e KnockOut,
devemos recodificar os dados. Nos casos de Singleton Group e de No Factors, os grupos devem ser,
simplesmente, retirados na recodificao. No primeiro caso, trata-se de um grupo em que s um fator
ocorreu; no segundo, trata-se de um grupo em que nenhum dos fatores ocorreu.
Exemplo de Singleton Group:
----------------------------------------------
9 (16) F I P
c N 322 128 167 617 100.0
% 52.2 20.7 27.1 * Singleton Group *

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
Este grupo, Tipo de jornal, possui 2 fatores: culto (c) e popular (p). Como os dados dessa amostra
foram todos do jornal considerado culto (ainda no tinham sido codificados os dados do jornal popular), os
617 dados (total da amostra) apareceram codificados com o fator c (100%) dos dados. Observe que no total
o programa continua dizendo (como na tabela anterior) que h futuro simples em 52% dos dados, futuro
perifrstico em 21% dos dados e presente em 27% dos dados. Simplesmente no h como considerar esse
grupo, pois no h clculo algum a fazer. Eis o que o programa informa com a expresso Singleton
Group. Quando da recodificao, devemos excluir o grupo 16 (atual 9).
Exemplo de No factors:

---------------------------------
17 (18)
* No Factors *
---------------------------------
Suponha que este grupo seja Tipo de sujeito, com 3 fatores: sujeito animado (A), sujeito
inanimado (I) e no se aplica (/). Os casos de no se aplica devem ser codificados com uma barra (/).
Neste grupo, seriam casos de no se aplica os dados em que h sujeito oracional (DEVER ser
considerado que o homem um ser mortal) ou em que h orao sem sujeito (VAI HAVER muitos
problemas). Com o no se aplica (/), dizemos ao programa que nesses casos no h como dizer se o
sujeito animado ou no animado, ou seja, nesses casos, essa classificao NO SE APLICA. E o
programa retira da rodada (dos clculos) esses dados. Ele nem os enxerga.
Agora suponha que nessa amostra s ocorreram exemplos de no se aplica, ou seja, em todos os
dados houve sujeito oracional ou orao sem sujeito. Assim, a mensagem No Factors informa que no
houve nenhum fator, ou seja, no houve A (sujeito animado) nem I (sujeito inanimado). Dessa forma, o
programa no tem como informar nada. Com essa mensagem, ele nos diz: o que voc quer que eu faa
nesse grupo se no h nada codificado (nem A nem I)? Quando da recodificao, o grupo 18 (atual 17)
deve ser excludo.

Como recodificar os dados retirando grupos

Para recodificar os dados retirando grupos (depois veremos como retirar apenas fatores e como
agrupar fatores), os passos so os seguintes:
1. Na tela dos dados (Tokens) e clique em Recode setup
2. Aparece uma tela Generate conditions for recoding:

3. Clique no Grupo 1 (o grupo da varivel dependente) e ele vai ficar azul. Ento clique ao lado
em Recode
4. Na tela ao lado aparecem os fatores, repita os que quer manter e modifique os que quer
recodificar (no exemplo, digite P I F I). Assim, estamos recodificando R como I (ou seja, os
casos de irei fazer estaro juntos com os casos de vou fazer, como futuro perifrstico)
5. A seguir, clique no Grupo 2 da tela esquerda e clique em Copy (esse grupo ser mantido sem
alteraes)
6. Repita a mesma operao com todos os grupos, exceto com os grupos a serem excludos (no
caso do exemplo, ignore os grupos 16 Singleton Group e 18 No factors, pulando-os)
7. A seguir, clique em Ok e aparecer um novo arquivo de condies
8. Aparecer uma nova tela, com o arquivo de condies;
9. Clique em Cells Load cells to memory
10. Aparecer uma tela dizendo que h clulas na memria e o programa pergunta se voc quer
descart-las (clique em Yes)
11. Aparece outra tela perguntando se voc quer criar um novo arquivo de clulas a partir dos
dados e das condies em tela (clique em Yes)
12. Aparecer uma tela pedindo a regra de aplicao (digite FIP e clique em Ok)
13. O programa ento apresenta o novo arquivo de clulas sem os grupos excludos
14. Veja o seu novo arquivo de clulas sem os grupos excludos (eles no constaro nem do arquivo
de condies nem dos resultados)

Ateno: o programa gera o novo arquivo embaixo do anterior (a no ser que o tenhamos salvado).
Assim, preciso cuidado pra olhar o ltimo arquivo!
Vejamos o arquivo de clulas que estamos tomando como exemplo. Eis o arquivo aps a
recodificao:

CELL CREATION 07/02/2014 19:52:36


Name of token file: A Tarde1.tkn
Name of condition file: Untitled.cnd
(
(1 (P (COL 1 P))
(I (COL 1 I))
(F (COL 1 F))
(I (COL 1 R)))
(2)
(3)
(4)
(5)
(8)
(12)
(14)
(17)
)

Number of cells: 301


Application value(s): FIP
Total no. of factors: 34

Group F I P Total %
----------------------------------------------
1 (2) F I P
2 N 126 55 81 262 42.5
% 48.1 21.0 30.9

4 N 22 19 45 86 13.9
% 25.6 22.1 52.3

3 N 37 46 22 105 17.0
% 35.2 43.8 21.0

1 N 137 8 19 164 26.6


% 83.5 4.9 11.6

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
2 (3) F I P
3 N 190 91 125 406 65.8
% 46.8 22.4 30.8

6 N 120 17 37 174 28.2


% 69.0 9.8 21.3
4 N 11 18 3 32 5.2
% 34.4 56.2 9.4

1 N 1 2 2 5 0.8
% 20.0 40.0 40.0

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
3 (4) F I P
1 N 79 86 87 252 40.8
% 31.3 34.1 34.5

2 N 224 25 64 313 50.7


% 71.6 8.0 20.4

3 N 19 17 16 52 8.4
% 36.5 32.7 30.8

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
4 (5) F I P
r N 97 100 116 313 50.7
% 31.0 31.9 37.1

i N 225 28 51 304 49.3


% 74.0 9.2 16.8

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
5 (8) F I P
A N 65 91 94 250 42.0
% 26.0 36.4 37.6

E N 157 34 69 260 43.7


% 60.4 13.1 26.5

P N 82 1 2 85 14.3
% 96.5 1.2 2.4

Total N 304 126 165 595


% 51.1 21.2 27.7
----------------------------------------------
6 (12) F I P
P N 78 97 107 282 45.7
% 27.7 34.4 37.9

E N 35 17 18 70 11.3
% 50.0 24.3 25.7

F N 208 14 42 264 42.8


% 78.8 5.3 15.9

C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
7 (14) F I P
P N 123 42 103 268 43.4
% 45.9 15.7 38.4

X N 143 74 23 240 38.9


% 59.6 30.8 9.6
I N 44 9 32 85 13.8
% 51.8 10.6 37.6

A N 11 3 8 22 3.6
% 50.0 13.6 36.4

D N 1 0 1 2 0.3
% 50.0 0.0 50.0 * KnockOut *

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
8 (17) F I P
T N 10 9 22 41 6.6
% 24.4 22.0 53.7

M N 231 96 63 390 63.2


% 59.2 24.6 16.2

N N 34 16 76 126 20.4
% 27.0 12.7 60.3

E N 9 0 0 9 1.5
% 100.0 0.0 0.0 * KnockOut *

A N 20 1 0 21 3.4
% 95.2 4.8 0.0 * KnockOut *

H N 12 0 3 15 2.4
% 80.0 0.0 20.0 * KnockOut *

Q N 0 1 2 3 0.5
% 0.0 33.3 66.7 * KnockOut *

R N 4 5 1 10 1.6
% 40.0 50.0 10.0

C N 2 0 0 2 0.3
% 100.0 0.0 0.0 * KnockOut *

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------
TOTAL N 322 128 167 617
% 52.2 20.7 27.1

Name of new cell file: .cel

No h mais Singleton Group nem No Factors. Restam s os KnocKouts. Vejamos como resolv-
los.
UFPB Curso GoldVarb X
Profa. Josane Oliveira

Exerccio 4

Como recodificar os dados retirando fatores ou juntando fatores de um mesmo grupo

Tomando como exemplo o arquivo de clulas anterior, observe o Grupo 6 (antigo 12):

----------------------------------------------
6 (12) F I P
P N 78 97 107 282 45.7
% 27.7 34.4 37.9

E N 35 17 18 70 11.3
% 50.0 24.3 25.7

F N 208 14 42 264 42.8


% 78.8 5.3 15.9

C N 1 0 0 1 0.2
% 100.0 0.0 0.0 * KnockOut *

Total N 322 128 167 617


% 52.2 20.7 27.1
----------------------------------------------

O fator C (verbo cognitivo) apresenta KnockOut. Ou seja, no nico caso em que houve esse tipo de
verbo, ocorreu futuro simples (100%). Devemos informar isso na anlise e retirar esse dado desse grupo.
Assim, veremos a variao apenas entre verbos de processo (P), verbos de evento (E) e verbos de estado
fsico (F).
Para fazer isso, siga os seguintes passos (alguns dos quais vimos anteriormente quando da retirada
de grupos inteiros):
1. Na tela dos dados, v em Tokens e clique em Recode setup
2. Aparece uma telinha perguntando se quer salvar ou no o arquivo de condies anterior (clique
em Dont save)
3. Aparece uma tela para recodificao (Generate conditions for recoding...)
4. Clique no Grupo 1 (o grupo da varivel dependente) e ele vai ficar azul. Ento clique ao lado
em Recode e digite P I F I (ele vai manter esse grupo substituindo R por I)
5. Clique no Grupo 2 e a seguir em Copy
6. Repita a mesma operao com todos os grupos que voc quer manter
7. J vimos que os grupos a serem excludos devem ser pulados
8. No caso do grupo 12, do qual queremos excluir o fator C, clique em Recode
9. Na tela ao lado, digite P E F / (assim manteremos P E F e exclumos o dado de C, que tinha
knockout)
10. No caso de excluir mais de um fator no mesmo grupo, continue colocando a barra (/) para os
fatores a serem excludos;
11. Faamos o mesmo com o Grupo 14, para excluir o D (digite na tela ao lado P X I A /)
12. Devemos excluir tambm o Grupo 17 (Gnero textual), que apresentou muitos knockouts
13. Clique em Ok e ter o novo arquivo de clulas (imprima-o e analise-o) sem problemas
14. Agora os seus dados j esto prontos para a rodada final do Varbrul (pesos relativos)

Acontece que temos 3 variantes e o programa s faz rodadas binrias para gerar os pesos relativos.
Nossa opo aqui deixar de lado o presente do indicativo e rodar o futuro simples e o futuro perifrstico.
Essa deciso feita com base em anlises lingusticas. Como o futuro perifrstico a forma inovadora,
ser a regra de aplicao, de acordo com o seguinte raciocnio: queremos ver quais os contextos de entrada
da forma inovadora na escrita.
Veremos como fazer isso mais tarde!
UFPB Curso GoldVarb X
Profa. Josane Oliveira

Exerccio 5

H outra opo para a retirada dos casos de KnockOut. Em vez de retirar fatores, podemos
reagrupar os fatores dentro de um mesmo grupo. Por exemplo, podemos juntar P1 (= eu) e P4 (= ns)
como 1 pessoa, P2 (= tu) e P5 (= vs) como 2 pessoa e P3 (= ele) e P6 (= eles) como 3 pessoa. Neste
caso, ignoraremos o nmero (singular ou plural).
Podemos tambm reagrupar fatores de grupos diferentes. Por exemplo, em vez de ter 2 grupos um
com a conjugao verbal (1, 2 e 3) e outro com o paradigma verbal (verbo regular e verbo irregular) ,
podemos transform-los em um s grupo: 1 conj. reg., 1 conj. irreg., 2 conj. reg., 2 conj. irreg., 3 conj.
reg. e 3 conj. irreg. Assim, em vez de 2 grupos com 3 fatores cada, temos um grupo s com 6 fatores.
Optar pela retirada dos fatores ou pelo reagrupamento depende de uma anlise lingustica. A, como
cada caso um caso, vale a intuio lingustica e o conhecimento do fenmeno e da lngua sob anlise.
Vimos como excluir fatores. A seguir, veremos como reagrupar fatores.

Como recodificar os dados reagrupando fatores de grupos diferentes

Comandos AND e OR
Os comandos AND e OR no esto disponveis na verso do GoldVarb X, mas podemos us-los na
verso do GoldVarb 2001.

AND

Por exemplo, considerando os grupos de fatores exemplificados abaixo:

Grupos de fatores Variantes Cdigos


G1: Varivel dependente Futuro simples (farei) F
Futuro perifrstico (vou fazer) I
Presente (fao) P
G2: Conjugao verbal 1 conjugao 1
2 conjugao 2
3 conjugao 3
G3: Paradigma verbal Regular r
Irregular i
G4: Tipo de sujeito Agente (eu lavarei os pratos) A
Experienciador (eu verei a luz) E
Paciente (o livro ser lido) P
No se aplica (haver paz) /
G5: Sexo/gnero do informante Feminino M
Masculino H

Podemos juntar os fatores dos grupos 2 e 3 da seguinte forma:

Verbos regulares de 1 conjugao (1 + r)


Verbos irregulares de 1 conjugao (1 + i)
Verbos regulares de 2 conjugao (2 + r)
Verbos irregulares de 2 conjugao (2 + i)
Verbos regulares de 3 conjugao (3 + r)
Verbos irregulares de 3 conjugao (3 + i)

Para fazer isso (no GoldVarb 2001), v ao Action Recode Setup da janela de Tokens. Clique no
Grupo 2 e clique em AND. O programa ento pede o outro grupo. Selecione o Grupo 3. Observe que na
tabela do lado direito (com as novas condies) aparece o AND com uma linha em branco e os dois grupos
selecionados a seguir. Na tabela do lado esquerdo (original), clique em 1 (Grupo2) e em r (Grupo 3).
Depois clique em 1 (Grupo 2) e em i (Grupo 3). Clique em 2 (Grupo 2) e em r (Grupo 3). Depois combine
2 com i. Faa o mesmo com o 3 (com r e depois com i). Assim, voc fez todas as combinaes propostas
acima, juntando os dois grupos. Observe na tabela ao lado direito as novas combinaes. Na linha em
branco do AND, preencha cada combinao com um novo cdigo. Por exemplo: 1 + r = 1; 2 + r = 2; 3 + r
= 3; 1 + i = U; 2 + i = D; 3 + i = T. Clique ento em Finish current operation. O programa pede ento uma
condio para que essa operao acabe. Digite qualquer smbolo (por exemplo, a letra X). Prossiga com a
recodificao, copiando ou excluindo os demais grupos, como visto em aulas anteriores. Aparecer o novo
arquivo de condies com os grupos unidos pelo AND.
Da s rodar o novo arquivo de clulas: View Results Load Cells to Memory. Voc ver o
novo arquivo de condies e o arquivo de clulas. No caso da exemplificao aqui apresentada, houve dois
knockouts com a nova codificao. Os fatores U (verbos irregulares de 1 conjugao) e T (verbos
irregulares de 3 conjugao) apresentaram 100% de futuro simples. Teramos de retirar esses knockouts,
obviamente. Mas, por enquanto, observe apenas a juno dos grupos 2 e 3. Veja que o GoldVarb chamou
esse novo grupo de New (novo):

CELL CREATION
=============
Name of token file: C:\Documents and Settings\Josane\Desktop\Goldvarb\JOT90.tkn
Name of condition file: Untitled.cnd
(
(1)
(2)
(3)
(4 (6 (COL 4 6))
(3 (COL 4 3))
(/ (COL 4 4)))
(0 (T (AND (COL 5 i) (COL 6 3) )) Grupo novo com o AND
(D (AND (COL 5 i) (COL 6 2) ))
(U (AND (COL 5 i) (COL 6 1) ))
(3 (AND (COL 5 r) (COL 6 3) ))
(2 (AND (COL 5 r) (COL 6 2) ))
(1 (AND (COL 5 r) (COL 6 1) ))
(1 (ELSEWHERE)))
(10)
(16 (a (COL 16 a))
(n (COL 16 n))
(/ (COL 16 i)))
(17 (U (COL 17 U))
(O (COL 17 O))
(I (COL 17 I))
(F (COL 17 F))
(/ (COL 17 P)))
(20)
)
Number of cells: 68
Application value(s): IF
Total no. of factors: 28

Group I F Total %
---------------------------------
1 (2)
4 N 3 8 11 15
% 27 72

2 N 7 20 27 39
% 25 74

3 N 5 13 18 26
% 27 72

1 N 2 11 13 18
% 15 84
Total N 17 52 69
% 24 75
---------------------------------
2 (3)
b N 1 1 2 2
% 50 50

d N 10 24 34 49
% 29 70

c N 2 12 14 20
% 14 85

t N 3 11 14 20
% 21 78

i N 1 4 5 7
% 20 80

Total N 17 52 69
% 24 75
---------------------------------
3 (4)
6 N 4 14 18 27
% 22 77

3 N 13 35 48 72
% 27 72

Total N 17 49 66
% 25 74
---------------------------------
4 (new) Grupo novo com o AND
3 N 1 4 5 7
% 20 80

1 N 10 27 37 53
% 27 72

D N 4 14 18 26
% 22 77

2 N 2 3 5 7
% 40 60

U N 0 3 3 4
% 0 100 * KnockOut *

T N 0 1 1 1
% 0 100 * KnockOut *

Total N 17 52 69
% 24 75
---------------------------------
5 (10)
P N 1 14 15 22
% 6 93

A N 9 20 29 43
% 31 68

E N 5 17 22 33
% 22 77

Total N 15 51 66
% 22 77
---------------------------------
6 (16)
a N 15 49 64 94
% 23 76

n N 1 3 4 5
% 25 75

Total N 16 52 68
% 23 76
---------------------------------
7 (17)
U N 9 28 37 54
% 24 75

O N 5 8 13 19
% 38 61

I N 1 4 5 7
% 20 80

F N 2 11 13 19
% 15 84

Total N 17 51 68
% 25 75
---------------------------------
8 (20)
S N 11 27 38 55
% 28 71

R N 6 25 31 44
% 19 80

Total N 17 52 69
% 24 75
---------------------------------
Total N 17 52 69
% 24 75

Name of new cell file: Untitled.cel

O mesmo pode ser feito, por exemplo, para cruzar as variveis sexo/gnero e faixa etria, ou para
cruzar as variveis sexo/gnero e escolaridade.

OR

Para usar o comando OR, o procedimento o mesmo para o comando AND. A diferena apenas
semntica: AND significa E e OR significa OU. S uma reflexo lingustica indicar os casos em que
devemos usar um ou outro.
UFPB Curso GoldVarb X
Profa. Josane Oliveira

Exerccio 6

Como obter os pesos relativos

Para a rodada binria Futuro perifrstico X Futuro simples, precisamos excluir os dados de
Presente. Assim, vamos recodificar os dados, colocando / no fator P do primeiro grupo. preciso lembrar
que as alteraes anteriores precisam ser mantidas. A nova regra de aplicao I F. Assim, o nosso novo
arquivo clulas :

CELL CREATION 07/02/2014 20:21:46


Name of token file: A Tarde1.tkn
Name of condition file: Untitled.cnd
(
(1 (/ (COL 1 P))
(I (COL 1 I))
(F (COL 1 F))
(I (COL 1 R)))
(2)
(3)
(4)
(5)
(8)
(12 (P (COL 12 P))
(E (COL 12 E))
(F (COL 12 F))
(/ (COL 12 C)))
(14 (P (COL 14 P))
(X (COL 14 X))
(I (COL 14 I))
(A (COL 14 A))
(/ (COL 14 D)))
)

Number of cells: 167


Application value(s): IF
Total no. of factors: 23

Group I F Total %
--------------------------------------
1 (2) I F
2 N 55 126 181 40.2
% 30.4 69.6

1 N 8 137 145 32.2


% 5.5 94.5

4 N 19 22 41 9.1
% 46.3 53.7

3 N 46 37 83 18.4
% 55.4 44.6

Total N 128 322 450


% 28.4 71.6
--------------------------------------
2 (3) I F
3 N 91 190 281 62.4
% 32.4 67.6

4 N 18 11 29 6.4
% 62.1 37.9
6 N 17 120 137 30.4
% 12.4 87.6

1 N 2 1 3 0.7
% 66.7 33.3

Total N 128 322 450


% 28.4 71.6
--------------------------------------
3 (4) I F
3 N 17 19 36 8.0
% 47.2 52.8

2 N 25 224 249 55.3


% 10.0 90.0

1 N 86 79 165 36.7
% 52.1 47.9

Total N 128 322 450


% 28.4 71.6
--------------------------------------
4 (5) I F
i N 28 225 253 56.2
% 11.1 88.9

r N 100 97 197 43.8


% 50.8 49.2

Total N 128 322 450


% 28.4 71.6
--------------------------------------
5 (8) I F
E N 34 157 191 44.4
% 17.8 82.2

A N 91 65 156 36.3
% 58.3 41.7

P N 1 82 83 19.3
% 1.2 98.8

Total N 126 304 430


% 29.3 70.7
--------------------------------------
6 (12) I F
E N 17 35 52 11.6
% 32.7 67.3

P N 97 78 175 39.0
% 55.4 44.6

F N 14 208 222 49.4


% 6.3 93.7

Total N 128 321 449


% 28.5 71.5
--------------------------------------
7 (14) I F
X N 74 143 217 48.3
% 34.1 65.9

I N 9 44 53 11.8
% 17.0 83.0

P N 42 123 165 36.7


% 25.5 74.5

A N 3 11 14 3.1
% 21.4 78.6

Total N 128 321 449


% 28.5 71.5
--------------------------------------
TOTAL N 128 322 450
% 28.4 71.6

Name of new cell file: .cel

Com este arquivo pronto, podemos proceder rodada para gerar os pesos relativos. Para tanto,
nesse novo arquivo de percentagens (.res), clique em Cells Binomial, Up and Down. Aparecer nosso
novo arquivo .res, com os pesos relativos (logo abaixo do arquivo de percentagens)!

BINOMIAL VARBRUL 07/02/2014 20:29:33


Name of cell file: .cel

Averaging by weighting factors.


Threshold, step-up/down: 0.050001

Stepping up...

---------- Level # 0 ----------

Run # 1, 1 cells:
Convergence at Iteration 2
Input 0.284
Log likelihood = -268.696

---------- Level # 1 ----------

Run # 2, 4 cells:
Convergence at Iteration 6
Input 0.228
Group # 1 -- 2: 0.597, 1: 0.166, 4: 0.745, 3: 0.808
Log likelihood = -227.458 Significance = 0.000

Run # 3, 4 cells:
Convergence at Iteration 5
Input 0.265
Group # 2 -- 3: 0.570, 4: 0.819, 6: 0.282, 1: 0.847
Log likelihood = -249.486 Significance = 0.000

Run # 4, 3 cells:
Convergence at Iteration 5
Input 0.233
Group # 3 -- 3: 0.746, 2: 0.269, 1: 0.782
Log likelihood = -220.284 Significance = 0.000

Run # 5, 2 cells:
Convergence at Iteration 5
Input 0.239
Group # 4 -- i: 0.284, r: 0.766
Log likelihood = -224.550 Significance = 0.000

Run # 6, 4 cells:
Convergence at Iteration 7
Input 0.197
Group # 5 -- E: 0.470, A: 0.851, P: 0.048
Log likelihood = -209.363 Significance = 0.000

Run # 7, 4 cells:
Convergence at Iteration 5
Input 0.209
Group # 6 -- E: 0.648, P: 0.825, F: 0.204
Log likelihood = -205.705 Significance = 0.000

Run # 8, 5 cells:
Convergence at Iteration 5
Input 0.281
Group # 7 -- X: 0.570, I: 0.344, P: 0.467, A: 0.412
Log likelihood = -264.605 Significance = 0.045

Add Group # 6 with factors EPF

---------- Level # 2 ----------

Run # 9, 13 cells:
Convergence at Iteration 8
Input 0.195
Group # 1 -- 2: 0.586, 1: 0.299, 4: 0.566, 3: 0.645
Group # 6 -- E: 0.626, P: 0.779, F: 0.247
Log likelihood = -200.445 Significance = 0.015

Run # 10, 13 cells:


Convergence at Iteration 7
Input 0.198
Group # 2 -- 3: 0.549, 4: 0.786, 6: 0.326, 1: 0.887
Group # 6 -- E: 0.618, P: 0.818, F: 0.215
Log likelihood = -195.936 Significance = 0.000

Run # 11, 10 cells:


Convergence at Iteration 8
Input 0.198
Group # 3 -- 3: 0.559, 2: 0.367, 1: 0.684
Group # 6 -- E: 0.652, P: 0.764, F: 0.255
Log likelihood = -196.203 Significance = 0.000

Run # 12, 7 cells:


Convergence at Iteration 8
Input 0.203
Group # 4 -- i: 0.392, r: 0.637
Group # 6 -- E: 0.617, P: 0.773, F: 0.254
Log likelihood = -199.980 Significance = 0.001

Run # 13, 12 cells:


Convergence at Iteration 13
Input 0.177
Group # 5 -- E: 0.547, A: 0.713, P: 0.105
Group # 6 -- E: 0.639, P: 0.729, F: 0.286
Log likelihood = -197.565 Significance = 0.000

Run # 14, 14 cells:


Convergence at Iteration 5
Input 0.208
Group # 6 -- E: 0.640, P: 0.822, F: 0.207
Group # 7 -- X: 0.535, I: 0.411, P: 0.485, A: 0.484
Log likelihood = -204.949 Significance = 0.681

Add Group # 3 with factors 321

---------- Level # 3 ----------

Run # 15, 31 cells:


Convergence at Iteration 8
Input 0.187
Group # 1 -- 2: 0.564, 1: 0.359, 4: 0.475, 3: 0.622
Group # 3 -- 3: 0.545, 2: 0.379, 1: 0.670
Group # 6 -- E: 0.640, P: 0.740, F: 0.277
Log likelihood = -193.058 Significance = 0.099

Run # 16, 28 cells:


Convergence at Iteration 8
Input 0.184
Group # 2 -- 3: 0.547, 4: 0.796, 6: 0.328, 1: 0.892
Group # 3 -- 3: 0.580, 2: 0.361, 1: 0.689
Group # 6 -- E: 0.628, P: 0.756, F: 0.266
Log likelihood = -186.211 Significance = 0.000

Run # 17, 18 cells:


Convergence at Iteration 10
Input 0.198
Group # 3 -- 3: 0.571, 2: 0.390, 1: 0.649
Group # 4 -- i: 0.445, r: 0.570
Group # 6 -- E: 0.634, P: 0.744, F: 0.275
Log likelihood = -195.266 Significance = 0.178

Run # 18, 24 cells:


Convergence at Iteration 12
Input 0.168
Group # 3 -- 3: 0.518, 2: 0.377, 1: 0.678
Group # 5 -- E: 0.520, A: 0.722, P: 0.121
Group # 6 -- E: 0.655, P: 0.652, F: 0.344
Log likelihood = -189.201 Significance = 0.001

Run # 19, 28 cells:


Convergence at Iteration 8
Input 0.197
Group # 3 -- 3: 0.569, 2: 0.366, 1: 0.684
Group # 6 -- E: 0.644, P: 0.759, F: 0.260
Group # 7 -- X: 0.535, I: 0.432, P: 0.482, A: 0.432
Log likelihood = -195.548 Significance = 0.727

Add Group # 2 with factors 3461

---------- Level # 4 ----------

Run # 20, 66 cells:


Convergence at Iteration 8
Input 0.173
Group # 1 -- 2: 0.565, 1: 0.354, 4: 0.470, 3: 0.631
Group # 2 -- 3: 0.545, 4: 0.804, 6: 0.327, 1: 0.904
Group # 3 -- 3: 0.557, 2: 0.375, 1: 0.673
Group # 6 -- E: 0.623, P: 0.730, F: 0.289
Log likelihood = -182.872 Significance = 0.086

Run # 21, 43 cells:


Convergence at Iteration 10
Input 0.184
Group # 2 -- 3: 0.545, 4: 0.797, 6: 0.329, 1: 0.915
Group # 3 -- 3: 0.592, 2: 0.387, 1: 0.649
Group # 4 -- i: 0.439, r: 0.578
Group # 6 -- E: 0.612, P: 0.734, F: 0.287
Log likelihood = -185.113 Significance = 0.148

Run # 22, 50 cells:


Convergence at Iteration 12
Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Log likelihood = -181.010 Significance = 0.008

Run # 23, 60 cells:


Convergence at Iteration 8
Input 0.184
Group # 2 -- 3: 0.547, 4: 0.792, 6: 0.328, 1: 0.896
Group # 3 -- 3: 0.587, 2: 0.361, 1: 0.687
Group # 6 -- E: 0.623, P: 0.753, F: 0.269
Group # 7 -- X: 0.521, I: 0.427, P: 0.495, A: 0.518
Log likelihood = -185.859 Significance = 0.872

Add Group # 5 with factors EAP

---------- Level # 5 ----------

Run # 24, 95 cells:


Convergence at Iteration 13
Input 0.154
Group # 1 -- 2: 0.541, 1: 0.408, 4: 0.443, 3: 0.599
Group # 2 -- 3: 0.545, 4: 0.782, 6: 0.334, 1: 0.889
Group # 3 -- 3: 0.530, 2: 0.375, 1: 0.679
Group # 5 -- E: 0.519, A: 0.675, P: 0.174
Group # 6 -- E: 0.633, P: 0.653, F: 0.349
Log likelihood = -179.247 Significance = 0.322

Run # 25, 66 cells:


Convergence at Iteration 13
Input 0.158
Group # 2 -- 3: 0.543, 4: 0.775, 6: 0.341, 1: 0.902
Group # 3 -- 3: 0.556, 2: 0.393, 1: 0.647
Group # 4 -- i: 0.443, r: 0.573
Group # 5 -- E: 0.523, A: 0.696, P: 0.146
Group # 6 -- E: 0.618, P: 0.636, F: 0.365
Log likelihood = -180.066 Significance = 0.177

Run # 26, 95 cells:


Convergence at Iteration 12
Input 0.157
Group # 2 -- 3: 0.545, 4: 0.765, 6: 0.339, 1: 0.881
Group # 3 -- 3: 0.551, 2: 0.370, 1: 0.681
Group # 5 -- E: 0.521, A: 0.702, P: 0.141
Group # 6 -- E: 0.627, P: 0.652, F: 0.351
Group # 7 -- X: 0.531, I: 0.415, P: 0.486, A: 0.520
Log likelihood = -180.443 Significance = 0.769

No remaining groups significant

Groups selected while stepping up: 6 3 2 5


Best stepping up run: #22
---------------------------------------------

Stepping down...

---------- Level # 7 ----------

Run # 27, 167 cells:


Convergence at Iteration 14
Input 0.155
Group # 1 -- 2: 0.538, 1: 0.440, 4: 0.418, 3: 0.563
Group # 2 -- 3: 0.546, 4: 0.774, 6: 0.335, 1: 0.903
Group # 3 -- 3: 0.546, 2: 0.388, 1: 0.656
Group # 4 -- i: 0.456, r: 0.556
Group # 5 -- E: 0.513, A: 0.689, P: 0.165
Group # 6 -- E: 0.618, P: 0.631, F: 0.369
Group # 7 -- X: 0.522, I: 0.437, P: 0.486, A: 0.560
Log likelihood = -178.400

---------- Level # 6 ----------

Run # 28, 118 cells:


Convergence at Iteration 13
Input 0.157
Group # 2 -- 3: 0.543, 4: 0.767, 6: 0.341, 1: 0.902
Group # 3 -- 3: 0.562, 2: 0.392, 1: 0.647
Group # 4 -- i: 0.446, r: 0.569
Group # 5 -- E: 0.520, A: 0.701, P: 0.143
Group # 6 -- E: 0.614, P: 0.630, F: 0.371
Group # 7 -- X: 0.528, I: 0.426, P: 0.486, A: 0.509
Log likelihood = -179.619 Significance = 0.489

Run # 29, 115 cells:


Convergence at Iteration 13
Input 0.163
Group # 1 -- 2: 0.531, 1: 0.456, 4: 0.425, 3: 0.547
Group # 3 -- 3: 0.528, 2: 0.390, 1: 0.657
Group # 4 -- i: 0.459, r: 0.553
Group # 5 -- E: 0.509, A: 0.723, P: 0.132
Group # 6 -- E: 0.636, P: 0.619, F: 0.374
Group # 7 -- X: 0.540, I: 0.428, P: 0.474, A: 0.467
Log likelihood = -186.554 Significance = 0.001

Run # 30, 131 cells:


Convergence at Iteration 14
Input 0.161
Group # 1 -- 2: 0.549, 1: 0.427, 4: 0.454, 3: 0.544
Group # 2 -- 3: 0.546, 4: 0.771, 6: 0.334, 1: 0.914
Group # 4 -- i: 0.400, r: 0.627
Group # 5 -- E: 0.523, A: 0.684, P: 0.160
Group # 6 -- E: 0.594, P: 0.663, F: 0.349
Group # 7 -- X: 0.524, I: 0.444, P: 0.482, A: 0.563
Log likelihood = -182.830 Significance = 0.013

Run # 31, 152 cells:


Convergence at Iteration 13
Input 0.154
Group # 1 -- 2: 0.541, 1: 0.409, 4: 0.446, 3: 0.598
Group # 2 -- 3: 0.546, 4: 0.776, 6: 0.334, 1: 0.891
Group # 3 -- 3: 0.534, 2: 0.375, 1: 0.677
Group # 5 -- E: 0.517, A: 0.681, P: 0.171
Group # 6 -- E: 0.624, P: 0.646, F: 0.356
Group # 7 -- X: 0.524, I: 0.428, P: 0.486, A: 0.571
Log likelihood = -178.807 Significance = 0.385

Run # 32, 133 cells:


Convergence at Iteration 11
Input 0.175
Group # 1 -- 2: 0.564, 1: 0.374, 4: 0.451, 3: 0.607
Group # 2 -- 3: 0.546, 4: 0.802, 6: 0.326, 1: 0.914
Group # 3 -- 3: 0.570, 2: 0.386, 1: 0.655
Group # 4 -- i: 0.468, r: 0.541
Group # 6 -- E: 0.609, P: 0.723, F: 0.297
Group # 7 -- X: 0.512, I: 0.450, P: 0.494, A: 0.571
Log likelihood = -182.402 Significance = 0.019

Run # 33, 140 cells:


Convergence at Iteration 11
Input 0.163
Group # 1 -- 2: 0.532, 1: 0.441, 4: 0.422, 3: 0.572
Group # 2 -- 3: 0.546, 4: 0.768, 6: 0.334, 1: 0.922
Group # 3 -- 3: 0.580, 2: 0.378, 1: 0.664
Group # 4 -- i: 0.432, r: 0.587
Group # 5 -- E: 0.486, A: 0.756, P: 0.120
Group # 7 -- X: 0.532, I: 0.411, P: 0.481, A: 0.568
Log likelihood = -181.503 Significance = 0.046

Run # 34, 107 cells:


Convergence at Iteration 13
Input 0.156
Group # 1 -- 2: 0.538, 1: 0.443, 4: 0.412, 3: 0.561
Group # 2 -- 3: 0.545, 4: 0.780, 6: 0.335, 1: 0.902
Group # 3 -- 3: 0.544, 2: 0.388, 1: 0.656
Group # 4 -- i: 0.452, r: 0.561
Group # 5 -- E: 0.515, A: 0.685, P: 0.168
Group # 6 -- E: 0.625, P: 0.635, F: 0.364
Log likelihood = -178.759 Significance = 0.868

Cut Group # 7 with factors XIPA

---------- Level # 5 ----------

Run # 35, 66 cells:


Convergence at Iteration 13
Input 0.158
Group # 2 -- 3: 0.543, 4: 0.775, 6: 0.341, 1: 0.902
Group # 3 -- 3: 0.556, 2: 0.393, 1: 0.647
Group # 4 -- i: 0.443, r: 0.573
Group # 5 -- E: 0.523, A: 0.696, P: 0.146
Group # 6 -- E: 0.618, P: 0.636, F: 0.365
Log likelihood = -180.066 Significance = 0.462

Run # 36, 66 cells:


Convergence at Iteration 14
Input 0.165
Group # 1 -- 2: 0.531, 1: 0.462, 4: 0.409, 3: 0.545
Group # 3 -- 3: 0.520, 2: 0.392, 1: 0.655
Group # 4 -- i: 0.453, r: 0.560
Group # 5 -- E: 0.511, A: 0.717, P: 0.136
Group # 6 -- E: 0.645, P: 0.628, F: 0.365
Log likelihood = -187.281 Significance = 0.001

Run # 37, 74 cells:


Convergence at Iteration 14
Input 0.162
Group # 1 -- 2: 0.550, 1: 0.428, 4: 0.449, 3: 0.543
Group # 2 -- 3: 0.545, 4: 0.777, 6: 0.336, 1: 0.916
Group # 4 -- i: 0.397, r: 0.631
Group # 5 -- E: 0.525, A: 0.680, P: 0.162
Group # 6 -- E: 0.599, P: 0.666, F: 0.345
Log likelihood = -183.187 Significance = 0.013

Run # 38, 95 cells:


Convergence at Iteration 13
Input 0.154
Group # 1 -- 2: 0.541, 1: 0.408, 4: 0.443, 3: 0.599
Group # 2 -- 3: 0.545, 4: 0.782, 6: 0.334, 1: 0.889
Group # 3 -- 3: 0.530, 2: 0.375, 1: 0.679
Group # 5 -- E: 0.519, A: 0.675, P: 0.174
Group # 6 -- E: 0.633, P: 0.653, F: 0.349
Log likelihood = -179.247 Significance = 0.332

Run # 39, 79 cells:


Convergence at Iteration 10
Input 0.175
Group # 1 -- 2: 0.564, 1: 0.376, 4: 0.448, 3: 0.605
Group # 2 -- 3: 0.545, 4: 0.803, 6: 0.327, 1: 0.912
Group # 3 -- 3: 0.568, 2: 0.386, 1: 0.655
Group # 4 -- i: 0.465, r: 0.545
Group # 6 -- E: 0.615, P: 0.723, F: 0.296
Log likelihood = -182.608 Significance = 0.022

Run # 40, 81 cells:


Convergence at Iteration 11
Input 0.165
Group # 1 -- 2: 0.530, 1: 0.448, 4: 0.412, 3: 0.569
Group # 2 -- 3: 0.545, 4: 0.779, 6: 0.334, 1: 0.920
Group # 3 -- 3: 0.576, 2: 0.379, 1: 0.663
Group # 4 -- i: 0.424, r: 0.597
Group # 5 -- E: 0.489, A: 0.754, P: 0.119
Log likelihood = -182.192 Significance = 0.036

Cut Group # 1 with factors 2143

---------- Level # 4 ----------

Run # 41, 36 cells:


Convergence at Iteration 14
Input 0.167
Group # 3 -- 3: 0.530, 2: 0.397, 1: 0.647
Group # 4 -- i: 0.449, r: 0.566
Group # 5 -- E: 0.519, A: 0.723, P: 0.122
Group # 6 -- E: 0.640, P: 0.629, F: 0.366
Log likelihood = -188.353 Significance = 0.001

Run # 42, 42 cells:


Convergence at Iteration 13
Input 0.164
Group # 2 -- 3: 0.543, 4: 0.770, 6: 0.340, 1: 0.915
Group # 4 -- i: 0.390, r: 0.639
Group # 5 -- E: 0.532, A: 0.694, P: 0.137
Group # 6 -- E: 0.595, P: 0.666, F: 0.346
Log likelihood = -184.156 Significance = 0.017

Run # 43, 50 cells:


Convergence at Iteration 12
Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Log likelihood = -181.010 Significance = 0.177

Run # 44, 43 cells:


Convergence at Iteration 10
Input 0.184
Group # 2 -- 3: 0.545, 4: 0.797, 6: 0.329, 1: 0.915
Group # 3 -- 3: 0.592, 2: 0.387, 1: 0.649
Group # 4 -- i: 0.439, r: 0.578
Group # 6 -- E: 0.612, P: 0.734, F: 0.287
Log likelihood = -185.113 Significance = 0.008

Run # 45, 43 cells:


Convergence at Iteration 10
Input 0.168
Group # 2 -- 3: 0.542, 4: 0.776, 6: 0.341, 1: 0.920
Group # 3 -- 3: 0.593, 2: 0.384, 1: 0.653
Group # 4 -- i: 0.413, r: 0.611
Group # 5 -- E: 0.494, A: 0.763, P: 0.106
Log likelihood = -183.521 Significance = 0.035

Cut Group # 4 with factors ir

---------- Level # 3 ----------

Run # 46, 24 cells:


Convergence at Iteration 12
Input 0.168
Group # 3 -- 3: 0.518, 2: 0.377, 1: 0.678
Group # 5 -- E: 0.520, A: 0.722, P: 0.121
Group # 6 -- E: 0.655, P: 0.652, F: 0.344
Log likelihood = -189.201 Significance = 0.001

Run # 47, 27 cells:


Convergence at Iteration 14
Input 0.170
Group # 2 -- 3: 0.548, 4: 0.761, 6: 0.336, 1: 0.865
Group # 5 -- E: 0.554, A: 0.687, P: 0.122
Group # 6 -- E: 0.610, P: 0.737, F: 0.285
Log likelihood = -189.412 Significance = 0.000

Run # 48, 28 cells:


Convergence at Iteration 8
Input 0.184
Group # 2 -- 3: 0.547, 4: 0.796, 6: 0.328, 1: 0.892
Group # 3 -- 3: 0.580, 2: 0.361, 1: 0.689
Group # 6 -- E: 0.628, P: 0.756, F: 0.266
Log likelihood = -186.211 Significance = 0.008

Run # 49, 28 cells:


Convergence at Iteration 10
Input 0.170
Group # 2 -- 3: 0.547, 4: 0.774, 6: 0.333, 1: 0.892
Group # 3 -- 3: 0.582, 2: 0.344, 1: 0.712
Group # 5 -- E: 0.484, A: 0.785, P: 0.093
Log likelihood = -186.140 Significance = 0.008

All remaining groups significant

Groups eliminated while stepping down: 7 1 4


Best stepping up run: #22
Best stepping down run: #43

Vejamos agora como interpretar esses resultados:


O programa comea com o Stepping up. No nvel 0, ele apresenta o input inicial (0.284), que
corresponde ao percentual total da regra de aplicao (28,4% para a variante I futuro perifrstico). O
input representa o nvel geral de uso de determinado valor da varivel dependente (GUY; ZILLES, 2007,
p. 238).
Em seguida, o programa apresenta vrios nveis de anlise. No nvel 1, ele roda cada grupo
isoladamente. No nvel 2, roda os grupos dois a dois; no nvel 3, cruza os grupos trs a trs e assim por
diante. Nesta rodada, o programa identificou os pesos no nvel 5 da rodada, aps constatar que no h mais
grupos significativos. Assim, ele selecionou como estatisticamente significativos, nesta ordem, os grupos
6, 3, 2 e 5. E indica que os melhores resultados esto na tabela 22.

No remaining groups significant

Groups selected while stepping up: 6 3 2 5


Best stepping up run: #22
---------------------------------------------

Eis os melhores resultados:

Run # 22, 50 cells:


Convergence at Iteration 12
Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Log likelihood = -181.010 Significance = 0.008

Embora os grupos apaream em ordem crescente aqui, a anlise deve considerar a ordem de
seleo. Assim, so importantes para a aplicao da regra de futuro perifrstico: 1 o tipo de verbo (grupo
6), 2 a conjugao verbal (grupo 3), 3 a pessoa verbal (grupo 2) e o tipo de sujeito (grupo 5).
Observemos que o input final foi de 0.158, ou seja, o programa corrigiu algum desequilbrio na
amostra. O log likelihood foi de -181.010 e o nvel de significncia foi 0.008. O log likelihood, logaritmo
de verossimilhana, mede a aproximao entre o modelo e os dados observados. Seu valor varia em funo
da quantidade de dados e o nmero de aplicaes do modelo em cada clula (para mais detalhes, cf. GUY;
ZILLES, 2007). Quanto maior o log likelihood, maior a robustez dos dados. O nvel de significncia o
nvel de confiabilidade dos resultados. Para as cincias humanas, o nvel mximo aceitvel de 0.050. No
nosso caso, os resultados so confiveis!
Aps a seleo do Stepping up, o programa comea o Stepping down. Aqui, ele comea com todos
os grupos e vai retirando cada um, depois retira dois, depois retira trs e assim por diante. como se fosse
a prova dos nove dos clculos. Ao final, apresenta os grupos eliminados, aps constatar no existirem mais
grupos relevantes:

All remaining groups significant

Groups eliminated while stepping down: 7 1 4


Best stepping up run: #22
Best stepping down run: #43

Neste caso, ele eliminou os grupos 7, 1 e 4, exatamente os que no foram selecionados no Stepping
up. E volta a dizer que os melhores resultados esto nas tabelas 22 e 43, cujos pesos relativos so os
mesmos para todos os fatores:

Run # 22, 50 cells:


Convergence at Iteration 12
Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Log likelihood = -181.010 Significance = 0.008

Run # 43, 50 cells:


Convergence at Iteration 12
Input 0.158
Group # 2 -- 3: 0.545, 4: 0.773, 6: 0.338, 1: 0.878
Group # 3 -- 3: 0.544, 2: 0.370, 1: 0.683
Group # 5 -- E: 0.525, A: 0.696, P: 0.143
Group # 6 -- E: 0.633, P: 0.660, F: 0.343
Log likelihood = -181.010 Significance = 0.177

Observao importante: acontece s vezes de um grupo ser selecionado e depois ser descartado. Isso indica
que o programa no tem certeza da sua importncia. Vale a pena olhar o comportamento desse grupo em
cada rodada (run) em que ele aparece e verificar se h grandes mudanas nos pesos dos seus fatores.
Detectada essa mudana repentina de pesos, observe o grupo de fatores que foi adicionado na rodada, pois,
possivelmente, ocorre interao (para mais informaes, cf. GUY; ZILLES, 2007).

De posse dos resultados, agora s montar as tabelas com os resultados de cada grupo (nmero de
ocorrncias/total, percentual e peso relativo) e explic-los linguisticamente, sempre luz de uma teoria
lingustica e da intuio do pesquisador, comeando sempre pela hiptese aventada. Os nmeros sozinhos
nada dizem, preciso que expliquemos por que tal(is) varivel(is) e/ou tal(is) fator(es) favorece(m) ou
desfavorece(m) a aplicao da regra! No esquea de colocar exemplos na anlise! Lembre-se tambm de
apresentar os casos categricos (knockouts). Normalmente, usamos apenas duas casas decimais (com
aproximao matemtica) e eliminamos o zero inicial. Ex: Grupo 5, fator A (sujeito agente), o peso
0.696; dizemos ento que .70. Recomenda-se tambm o uso de grficos ilustrativos, sobretudo para
variveis sociais.
Para ver uma anlise sociolingustica pronta, vejamos o artigo a seguir, em que, alm dos resultados
vistos aqui (para o jornal A Tarde), h os resultados para mais duas rodadas, uma do jornal Correio da
Bahia e outra do jornal Tribuna da Bahia. O trabalho foi apresentado no XV Congresso da ALFAL, em
agosto de 2008, em Montevideo.
Agora, bom trabalho nas suas pesquisas!
XV Congreso Internacional de la Asociacin de Lingustica y Filologa de Amrica Latina ALFAL (Montevideo, 18 a 21 de
agosto de 2008)

Qual o futuro da Bahia?


Josane Moreira de Oliveira2
(Universidade Estadual de Feira de Santana / Brasil)

Introduo

A expresso do futuro verbal na histria do portugus um fenmeno varivel tanto na fala quanto
na escrita. Para exprimir o tempo posterior ao momento da fala, podem-se usar as seguintes variantes: a) o
futuro simples (eu farei isso amanh); b) o futuro perifrstico com haver de no presente + infinitivo (eu hei
de fazer isso amanh); c) o futuro perifrstico com haver de no futuro + infinitivo (eu haverei de fazer isso
amanh); d) o futuro perifrstico com ir no presente + infinitivo (eu vou fazer isso amanh); e) o futuro
perifrstico com ir no futuro + infinitivo (eu irei fazer isso amanh); f) o presente (eu fao isso amanh).
As perfrases com haver de + infinitivo perduram at o sculo XIX, quando comeam a ceder espao para
as perfrases com ir + infinitivo. O presente do indicativo parece ter um contexto bastante prprio e tem se
mantido, ao longo do tempo, mais ou menos estvel (OLIVEIRA, 2006). J o processo de mudana futuro
simples > futuro perifrstico com ir + infinitivo est bastante avanado (e mesmo j quase concludo) na
modalidade falada e comea a invadir a modalidade escrita. Essa variao no exclusiva do portugus;
atestada em muitas outras lnguas. O uso do verbo ir como auxiliar de futuro combinado com o infinitivo e
a gramaticalizao dessa forma perifrstica so documentados tambm em ingls (I am going to sleep), em
francs (Je vais dormir) e em espanhol (Yo voy a dormir), por exemplo. Todavia, mesmo sendo esse
fenmeno bastante conhecido e no discriminado pelos falantes, as gramticas tradicionais e os manuais
escolares de lngua portuguesa ainda registram apenas o futuro simples. Com base em dados
contemporneos de jornais baianos (A Tarde, Tribuna da Bahia e Correio da Bahia) direcionados a
pblicos distintos, investiga-se a implementao da forma perifrstica na escrita considerada culta ou
padro, tomando como quadro terico-metodolgico a sociolingustica quantitativa laboviana e a hiptese
da gramaticalizao nos moldes propostos por Hopper & Traugott (2003).

1. Quadro terico

A sociolingustica variacionista pressupe que a variao inerente a toda e qualquer lngua e no


aleatria ou fortuita. Ao contrrio, condicionada por fatores lingusticos e sociais. Ou seja, tanto a

2
Participaram desta pesquisa as estudantes Isabella Almeida de Souza e Viviane Moreira de Oliveira, a quem agradeo pela
valiosa colaborao, respectivamente, na coleta e na digitao dos dados.
variao como a mudana lingusticas tm ligaes estreitas com fenmenos extralingusticos que as
condicionam.
O funcionalismo lingustico analisa a lngua enquanto fenmeno comunicativo e discursivo. Sendo
a noo de tempo uma categoria lingustica e suas relaes com o tempo cronolgico uma funo da
comunicao e do discurso, uma abordagem funcionalista pode embasar teoricamente a anlise da
expresso de futuro no portugus, que pode ser realizada atravs de formas simples ou de formas
analticas/perifrsticas.
O tempo futuro expressa a expectativa de alguma ao (processo ou evento) a ser verificada mais
tarde, aps o ato de fala. Ele tem um valor temporal que no permite expressar uma modalidade factual,
pois s aceita asseres segundo a avaliao feita pelo falante da (im)possibilidade de ocorrncia de um
estado de coisas. Assim, h um valor modal aliado ao fator temporal no futuro que compromete a
determinao do valor de verdade da proposio enunciada. Segundo Cmara Jr. (1957, p. 223), a
categoria de futuro no ocorre pela necessidade da expresso temporal; concretizam-no certas
necessidades modais, de sorte que o futuro comea como modo muito mais do que como tempo.
O ciclo de alternncia entre formas simples e formas perifrsticas de futuro uma constante na
histria das lnguas romnicas. J no prprio latim, o futuro desinencial adveio de formas modais analticas
(cantare habeo > cantar hei > cantarei). Para Cmara Jr., a nova forma de futuro criada ainda no latim
desempenha trs funes na lngua: a) marca o modo; b) marca tempo com matiz modal; e c) marca tempo.
O autor fala em gramaticalizao do futuro modal em futuro temporal.
Neste trabalho, admite-se a hiptese de que o processo que aconteceu no latim (forma analtica >
forma sinttica) est sendo invertido no portugus atual (forma sinttica > forma analtica) a partir da
gramaticalizao do verbo ir, que passa, j em estgios anteriores da lngua, de forma plena a marca
morfossinttica de futuro.
A perfrase a forma verbal inovadora, que convive com a forma simples (conservadora). Trata-se,
pois, de um fenmeno varivel no portugus em que a variante perifrstica, concorrente da forma sinttica
para codificar a funo que situa a ao ou o processo direita do ponto da fala, muito pouco
discriminada. E a entrada do verbo ir como auxiliar na perfrase para expressar o futuro vem encontrando
resposta positiva entre os falantes.
Os verbos de movimento, em geral, so polissmicos e superpem, dentre outras, as noes de
espao e de tempo. O verbo ir um dos verbos mais polissmicos e, pois, um dos mais gramaticalizveis.
Na construo perifrstica com o infinitivo, ele tende a se transformar em auxiliar (HEINE, 1993; BYBEE
et alii, 1994; HEINE & KUTEVA, 2002), quer dizer, num instrumento gramatical para a expresso do
tempo futuro. Essa tendncia, bem conhecida no ingls, no francs e no espanhol, pode ser constatada
tambm em portugus, em que, na fala, o processo de substituio da forma de futuro simples pela forma
perifrstica ir + infinitivo est quase concludo (OLIVEIRA, 2006).
2. Amostra e metodologia

Por meio da anlise controlada de dados coletados em jornais contemporneos baianos, com base
na sociolingustica laboviana, verifica-se a implementao da perfrase com ir + infinitivo, identificando-se
os contextos lingusticos do seu espraiamento. Nesta pesquisa, observa-se o papel de alguns grupos de
fatores (medido em termos de percentuais e de pesos relativos a partir da ferramenta GoldVarb): a) a
extenso fonolgica do verbo; b) a conjugao verbal; c) o paradigma verbal; d) a pessoa verbal; e) o tipo
de sujeito; f) a animacidade do sujeito; g) o papel temtico do sujeito; h) o tipo de verbo; i) a transitividade
verbal; j) a presena/ausncia de clticos; k) a natureza semntica do verbo; l) a indicao de tempo futuro
fora do verbo; m) a projeo de futuridade; n) o paralelismo sinttico-discursivo; o) o tipo de peridico; e
p) o gnero textual.
Foram examinados: a) dois exemplares do jornal A Tarde, de 07/06/07 e de 03/08/07, considerado
um peridico direcionado a um pblico mais elitizado; b) dois exemplares do jornal Correio da Bahia, de
28/11/07 e de 20/12/07, considerado um peridico direcionado classe mdia; e c) dois exemplares do
jornal Tribuna da Bahia, de 23/08/07 e de 08 e 09/12/07, considerado um peridico mais popular.
Foram coletados, inicialmente, 2575 dados de quatro variantes: futuro simples, futuro perifrstico
com ir + infinitivo, futuro perifrstico com haver de + infinitivo e presente. Como s houve 4 dados com
haver de + infinitivo, todos num mesmo exemplar de peridico, essas ocorrncias foram retiradas da
amostra final. Quanto perfrase com ir + infinitivo, houve 27 ocorrncias com o verbo ir no futuro, que,
pela sua baixa frequncia, foram computadas juntamente com as formas de ir no presente + infinitivo.
Assim, os resultados encontrados esto apresentados na Tabela 1:

Tabela 1: Distribuio das variantes na lngua escrita por peridico


Variantes Peridico Total
A Tarde Correio da Tribuna da
Bahia Bahia
Futuro simples 473 624 339 1436
49% 66% 52% 56%
Ir + infinitivo 197 145 146 488
20% 16% 22% 19%
Presente 306 173 168 647
31% 18% 26% 25%
Total 976 942 653 2571

Para esta comunicao, em particular, foram excludas as formas de presente com valor de futuro,
embora tenham apresentado percentuais maiores que a forma perifrstica, por duas razes: a) com base em
resultados de trabalhos anteriores (OLIVEIRA, 2006), essa variante possui contextos bem especficos,
mantm ndices de uso mais ou menos estveis na histria da lngua e est margem da concorrncia
futuro simples X futuro perifrstico; e b) objetiva-se verificar, aqui, a implementao da forma perifrstica
em substituio forma de futuro na lngua escrita, j que na lngua falada esse processo j se encontra em
fase de compleio (OLIVEIRA, 2006).
Assim, considerando apenas os dados das variantes em concorrncia (1924 dados), a distribuio
a seguinte:

Tabela 2: Redistribuio das variantes na lngua escrita por peridico


Variantes Peridico
A Tarde Correio da Tribuna da
Bahia Bahia
Futuro simples 473 624 339
71% 81% 70%
Ir + infinitivo 197 145 146
29% 19% 30%
Total 670 769 485

Numa anlise inicial, olhando os dados globalmente, embora predomine o futuro simples na escrita
jornalstica, pode-se verificar que a concorrncia entre as duas variantes documentada nos trs
peridicos, e em ndices bastante prximos (variando de 19% a 30% o percentual de uso da forma
perifrstica), conforme ilustra o Grfico 1, a seguir:

Grfico 1: Variantes por peridico (percentuais)

100
90
80
70
60
50
Futuro simples
40
30 Futuro perifrstico
20
10
0
A Tarde Correio da Tribuna da
Bahia Bahia

3. Anlise dos dados

Primeiramente, os dados foram submetidos a uma rodada que considerou os diferentes peridicos
como uma varivel independente com o objetivo de verificar o papel desse grupo de fatores, que no foi
selecionado pelo GoldVarb. A regra de aplicao foi o uso da forma perifrstica, variante inovadora em
fase de implementao na modalidade escrita da lngua. Dos 1924 dados, 488 (25%) foram de perfrase.
De todos os grupos controlados, nove foram selecionados, nesta ordem: 1. natureza semntica do verbo; 2.
gnero textual; 3. pessoa verbal; 4. paradigma verbal; 5. paralelismo sinttico-discursivo; 6. tipo de verbo;
7. indicao de tempo futuro fora do verbo; 8. papel temtico do sujeito; e 9. tipo de sujeito.
O fato de a varivel tipo de peridico no ter sido selecionada significa que no h diferena
estatstica significativa entre o uso da perfrase e o tipo de jornal, ou seja, ela est presente nos trs
peridicos, independentemente de ser o jornal mais ou menos elitizado. E essa informao, embora
contrarie a hiptese inicial (a de que haveria mais perfrase no peridico mais popular e menos perfrase no
peridico mais elitizado), muito importante para medir o grau de implementao dessa forma na escrita
jornalstica baiana.
Embora estatisticamente no seja relevante o tipo de jornal, linguisticamente importante verificar
as diferenas dos resultados dos trs peridicos para conhecer os contextos iniciais de espraiamento da
variante analisada. Assim, foram feitas rodadas separadas, por peridico, e o resultado est ilustrado na
Tabela 3, a seguir:

Tabela 3: Dados de perfrase por peridico


A Tarde Correio da Bahia Tribuna da Bahia
Ocorrncias/Total 197/670 145/769 146/485
Percentual 29% 19% 30%
Input inicial .29 .19 .30
Significncia 0,037 0,027 0,021
Grupos 1. Natureza 1. Natureza 1. Natureza
selecionados semntica do verbo semntica do verbo semntica do verbo
2. Paradigma verbal 2. Gnero textual 2. Paradigma verbal
3. Pessoa verbal 3. Paralelismo 3. Pessoa verbal
4. Gnero textual sinttico-discursivo 4. Projeo de
5. Papel temtico do 4. Pessoa verbal futuridade
sujeito 5. Paradigma verbal 5. Tipo de sujeito
6. Tipo de verbo 6. Transitividade 6. Indicao de tempo
7. Animacidade do verbal futuro fora do verbo
sujeito 7. Tipo de sujeito
8. Extenso
fonolgica do verbo

De acordo com os resultados do GoldVarb, no peridico mais elitizado, a perfrase se implementa


na escrita com verbos que expressam ao ou processo, verbos regulares, com sujeito de 1 pessoa, em
textos do tipo colunas, quadrinhos, resumos e manchetes, com sujeito [+ agente], com o verbo ser e com
sujeito [+ animado]. No peridico considerado intermedirio, o contexto de entrada da forma inovadora
com verbos que tambm indicam ao ou processo, em textos do tipo matria e resumo, em ocorrncias
isoladas, tambm com sujeito de 1 pessoa, tambm com verbos regulares, com verbos intransitivos, com
sujeitos oracionais ou desinenciais e com verbos extensos fonologicamente (3 slabas ou mais). Quanto ao
jornal mais popular, a forma perifrstica mais usada com verbos cognitivos, tambm com verbos
regulares, tambm com sujeito de 1 pessoa, para expressar um futuro imediato (com ao a ser realizada
nas prximas 24 horas), tambm com sujeitos oracionais e na presena de uma orao adverbial.
Nos trs jornais analisados, trs grupos foram selecionados em comum: a natureza semntica do
verbo, o paradigma verbal e a pessoa verbal. Os resultados para essas variveis esto apresentados e
comentados a seguir.

3.1. Natureza semntica do verbo

Esse grupo de fatores controla o tipo semntico dos verbos, distribuindo-os em verbos que indicam
processo, ao ou movimento, verbos que denotam evento, verbos de estado e verbos cognitivos ou que
expressam um estado psicolgico. Seguem exemplos de cada um desses tipos de verbo:

Processo
(1) Foi to bom e to aplaudido o show do cantor Billy Paul em Salvador, que, a pedido, ele est
retornando para o Othon, onde VAI SE APRESENTAR durante jantar na noite de tera-feira,
fazendo uma homenagem toda especial aos namorados. [AT 1, c.2, p.2, col.]
Evento
(2) (...) os climatologistas dizem o que VAI ACONTECER se o aumento global continuar no ritmo
atual. [CB 1, c.4, p.10, not.]
Estado
(3) Mesmo suspenso, Alysson ainda VAI FICAR de molho por um ms, depois de sofrer diante do
Coritiba uma luxao no cotovelo. [AT 2, ec, p.5, not.]
Cognio
(4) Ao invs de met-los na cadeia, arruma-se uma frmula deles se sarem numa boa custa do
torcedor otrio que VAI PENSAR, certamente, que o Bahia, o Vitria, a Catuense e tantos outros
times baianos sero beneficiados. [TB1, c.1, p.2, mat.]

A hiptese levantada para esse grupo era a de que o futuro perifrstico se implementasse pelos
verbos que denotam processo, j que o verbo ir, sendo um verbo de movimento, exprime uma ao que
envolve dois momentos, o de partida e o de chegada. A literatura sobre a gramaticalizao do verbo ir
mostra que o fenmeno ocorre principalmente com esse tipo de verbos, j que implicam alterao entre
dois momentos temporais. Esperava-se tambm que os verbos de estado inibissem o uso do futuro
perifrstico, favorecendo, portanto, o emprego do futuro simples, como atestado por outros trabalhos,
como, por exemplo, o de Malvar (2003).
Em dois tipos de jornal (A Tarde e Correio da Bahia), os resultados encontrados revelam que, de
fato, o maior percentual e o maior peso relativo de uso do futuro perifrstico ocorrem com verbos que
indicam processo, seguidos dos verbos que denotam evento, como se v na Tabela 4, a seguir:
Tabela 4: Uso da perfrase e natureza semntica do verbo por peridico
Fator A Tarde Correio da Bahia Tribuna da Bahia
Oc./Total PR Oc./Total PR Oc./Total PR
% % %
Evento 24/87 .51 29/152 .63 21/56 .64
27% 19% 37%
Processo 146/257 .56 99/219 .74 96/191 .66
56% 45% 50%
Estado 27/324 .45 15/396 .31 24/232 .32
8% 3% 10%
Cognio 0/2 - 2/2 - 5/6 .91
0% 100% 83%
Oc. = ocorrncias PR = Peso relativo

J no peridico Tribuna da Bahia, contrariando a hiptese aventada, o maior percentual e o maior


peso relativo ocorrem para os verbos cognitivos, seguidos dos verbos que expressam um processo e dos
que denotam evento. Mas os dados com verbos cognitivos so muito poucos para que explicaes mais
conclusivas sejam dadas. Houve dois dados apenas no jornal A Tarde (ambos com futuro simples) e no
jornal Correio da Bahia (ambos com futuro perifrstico). No jornal Tribuna da Bahia, houve seis dados,
cinco dos quais com a perfrase.
Assim, deixando de lado os verbos cognitivos, por ora, o que se pode dizer que, na escrita
jornalstica baiana, a mudana se implementa pelos verbos que indicam processo, seguidos dos verbos que
denotam evento, sendo os verbos de estado os que mantm o futuro simples, o que condiz com a literatura
sobre o processo de gramaticalizao do verbo ir.

3.2. Paradigma verbal

Esta varivel distribui os dados em dois grupos: os que contm um verbo que segue o paradigma
geral (verbos regulares) e os que apresentam um verbo de padro especial (verbos irregulares),
considerando, pois, o critrio morfolgico. Por exemplo, so verbos regulares cantar, beber e partir e
so irregulares os verbos estar, trazer e pedir. Supondo que h uma mudana em curso no sentido de
o futuro perifrstico substituir o futuro simples, aventou-se a hiptese de que esse processo avanaria
primeiro nas formas regulares e depois nas irregulares. Essa hiptese se confirma nos dados dos trs tipos
de peridico, tanto em termos percentuais como em pesos relativos, conforme evidenciado na Tabela 5:
Tabela 5: Uso da perfrase e paradigma verbal por peridico
Fator A Tarde Correio da Bahia Tribuna da Bahia
Oc./Total PR Oc./Total PR Oc./Total PR
% % %
Regular 158/303 .69 113/333 .61 117/231 .68
52% 33% 50%
Irregular 39/367 .34 32/436 .42 29/254 .33
10% 7% 11%
Oc. = ocorrncias PR = Peso relativo
So os verbos regulares os que favorecem a aplicao da regra de perfrase, ficando o futuro
simples mais restrito aos verbos irregulares, ou seja, os que tm um padro morfolgico especial. Esses
verbos, segundo Bybee (2003), por terem uma frequncia alta de uso na lngua, resistem a mudanas e,
sendo estocados na memria do falante como nicos (especiais), mantm o futuro simples, pois no
seguem padres gerais.

3.3. Pessoa verbal

Como mencionado frequentemente na literatura sobre a expresso do futuro verbal em portugus,


as formas de presente e de perfrase com ir + infinitivo exprimem um maior grau de certeza da realizao
do estado de coisas no futuro. Essa maior possibilidade ou maior probabilidade de acontecimento de algo
est intimamente ligada ao envolvimento ou comprometimento do falante em relao ao enunciado que
profere. Assim, assumiu-se como hiptese que os sujeitos de primeira pessoa favoreceriam o uso da forma
inovadora, expressando um maior investimento para a concretizao da ao futura.
Observem-se os exemplos a seguir:
(5) O leitor me desculpe, mas no VOU FAZER o histrico porque precisaria de pesquisar mais a
fundo. [TB 1, c.1, p.2, mat.]
(6) J estamos a par da reintegrao desde segunda-feira, VAMOS VER quais as propostas do
governo do Estado e da Suzano na reunio de amanh... [AT 2, c.1, p.12, mat.]
Os resultados encontrados nesta pesquisa esto apresentados na Tabela 6:

Tabela 6: Uso da perfrase e pessoa verbal por peridico


Fator A Tarde Correio da Bahia Tribuna da Bahia
Oc./Total PR Oc./Total PR Oc./Total PR
% % %
P1 3/4 .90 12/15 .85 9/14 .88
75% 80% 64%
P3 138/426 .54 97/529 .48 102/322 .51
32% 18% 31%
P4 21/33 .73 14/19 .87 13/22 .89
63% 73% 59%
P6 35/206 .37 22/206 .47 22/127 .34
16% 10% 17%
Oc. = ocorrncias PR = Peso relativo

Como se pode ver na Tabela 6, a primeira pessoa (P1 = eu; P4 = ns) apresenta maior peso relativo
e maior percentual no uso da perfrase. Esse fato revela um maior comprometimento do sujeito com a
realizao do processo verbal a se concretizar no futuro.
Note-se que os dados de primeira pessoa so muito poucos em relao aos de terceira pessoa, mais
tpicos nesse tipo de escrita. Em geral, os dados de 1 pessoa aparecem em citaes de fala para ilustrar os
textos jornalsticos. De qualquer forma, percebe-se que o jornalista no corrige a fala dos entrevistados,
pelo menos no que tange ao fenmeno aqui estudado, o que corrobora o fato de que a perfrase est para a
fala assim como o futuro simples est para a escrita (pelo menos a escrita formal).
Em pesquisa anterior (OLIVEIRA, 2006), foram analisados dados de fala de informantes
considerados cultos, isto , todos com nvel superior completo e os resultados apontam a preferncia de uso
da forma perifrstica em detrimento da forma simples. Comparando os resultados gerais de fala e escrita
(ambas as modalidades em sua forma considerada culta ou padro), observa-se uma inverso parcial no uso
das variantes concorrentes. Veja-se a Tabela 7, a seguir, com o acrscimo dos dados de jornais de 2007:

Tabela 7: Comparao de dados de fala e de escrita


Variantes Fala* Escrita
EF DID DID Jornais** Jornais** Jornais
(anos 70) (anos 70) (anos 90) (anos 70) (anos 90) (2007)
Futuro 82 25 5 71 51 1436
simples 19% 13% 4% 91% 73% 75%
Futuro 358 164 137 7 19 488
perifrstico 81% 87% 96% 9% 27% 25%
Total 440 189 142 78 70 1924
3
* Dados do Projeto NURC
** S textos de editoriais
EF = elocuo formal
DID = dilogo entre informante e documentador

Analisando a Tabela 7, percebe-se que os dados confirmam a inverso parcial das duas variantes
em relao s modalidades da lngua: o futuro perifrstico mais usado na fala e o futuro simples mais
usado na escrita. Comparando os dados dos anos 70 com os dados dos anos 90, observa-se um aumento no
uso da perfrase na fala e um decrscimo no uso do futuro simples na escrita. Ou seja, o uso da perfrase
quase categrico na fala e comea a se implementar na escrita.

Concluses

A partir do controle de vrios grupos de fatores lingusticos e extralingusticos, com o intuito de


verificar os contextos de condicionamento do uso das variantes futuro simples e futuro perifrstico,
constatou-se que o futuro simples ainda prevalece na lngua escrita jornalstica. Todavia a forma
perifrstica vem se implementando na modalidade escrita e o seu contexto de entrada o que envolve
verbos que exprimem processo/ao/movimento, verbos regulares e sujeitos de 1 pessoa (sobretudo
quando h dados de fala reproduzidos nos jornais). Considerando trs tipos de jornais voltados para
pblicos diferentes, percebeu-se que o peridico mais popular (Tribuna da Bahia) o que mais usa a forma
inovadora (30%), mas o peridico considerado intermedirio (Correio da Bahia, visto na sociedade

3
Projeto de Estudo da Norma Urbana Culta das Principais Cidades Brasileiras, desenvolvido em Salvador, Recife, Rio de
Janeiro, So Paulo e Porto Alegre.
soteropolitana como conservador) o que mais usa a forma de futuro simples (81%). Estatisticamente,
porm, no h diferena significativa entre o uso das formas concorrentes e os tipos de jornal analisados.
Este trabalho apresenta resultados parciais de pesquisa desenvolvida a partir de 2007 com textos
jornalsticos, mas, comparando-os com resultados de pesquisa anterior (OLIVEIRA, 2006), mantm-se a
hiptese da inverso parcial entre fala e escrita quanto ao uso das variantes inovadora e conservadora.
Resta saber se, com a ampliao do corpus, os resultados se mantm prximos. Pretende-se tambm
verificar a implementao do futuro perifrstico em outros tipos de escrita, como, por exemplo, em
redaes escolares.

Referncias
BYBEE, J. Mechanisms of change in grammaticization: the role of frequency. In: JOSEPH, B. D.;
JANDA, R. D. (Ed.) The handbook of historical linguistics. Oxford: Blackwell, 2003, p. 602-623.
BYBEE, J. et alii. The evolution of grammar: tense, aspect, and modality in the languages of the world.
Chicago: Chicago University Press, 1994.
CMARA JR., J. M. Uma forma verbal portuguesa estudo estilstico e gramatical. Tese apresentada no
concurso para a cadeira de Lngua Portuguesa da Faculdade de Filosofia. Rio de Janeiro: Jornal do
Comrcio/Rodrigues & Cia., 1957.
FLEISCHMAN, S. The future in thought and language diachronic evidence from Romance. Cambridge:
Cambridge University Press, 1982.
HEINE, B. Auxiliaries: cognitive forces and grammaticalization. New York: Oxford University Press,
1993.
HEINE, B.; KUTEVA, T. World lexicon of grammaticalization. Cambridge: Cambridge University Press,
2002.
HOPPER, P. J. & TRAUGOTT, E. Grammaticalization. Cambridge: Cambridge University Press, 2003
[1993].
MALVAR, E. O presente do futuro no portugus oral do Brasil. Ottawa: University of Ottawa, 2003 (Tese
de Doutorado).
MARCHELLO-NIZIA, C. Grammaticalisation et changement linguistique. Bruxelas: De Boeck, 2006.
OLIVEIRA, J. M. O futuro da lngua portuguesa ontem e hoje: variao e mudana. Rio de Janeiro:
UFRJ, 2006 (Tese de Doutorado).
UFPB Curso GoldVarb X
Profa. Josane Oliveira

Mais grficos

Para finalizar o nosso curso, vejamos mais alguns exemplos de tabelas e grficos diferentes.

Trabalho: Abralin em Cena Esprito Santo (Vitria, 26-29/05/09)


Ttulo: A expresso do futuro verbal no portugus escrito de Angola

Tabela 1: Distribuio das variantes


Variantes Ocorrncias
Futuro simples 246
65%
Ir + infinitivo 90
24%
Presente 41
11%
Total 377

Grfico 1: Variantes (percentuais)

100%
90%
80%
70%
60%
50% Futuro simples
40%
30% Futuro perifrstico
20%
10%
0%
Angola

Tabela 4: Uso da perfrase e extenso fonolgica do verbo


Fator Ocorrncias Percentual Peso Relativo
1 slaba 9 / 102 8% .36
2 slabas 30 / 145 20% .45
3 slabas 33 / 58 56% .67
4 ou + slabas 18 / 31 58% .82
Grfico 2: Uso da perfrase e extenso fonolgica do verbo (pesos relativos)

1001
.90
.
80
70
.

60
.
.50
.
40 Perfrase
.30
.
20
.10

0
1 slaba 2 slabas 3 slabas 4 ou + slabas

Trabalho: XIII Colquio da Lusofonia (V Encontro Aoriano) Florianpolis (5-9 abril 2010)
Ttulo: O futuro da lngua portuguesa em trs cantos do mundo: Angola, Brasil e Portugal

Tabela 2: Novos resultados


Angola Brasil Portugal
Futuro simples 246 445 496
73% 71% 65%
Ir + infinitive 90 186 271
27% 29% 35%
Total de dados 336 631 767

Grfico 1: Uso do futuro verbal nos trs pases

100%
90%
80% 73% 71%
70% 65%
60%
50% Futuro simples
40% 35% Futuro perifrstico
30% 27% 29%
20%
10%
0%
Angola Brasil Portugal
Trabalho: Tese de Doutorado
Ttulo: O futuro da lngua portuguesa ontem e hoje: variao e mudana.

Tabela 1: Distribuio das variantes na lngua escrita por sculos


Variantes Sculos
XIII XIV XV XVI XVII XVIII XIX XX4
Futuro simples 18 433 65 681 358 105 91 122
54,5% 91,9% 81,3% 87,4% 74,4% 83,3% 85,8% 75,3%
Haver de + infinitivo 15 31 12 90 108 13 6 3
45,5% 6,6% 15% 11,6% 22,5% 10,3% 5,8% 1,9%
Ir + infinitivo - 6 1 3 4 5 8 26
1,3% 1,2% 0,4% 0,8% 4% 7,5% 16%
Presente - 1 2 5 11 3 1 11
0,2% 2,5% 0,6% 2,3% 2,4% 0,9% 6,8%
Total 33 471 80 779 481 126 106 162

Grfico 1: Distribuio das variantes na lngua escrita por sculos (percentuais)

100%
90%
80%
70%
60%
Futuro simples
50%
Haver de + infinitivo
40%
Ir + infinitivo
30%
20% Presente
10%
0%
XIII XIV XV XVI XVII XVIII XIX XX

Tabela 2: Distribuio geral das variantes na dcada de 70


Variantes Tipo de texto Total
Oral Escrito
EFs DIDs Jornais
Futuro simples 82 (17%) 25 (11%) 71 (88%) 178
Perfrase haver presente + infinitivo - - 2 (2%) 2
Perfrase haver futuro + infinitivo - - 1 (1%) 1
Perfrase ir presente + infinitivo 355 (72%) 164 (73%) 5 (6%) 524
Perfrase ir futuro + infinitivo 3 (1%) - 2 (2%) 5
Presente 51 (19%) 37 (16%) 1 (1%) 89
Total 491 226 82 799

4
Para o sculo XX, esto sendo considerados apenas os dados de lngua escrita, para uma coerncia na comparao com os
outros sculos, que no dispem de dados de lngua falada. Os dados orais do sculo XX so analisados na seo seguinte.
Grfico 3: Variantes por tipo de texto na dcada de 90 (percentuais)

100%
80%
FS
60%
FP
40%
PR
20%
0%
DID Jornais

Grfico 5: Faixa etria em EFs e DIDs anos 70 (pesos relativos)

.100

.80
.60 EF
.40 DID

.20

.0
Faixa 1 Faixa 2 Faixa 3

Grfico 6: Procedncia geogrfica em EFs e DIDs anos 70 (percentuais)

100%
80%
60% Salvador
40% Rio de Janeiro
20%
0%
EF DID
Grfico 9: Procedncia geogrfica em DIDs anos 70 e 90 (percentuais)

100%

80%

60% Salvador
40% Rio de Janeiro

20%

0%
Anos 70 Anos 90

Quadro 9: Dados demogrficos de Salvador e do Rio de Janeiro


Variveis Salvador Rio de Janeiro
Censo 70 Censo 91 Censo 70 Censo 91
Populao residente 1.007.195 2.075.272 4.251.918 5.480.772
Populao imigrada 297.584 646.821 1.800.822 1.517.232
Populao alfabetizada 650.679 1.467.593 3.283.600 4.255.625
IDH Municipal 0,580 0,793 0,702 0,808
IDH Educao 0,639 0,758 0,707 0,800
IDH Renda 0,698 0,952 0,940 0,965

Tabela 48: Distribuio do presente ao longo do tempo na escrita


Sculos Sc. Sc. Sc. Sc. Sc. Sc. Sc. Sc.
XIII XIV XV XVI XVII XVIII XIX XX
Oc. - 1 2 5 11 3 1 11
% - 0,2% 2,5% 0,6% 2,3% 2,4% 0,9% 6,8%

Tabela 61: Sntese dos resultados do sculo XX (percentuais)


Amostra Futuro simples Futuro perifrstico Presente
Fala 70: EFs 17% 73% 10%
Salvador 20% 65% 15%
Rio de Janeiro 14% 78% 8%
Fala 70: DIDs 11% 73% 16%
Salvador 28% 54% 18%
Rio de Janeiro 9% 75% 16%
Fala 90: DIDs 3% 82% 15%
Salvador - 89% 11%
Rio de Janeiro 4% 79% 17%
Escrita 70: jornais 90% 9% 1%
Salvador 97% 3% -
Rio de Janeiro 85% 13% 2%
Escrita 90: jornais 65% 23% 12%
Salvador 60% 24% 16%
Rio de Janeiro 71% 20% 9%

Agora, mos obra e bom trabalho! Espero ter ajudado! Contato: josanemoreira@hotmail.com.