Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
SAÚDE
BIOTECNOLOGIA
Copyright © Portal Educação
211p. : il.
Inclui bibliografia
ISBN 978-85-8241-804-8
CDD 660.6
SUMÁRIO
5
O termo biotecnologia pode ser definido como a aplicação de princípios científicos e
tecnológicos no processamento de materiais por agentes biológicos, visando à produção de
serviços e mercadorias. Nessa visão ampla, a biotecnologia tradicional é uma tecnologia
utilizada desde os primeiros profissionais que utilizaram microrganismos em processos
fermentativos para a geração de iogurtes e cervejas, por exemplo.
No início da década de 70, a biotecnologia tradicional era uma disciplina confinada a
departamentos de engenharia química e a programas de microbiologia. Em 1919, o termo
“biotecnologia” foi criado pelo engenheiro húngaro Karl Ereky. Esse pesquisador utilizou o termo
para descrever seu experimento que visava à produção em larga escala de suínos alimentados
com beterrabas cultivadas com micro-organismos. Karl então definiu biotecnologia como todas
as linhas de pesquisa que envolve a geração de produtos a partir de matérias-primas que
receberam a adição de materiais vivos. Contudo, essa terminologia permaneceu bastante
ambígua entre os cientistas e, somente em 1961, o termo foi então associado com o estudo da
produção industrial de bens e serviços por procedimentos que utilizam organismos, sistemas ou
processos biológicos. Isto se deve ao microbiologista sueco Carl Gören Hedén, que sugeriu a
mudança de título de um jornal de publicação científica na área de microbiologia aplicada e
fermentação industrial, intitulado de “Jornal de Microbiologia e Engenharia Bioquímica e
Tecnologia” para “Biotecnologia e Bioengenharia”.
A biotecnologia tradicional foca em três aspectos principais: (i) preparação da matéria-
prima a ser utilizada como fonte para os microrganismos; (ii) o processo de fermentação do
material em biorreatores, obtendo-se a biotransformação e produção do material desejado; e (iii)
a purificação do produto final.
A obtenção de um determinado produto em escalas industriais é o objetivo principal da
biotecnologia. Então, muitas pesquisas foram realizadas visando melhorar e aperfeiçoar os três
aspectos envolvidos no desenvolvimento da tecnologia. Com esta finalidade, foram realizados
vários investimentos em desenhos de novos biorreatores e no controle e monitoramento dos
processos fermentativos. Apesar de se ter obtido um aumento de produção significativo, a
otimização do processo de biotransformação ainda permanecia aquém do desejado.
As linhagens de microrganismos capazes de sintetizar os produtos de interesse o
faziam em níveis subótimos para uma escala industrial. Mutações aleatórias induzidas por
mutágenos químicos e radiação ultravioleta algumas vezes eram capazes de aumentar os níveis
de produção. Contudo, esse alcance é frequentemente limitado. Normalmente, a indução de 6
mutações afeta não só a característica desejada, como outras importantes para o metabolismo
celular. Por exemplo, mesmo que o microrganismo produza em maiores quantidades o produto
desejado, a mutação pode afetar uma função biológica fundamental, resultando em um
crescimento bacteriano mais lento. Além deste efeito indesejado, o processo de gerar linhagens
é demorado e há a necessidade de selecionar e testar muitas descendentes até que se cheguem
à amostra esperada, aumentado os custos. Outra desvantagem é que essa mutação só é capaz
de aumentar a produção de um bem de interesse que o microrganismo já seja capaz de produzir.
Assim, há a necessidade de pesquisas com diversos outros microrganismos para descobrir quais
proteínas eles expressam.
A revolução da biotecnologia tradicional veio com o desenvolvimento da tecnologia do
DNA recombinante, o que envolve um conhecimento multidisciplinar (Fig. 1). Além da sabedoria
de microbiologistas e engenheiros químicos, a nível industrial, a tecnologia do DNA
recombinante programou as descobertas advindas da biologia molecular e genética. Esta união
passou então a ser denominada biotecnologia molecular.
FIGURA 1
8
Muitas descobertas na área de genética foram sendo feitas e acumuladas para
responder a uma pergunta inicial: como ocorria a transmissão da informação genética entre as
gerações e como esta era armazenada. Para a biotecnologia, a mesma pergunta pode ser feita
de outra forma: como o conhecimento da informação genética pode ser aplicado para a geração
de bem comerciais. Nos anos de 1950, os dados a respeito deste assunto eram:
1. Os genes são os fatores hereditários associados a características fenotípicas;
contudo, sua natureza física não era conhecida;
2. A teoria de que um gene corresponde a uma enzima sugeria que eles
codificavam a informação necessária para a síntese proteica;
3. Sabia-se que os genes faziam parte dos cromossomos;
4. Os cromossomos eram constituídos por DNA e proteínas;
5. Em 1958, experimentos com a bactéria Streptococcus pneumoniae feitos por
Frederick Griffth e Oswald Avery, demonstraram que a bactéria expressava um fenótipo diferente
da linhagem selvagem após capturarem DNA derivado de outra amostra. Estes pesquisadores
então apontaram que o DNA era o material genético.
Em 1953, James Watson e Francis Crick postularam o modelo da estrutura do DNA.
Embora não se conhecesse ao certo como era esta estrutura, os elementos básicos constituintes
da molécula de DNA eram conhecidos. Estudos de DNA purificado e parcialmente fragmentado
mostraram que esta molécula é composta por quatro estruturas básicas, os nucleotídeos. Estas
quatro subunidades são idênticas em estrutura, diferindo apenas em sua composição de bases.
Cada nucleotídeo contém um grupo fosfato, um açúcar (a desoxirribose) e uma base
nitrogenada. Estas podem ser de quatro tipos diferentes: adenina (A), guanina (G), citosina (C) e
timina (T) (Fig. 2). Adenina e guanina são similares em sua estrutura e são conhecidas como as
bases purínicas. O mesmo ocorre com as bases citosina e timina, que são as pirimidinas. Na
ausência do grupo fosfato, com o açúcar associado à base nitrogenada, a estrutura básica é
então denominada nucleosídeo.
FIGURA 2: ESTRUTURA QUÍMICA DAS QUATRO BASES NITROGENADAS
11
A figura é um modelo simplificado da estrutura helicoidal do DNA, mostrando o sulco maior e o sulco
menor.
12
Cada fita é formada pela união de nucleotídeos, sendo que a dupla hélice é constituída
pela união entre duas fitas de DNA que se orientam em sentidos opostos: uma corre no sentido
3´ - 5´ e a outra, de 5´ - 3´. Para o pareamento de bases, cada par contém uma base purínica
(adenina – A – ou guanina – G), e uma base pirimidínica (timina – T – ou citosina – C), ligadas
por ponte de hidrogênio. As setas amplificam e demonstram com mais detalhes como ocorre o
pareamento entre as bases. Basicamente, adenina e timina se pareiam pela formação de duas
pontes de hidrogênio; já a citosina e guanina, ligam-se por três pontes de hidrogênio. As pontes
de hidrogênio estão representadas por três barras em azul. (Figura modificada de Griffiths et al.,
2002).
As relações entre as bases durante o pareamento demonstraram que T se pareia
somente com A e C somente com G. Outros tipos de pareamento não ocorrem naturalmente no
DNA. Para explicar esse achado, Watson e Crick demonstraram que este pareamento restrito
permite a formação mais eficiente de pontes de hidrogênio entre as bases, o que implica na
relação ótima para a manutenção da estabilidade da molécula de DNA. Além disso, G e C são
unidas por três pontes de hidrogênio, enquanto a relação entre A e T envolve a formação de
somente duas pontes. Assim, genomas que apresentem um alto conteúdo de GC em sua
constituição são mais estáveis que aqueles onde há maior proporção de AT. Estas observações
têm implicações diretas em muitas técnicas utilizadas rotineiramente em procedimentos
biotecnológicos.
A descoberta da estrutura do DNA causou grande impacto na genética e em outras 13
áreas da biologia. Isto se deve a duas razões principais. Primeiramente, a própria relação entre
os componentes na estrutura sugere como o material genético é duplicado ou replicado. Com a
restrição imposta pelo pareamento específico de bases, provavelmente a fita molde expõe suas
bases que determinam qual nucleotídeo deve ser incorporado à nova molécula filha. Em
segundo lugar, como a informação genética está contida no DNA, a sequência de nucleotídeos
então poderia ditar de alguma forma a sequência de aminoácidos que formariam uma proteína
específica. Assim, um tipo de código genético estaria representado na sequência nucleotídica do
DNA, que seria então traduzida para uma diferente linguagem que compõe as proteínas, os
aminoácidos.
14
As fitas parentais são desnaturadas, permitindo que as bases dos nucleotídeos sejam
expostas. A formação das fitas filhas se deve à especificidade de bases impostas pelas fitas
parentais. Ao final do processo, são geradas duas fitas filhas de sequências complementares à
das fitas parentais utilizadas como molde.
O modelo de replicação do DNA proposto por Watson e Crick baseado na
especificidade de bases não explica, contudo, de que maneira a molécula de DNA parental pode
ser relacionada às moléculas filhas. Há três possibilidades distintas: semiconservativa,
conservativa e dispersiva.
Na replicação semiconservativa, cada dúplex é formado por uma fita parental e por
outra fita filha recém-sintetizada. Na conservativa, a replicação produz dois dúplex: um formado
por duas fitas molde, e outro, por duas fitas filhas. A terceira hipótese, a replicação dispersiva,
cada dúplex é formada por fragmentos de dupla fita contendo apenas segmentos de DNA
parental e, na mesma molécula, há também fragmentos de dupla fita contendo apenas
segmentos recém-sintetizados.
Para discriminar entre as hipóteses sugeridas como modelo para à replicação do DNA,
Matthew Meselson e Franklin Stahl realizaram um elegante experimento em 1958. Esses
pesquisadores analisaram várias gerações de culturas bacterianas que tiveram como fonte de
nitrogênio duas moléculas que apresentam densidades diferentes, o N15 e o N14. Inicialmente, as
culturas foram supridas somente com N15, os quais foram incorporados às bases nitrogenadas
que estavam sendo formadas durante a replicação do DNA. Após a divisão celular de algumas 15
gerações, as mesmas células bacterianas foram cultivadas em meio contendo somente o N14. O
padrão de replicação foi diferenciado após a separação do DNA em gradiente de cloreto de césio
(Fig. 6). O resultado obtido após a centrifugação demonstrou a presença de uma banda
intermediária entre os dois nitrogênios na primeira geração com N14, e uma intermediária e outra
correspondente a somente o N14. Esse experimento confirmou que a replicação do DNA é
semiconservativa. Os mesmos resultados foram obtidos em experimentos posteriores, validando
então o modelo.
18
Este modelo possibilita que a holoenzima de DNAP III sintetize ambos os filamentos
filhos.
A replicação do DNA envolve um complexo enzimático. Além da DNAP e da primase,
há outras enzimas envolvidas, como as helicases. Essas são essenciais para o início da
replicação do DNA, pois são as responsáveis por romper as pontes de hidrogênio que mantêm
as duas fitas de DNA unidas. Esta fita simples é estabilizada pela ligação da proteína SSB, que
se liga à fita simples de DNA e, com isso, retarda a formação do dúplex.
Ambas as DNAP I e III possuem atividade exonucleásicas 3´ - 5´, o que permite
verificar e editar bases inseridas erroneamente ou mal pareadas. Esta atividade é fundamental
para a manutenção da fidelidade da informação genética. Mutantes deficientes nesta atividade
apresentam maior taxa de mutação.
Muitos questionamentos foram feitos após a descoberta da estrutura e de outros
processos que envolvem o DNA. Entre eles, o que realmente intrigava e fascinava os 19
pesquisadores era a descoberta de como a informação genética presente em sequências de
DNA são transmitidas até a síntese de proteínas. O primeiro passo para atingir este objetivo foi
entender o processo de transcrição.
2.4 TRANSCRIÇÃO
A estrutura básica do RNA é bem semelhante a do DNA. Ambos são formados por
uma cadeia constituída pela união de nucleotídeos por meio de ligações fosfodiésteres. Apesar
da semelhança, o RNA apresenta algumas diferenças estruturais se comparado ao DNA:
I. A primeira diferença está na composição dos nucleotídeos. No DNA, eles podem
ser compostos por quatro bases distintas: adenina, citosina, guanina e timina. No RNA, três
bases nitrogenadas são as mesmas daquelas encontradas no DNA: adenina, citosina e guanina.
Contudo, ao invés da timina, a base denominada uracila compõe um dos tipos de nucleotídeos
de RNA. Apesar desta diferença, a uracila forma pontes de hidrogênio com a adenina, assim
como o faz a timina.
II. A segunda diferença ainda está relacionada com o tipo de açúcar que compõe o
nucleotídeo. O açúcar que compõe o DNA é a desoxirribose e no RNA é a ribose. A única
diferença entre estes açúcares é a presença ou a ausência de um átomo de oxigênio na posição 20
do carbono 2, como demonstrado na Fig. 8;
III. Por fim, o RNA é constituído por uma fita simples e não por uma fita dupla como
o DNA. Consequentemente, o RNA não forma a estrutura de dupla hélice observada no DNA.
Pelo contrário, a fita simples permite que haja diversas combinações no pareamento de bases.
Assim, a estrutura tridimensional do RNA pode formar diferentes complexos, que são
apresentados sob variados aspectos. Esta característica é importante sobre o ponto de vista
tecnológico, pois a fita simples interfere negativamente com muitos processos de interesse
biotecnológico. Um exemplo é a dificuldade em produzir em larga escala proteínas de interesse
farmacêutico quando o RNA assume uma conformação inadequada.
O conhecimento da estrutura dos ácidos nucleicos foi o primeiro passo para as
pesquisas subsequentes. Apesar do DNA e RNA apresentarem algumas diferenças em sua
estrutura, o que se observa é a grande semelhança quanto a sua constituição. A partir disso, foi
sugerido pelos cientistas que o RNA pudesse ser então a molécula intermediária na
transferência da informação genética contida no DNA em proteínas. Então, estudos foram
dirigidos neste sentido para elucidar o papel do RNA na expressão de proteínas.
TRANSCRIÇÃO EM PROCARIOTOS
INICIAÇÃO DA TRANSCRIÇÃO
25
26
FIGURA 10: INÍCIO DA TRANSCRIÇÃO
TERMINAÇÃO DA TRANSCRIÇÃO
28
TRANSCRIÇÃO EM EUCARIOTOS
31
33
37
FONTE:
2.7.1 Ribossomos
Cada ribossomo contém sítios específicos que permitem a ligação de todos os fatores
associados à síntese proteica, como o RNAm, os RNAt e os fatores proteicos. Além disso, a
subunidade maior do ribossomo possui dois compartimentos, o sítio A e o sítio P. O sítio A é o
local de acesso do RNAt contendo o aminoácido a ser inserido na cadeia proteica. O sítio P é
ocupado pelo RNAt que carrega a cadeia polipeptídica que está sendo formada. Assim que a
polimerização da cadeia polipeptídica prossegue e há a translocação do ribossomo, ou seja, esta
estrutura se move sobre um códon, o RNAt que se encontra no sítio P é liberado do complexo.
Isto permite a transferência do RNAt do sítio A ao P. Para fins didáticos, a síntese proteica é
dividida em três passos distintos: iniciação, alongamento e término.
(A) subunidade 30S se liga ao RNAm com o auxílio dos fatores IF1 e IF3; (B) IF2 se liga ao RNAt ligado
à N-formilmetionina e controla a sua entrada no ribossomo; (C) os fatores de iniciação são liberados e a subunidade
maior se liga ao complexo inicial, formando o ribossomo completo. (Figura modificada de Lewin, 2004).
2.7.3 Alongamento da síntese proteica em procariotos
Após a síntese da proteína, esta ainda pode sofrer várias transformações. Este
processamento é extremamente importante sob o ponto de vista biotecnológico, pois a partir
deste passo final há a geração de proteínas funcionais.
Vários são os tipos de processamento que a proteína pode sofrer o que também
dependerá do tipo celular em que a macromolécula está sendo expressa. Um exemplo de
grande aplicação na biotecnologia é o endereçamento proteico. Este processo pode ocorrer
tanto em procariotos como em eucariotos. Para isso, algumas cadeias proteicas apresentam em
sua porção N-terminal uma sequência de 15 a 25 aminoácidos. Esta estrutura é denominada
peptídeo sinal. Seu reconhecimento por fatores e receptores proteicos medeia o transporte e o
acoplamento à membrana celular. Para que a proteína seja secretada, o peptídeo sinal é
reconhecido pela maquinaria celular, mais especificamente uma peptidase. Esta enzima cliva a
cadeia polipeptídica, separando a proteína de seu peptídeo sinal e permitindo que a proteína
seja finalmente liberada da célula.
Aliado ao peptídeo sinal, a proteína pode conter na sua porção C-terminal uma
sequência conhecida como sinal de ancoramento. Assim, o peptídeo sinal endereça a proteína
até a membrana celular. O sinal de ancoramento, ao contrário do peptídeo sinal, não será
clivado. Por possuir características hidrofóbicas compatíveis com a da membrana celular,
permite que a proteína permaneça ancorada à membrana.
Outros tipos de processamento extremamente importantes para obter proteínas 45
funcionais são processamentos que certas proteínas sofrem quando são expressas em células
eucariotas. Exemplos são sequências que sinalizam a glicosilação. Além da importância deste
processo para gerar proteínas funcionais, este requerimento é uma das preocupações da
indústria farmacêutica. A glicosilação é essencial para a geração de uma resposta imunológica
eficaz, por exemplo.
49
Estudos adicionais com o operon Lac demonstram que para a expressão de genes
envolvidos com o metabolismo da lactose não bastava apenas à adição do indutor. Quando
havia suplemento de glicose à célula, mesmo na presença da lactose, não induzia a expressão
gênica relativa ao operon Lac. Isto se deve ao fato de que a maquinaria celular utiliza
preferencialmente o metabolismo de glicose quando esta está presente. Assim, a célula inibe a
expressão dos genes do operon Lac quando a glicose está presente, demonstrando outro
controle adicional ao operon.
O metabolismo de glicose inibe a expressão do opero Lac e este controle é
denominado repressão catabólica, o qual é exercido por um produto derivado do catabolismo da
glicose, o monofosfato adenosina cílico (cAMP). Quando a glicose está presente em altas
concentrações, os níveis de cAMP são baixos; por outro lado, quando os níveis de glicose são
baixos, os níveis de cAMP são altos.
Apesar de altos níveis de cAMP serem necessários para a ativação do operon Lac,
uma outra proteína é necessária para iniciar o processo. A proteína CAP, codificada pelo gene
crp, forma um complexo com cAMP, que será então capaz de se ligar ao operon. A proteína
ligada ao DNA interage com a RNAP, aumentando a afinidade desta ao promotor. Portanto, além
do controle negativo exercido pela proteína LacI, o operon ainda está submetido a um controle
positivo. Nesse caso, o ativador cAPM-CAP é requerido para iniciar a expressão gênica.
Para que os ativadores e repressoras sejam capazes de exercer de maneira eficaz
suas atividades, estas moléculas precisam apresentar duas conformações: uma em que sejam
capazes de se ligar ao DNA e outra em que esta ligação não seja possível. Para isso, os
ativadores e repressores apresentam dois sítios de ligação: um ao DNA e outro ao sítio
alostérico; este último interage com os efetores. Quando os efetores, que no caso do operon Lac
são os próprios indutores, ligam-se ao sítio alostérico, eles induzem uma mudança
conformacional na proteína reguladora, induzindo uma alteração na estrutura do domínio que se
liga ao DNA. 50
A ação dos efetores baseadas na sua ligação aos sítios alostéricos varia de acordo
com cada situação. Em algumas, o ativador ou repressor precisam se ligar ao seu efetor para
conseguir se ligar ao DNA; em outros casos, as proteínas reguladoras se ligam ao DNA somente
na ausência de seus efetores.
Para que a RNAP II alcance a máxima taxa de transcrição, é necessário que haja a
cooperação entre vários elementos reguladores de dominância cis. Estes elementos podem ser
classificados em três classes de acordo com a localização relativa dos mesmos. Próximo ao sítio
de início da transcrição se encontra a sequência a qual a RNAP irá se ligar, o promotor. Outras
sequências próximas ao promotor são também sequências reguladoras as quais se ligam
proteínas que auxiliam na ligação da RNAP II à sequência promotora. Uma terceira sequência se
refere aos elementos cis que agem a uma distância considerável; estas sequências são
denominadas de intensificadores ou silenciadores, de acordo com os efeitos que suas ações 51
proporcionam.
52
A figura mostra uma parte deste motivo, no qual um átomo de zinco se conjuga a
quatro aminoácidos (duas cisteínas e duas histidinas) de uma cadeia polipeptídica.
3 A TECNOLOGIA DO DNA RECOMBINANTE
59
60
Como comentado anteriormente, o passo inicial no isolamento de um gene consiste em
extrair o DNA do organismo doador. Diferentes tipos de protocolos estão disponíveis e permitem
que a extração obtenha um material em grande quantidade e com alto grau de pureza. Após
identificar quais genes se deseja estudar, procede-se ao isolamento do DNA genômico de
eucariotos ou de procariotos. Para o vetor, o procedimento a ser adotado é dependente da
natureza do mesmo. No caso de DNA plasmidial, este pode ser purificado do DNA genômico
após a ultracentrifugação em um gradiente de densidade do cloreto de césio contendo brometo
de etídeo. Este material, além de ser um agente intercalante de DNA, que permite que o mesmo
seja visualizado após sua exposição à luz ultravioleta. Permite que o DNA plasmidial se torne
mais denso que o genômico e com isso, os plasmídeos formam uma banda distinta na
centrifugação e podem ser separados (Fig. 27).
64
FIGURA 28: MAPA DE RESTRIÇÃO
Enzimas de restrição que clivem o DNA gerando desde extremidades cegas ou mesmo
coesivas podem ser utilizadas com sucesso na clonagem molecular. Contudo, a ligação do
inserto ao seu vetor é facilitada quando ambos sofrem uma digestão enzimática que gerem par
de pontas adesivas unifilamentares idênticas. Essas pontas são chamadas de adesivas porque
permitem que haja um pareamento com sequências complementares que serão unidas
(“grudadas”) por pontes de hidrogênio.
As enzimas de restrição que geram fragmentos de extremidades coesivas são
extremamente interessantes quando se deseja a inserção de uma sequência codificadora em
específico. Isto se deve ao fato de que somente filamentos complementares sejam capazes de
se ligar. Assim, uma digestão dupla com duas enzimas diferentes permite que a clonagem seja
direcional; ou seja, que a sequência codificadora se ligue a um sítio de distância ideal ao seu
promotor e na correta fase de leitura para a proteína.
Analisando a ação das enzimas de restrição, pode-se afirmar que as mesmas têm pelo
menos duas propriedades úteis à clonagem molecular: primeiramente, os fragmentos de
restrição apresentam um peso molecular adequado para a clonagem. Segundo muitas enzimas
de restrição clivam o DNA de forma a gerar extremidades coesivas, facilitando a ligação de
fontes diferentes de DNA que possuam extremidades complementares. Esta ligação ainda
ocorre de forma que a sequência codificadora ocorra de maneira direcional, ou seja, na fase 66
correta de leitura.
O uso unicamente de enzimas de restrição, entretanto, é insuficiente para finalizar o
procedimento de clonagem molecular. As extremidades geradas pela clivagem enzimática
podem se alinhar, mas a força das pontes de hidrogênio envolvidas na complementaridade de
bases não é suficiente para manter as moléculas de DNA referentes ao inserto e ao vetor juntas.
Há a necessidade de refazer a ligação internucleotídica entre o grupo hidroxila 3' e o grupo
fosfato 5' das extremidades onde a quebra das moléculas de DNA foi gerada. A análise da
replicação do DNA forneceu uma alternativa enzimática. Este problema é resolvido após o passo
da ligação enzimática.
67
74
76
80
Durante os estágios iniciais de amplificação, são geradas fitas de DNA mais longas.
Em ciclos subsequentes, o material amplificado consistirá de uma fita de DNA composta pelos
iniciadores em suas extremidades. Estes amplicons mais curtos predominarão ao final de 30
ciclos de amplificação.
Uma das aplicações da PCR na tecnologia do DNA recombinante é o isolamento de
um gene específico, que será produzido em grande quantidade e este pode ser clonado em um
vetor apropriado. Para a clonagem, deve-se considerar que a Taq DNA polimerase têm uma
atividade enzimática incomum, adicionando um nucleotídeo de adenina ao final 3´ de cada fita.
Isto é ideal para a clonagem em vetores do tipo que apresentam um acréscimo de timina na
porção 5´ de cada fita. Apesar de esta característica dificultar a clonagem de fragmentos que
possuem extremidades cegas, este fato nem sempre é verdadeiro. Há diferentes tipos de Taq
DNA polimerases especializadas em diferentes funções e nem todas possuem a característica
de acrescentar adeninas à extremidade 3´ das fitas de DNA.
A clonagem de insertos gerados por PCR é facilitada quando tanto o vetor como os
insertos são digeridos com a mesma enzima de restrição, pois esse procedimento gera
extremidades coesivas que ainda permitem a clonagem direcional. Contudo, alguns insertos não
possuem a sequência a ser reconhecida pela enzima desejada e a digestão com a enzima de
interesse ocorre de maneira que a sequência codificadora seja clonada fora da fase de leitura.
Este é um ponto crítico para procedimentos que têm por objetivo a expressão de proteínas. Para
facilitar estes procedimentos, fragmentos de DNA adaptadores, contendo os fragmentos de
restrição desejados, podem ser adicionados à sequência dos insertos.
ADAPATADORES 81
3.2.1 Plasmídeos
84
O pBR322 possui uma estrutura mais simples que a do pUC. Possui dois genes de
resistência a drogas: um codifica a ampicilina e outro, a tetraciclina. Dentro da sequência
codificadora de cada um destes genes há sítios de restrição únicos, os quais têm sido utilizados
na clonagem. Contudo, geralmente a inserção é realizada no sítio de BamHI presente na
sequência codificadora da tetraciclina. Isto tem implicações na seleção dos transformantes,
como será discutido mais adiante.
O vetor pUC é mais avançado e permite uma segunda alternativa de seleção dos
transformantes. Além da resistência ao antibiótico ampicilina, é possível uma seleção fenotípica
por coloração. O vetor é constituído por parte do operon Lac. Uma fração do gene lacZ (Z´) está
sob o controle do promotor indutível do operon Lac e da proteína repressora LacI. Dentro da
região codificadora do gene lacZ´ foi inserido o sítio múltiplo de clonagem.
Outros plasmídeos que permitem uma clonagem eficiente em até 5 minutos são
aqueles que possuem adição de timinas as extremidades 5´ de cada fita do vetor linearizado.
Estes vetores são rotineiramente utilizados em laboratórios para a clonagem de produtos de
PCR. Isto se deve à adição de adeninas às extremidades 3´ dos amplicons, como já referido
anteriormente (Fig. 39).
FIGURA 39: VETOR PARA CLONAGEM DE PRODUTOS DE PCR
85
3.2.2 Bacteriofagos
87
88
O Bacteriófago lamba é modificado por engenharia genética para permitir que sítios de
restrição da enzima BamHI sejam inseridos nas extremidades flanqueadoras da região I/E. O
DNA de interesse também é digerido com a mesma enzima e fragmentos resultantes de peso
molecular de 20 kb são selecionados para a clonagem. Com o auxílio da T4 ligase, o inserto
selecionado é ligado às regiões L e R. (Figura modificada de Glick & Paternak, 1994).
A formação da partícula do fago contendo o DNA recombinante foi possível após
estudos in vitro que demonstraram a viabilidade do processo. Partículas infectivas podem ser
produzidas após uma simples mistura dos elementos constituintes da partícula do fago:
capsídeo, a cauda e o DNA recombinante.
Os fagos são, portanto, úteis na clonagem de fragmentos que apresentem peso
molecular variando entre 20 a 25 Kb. Contudo, a obtenção de insertos maiores é desejável em
determinadas situações, como para o sequenciamento de longas moléculas de DNA do
cromossomo eucarioto. Para a clonagem de genes destes organismos, frequentemente é
necessário obter fragmentos superiores a 25 kb. Como os genes de eucariotos podem variar de
30 a 40kb, o que se deve a presença de introns, a clonagem de fragmentos maiores possibilita a
inclusão de toda uma sequência em um único clone. Por esse motivo, outros vetores têm sido
desenvolvidos para a clonagem destes fragmentos. Entre eles estão os cosmídeos, os YACs
(cromossomo artificial de leveduras) e os BACs (cromossomo artificial bacteriano).
89
3.2.3 Cosmideos
90
O cosmídeo contém duas sequências intactas de sítios cos flanqueando o sítio único
da enzima ScaI, um único sítio de BamHI e a sequência codificadora da tetraciclina, o que
permite a seleção por antibiótico de clones transformados com os cosmídeos. O vetor é então
digerido com ScaI e BamHI. A fonte de DNA é digerida com BamHI, e os fragmentos de 40kb
são selecionados como insertos. O vetor e o inserto são ligados com o auxílio da T4 ligase e
utilizados na formação de novas partículas infectivas de fagos. Estes infectam E. coli e as
sequências cós permitem que este DNA recombinante se circularize como um plasmídeo.
Finalmente, os transformantes são selecionados por sua capacidade de crescerem em meio
contendo tetraciclina. (Figura modificada de Glick & Paternak, 1994).
Para a construção de um cosmídeo, a maior parte do DNA relacionado com a estrutura
do fago é deletada, permanecendo somente os sítios cos. Esta estrutura modificada permite que
quase toda a sequência do DNA doadora possa ser inserida, desde que não exceda 50 kb,
capacidade máxima de DNA que o capsídeo do fago comporta.
Estratégias similares aos cosmídeos foram desenvolvidas, como os bacteriófagos P1.
A vantagem do uso destes outros vírus é que os mesmos podem acomodar moléculas de DNA 91
de até 100 kb. Fragmentos ainda maiores podem ser clonados em outros vetores, como os BAC
e os YAC.
Os BAC são vetores similares a outros plasmídeos, exceto que sua origem de
replicação e as proteínas envolvidas com na replicação são derivadas do plasmídeo “fator F” de
E. coli. Isso permite que os BAC sejam transferidos à célula hospedeira por conjugação (Fig. 44).
Estes vetores podem conter fragmentos de até 300 kb.
92
FIGURA 44: TRANSFERÊNCIA DE BAC ÀS CÉLULAS HOSPEDEIRAS
102
Quando uma sonda de DNA não está disponível ou mesmo a hibridização não está
sendo eficiente, alguns métodos de identificação imunológica podem ser utilizados na busca de
uma determinada sequência codificadora. Para isso, a biblioteca deve ter sido construída de
forma que os fragmentos de DNA tenham sido clonados em vetores de expressão. Estes
sistemas permitirão que a proteína, ou parte dela sejam expressas e possibilita o
reconhecimento das mesmas por anticorpos específicos.
A pesquisa de uma determinada sequência pela ligação de anticorpos específicos é
uma técnica mista de ELISA e hibridização. Os clones da biblioteca são plaqueados em uma
placa máster, permitindo identificar a localização de cada clone. Uma amostra destes clones é
transferida para uma matriz, onde as células são lisadas e as proteínas referentes aos insertos
são liberadas e fixadas à membrana. Esta matriz é tratada com um anticorpo primário, que se
liga especificamente a uma proteína ou parte dela. Prossegue-se então uma lavagem, que retira
materiais e anticorpos não ligados e a amostra então é tratada com o anticorpo secundário, que
reconhece o anticorpo primário. O anticorpo secundário é marcado com uma enzima, como a
fosfatase alcalina, permitindo a visualização das amostras que reagiram (Fig. 48).
FIGURA 48: BUSCA DE UM CLONE PELA ANÁLISE IMUNOLÓGICA
104
As células transformadas são plaqueadas na placa máster, que servirá como fonte de
identificação de cada clone. (1) Todos os clones são transferidos a uma matriz de nitrocelulose.
(2) As células expressando as proteínas recombinantes serão lisadas, o que permite a ligação
das proteínas à matriz. (3) O lisado é então submetido a um tratamento com anticorpos
primários, (4) lavados e tratados com o anticorpo secundário. (5) Após uma segunda lavagem,
faz-se a detecção dos clones que reagiram no teste imunológico. (6) Sempre é interessante
manter uma subcultura dos clones representados na placa máster.
Os clones são posteriormente identificados na cultura máster. Em seguida, eles devem
ser caracterizados e sequenciados, para verificar se algum possui a sequência completa do gene
de interesse.
Esta técnica tem como desvantagem ter que se conhecer previamente alguma
característica da proteína. Além disso, como os anticorpos geralmente reconhecem sequências
conformacionais. Portanto, mesmo que estejam presentes sequências parciais da proteína, o
anticorpo pode não se ligar. Por último, se os insertos foram clonados em uma fase de leitura
errada, a proteína não será expressa de maneira adequada. Nesse caso, mesmo que a
sequência presente em um determinado clone esteja completa, não será possível sua
identificação por este método.
3.5.3 Busca por atividade proteica
Outra opção para a identificação de genes a partir de uma biblioteca consiste na 105
identificação de clones que contêm a sequência codificadora para uma enzima e na seleção dos
transformantes que apresentem atividades específicas do polipeptídeo expresso. Assim, a
biblioteca construída a partir de insertos clonados em vetores de expressão é selecionada pela
capacidade da enzima em utilizar determinado substrato, como diferentes antibióticos.
Este método exibe desvantagens relevantes, como a possibilidade de que a expressão
proteica não esteja sendo realizada a partir da fase de leitura correta, a expressão de somente
determinados fragmentos que não compõe uma enzima ativa e a necessidade de utilizar
linhagens bacterianas com mutações específicas que evitem a interferência no método de
seleção escolhido.
Após terem sido selecionados clones que contenham o inserto de interesse, certos
procedimentos que permitam a confirmação da sequência de interesse devem ser adotados.
Entre os métodos, são muito utilizadas a PCR e a digestão enzimática, além do sequenciamento.
107
Vetores de expressão, assim como já definido no módulo II, são aqueles de clonagem
que contém os elementos genéticos necessários à expressão de genes, de acordo com o tipo
celular que está sendo utilizado como hospedeiro. Eles podem ser de dois tipos, os de
expressão procariotos e os de expressão eucariotos. Apesar desta classificação distinta, muitas
características estruturais dos vetores são similares, diferindo apenas no fato de que as
sequências genéticas utilizadas são isoladas de procariotos ou de eucariotos, respectivamente.
Estas estruturas fornecem funcionalidades e resultados distintos.
A biotecnologia é uma ciência de interesse industrial. Por isso, a quantidade em que
determinado bem é produzida se torna fator crucial para a implantação de um determinado
protocolo. Diversas estruturas envolvidas com a produção de proteínas foram manipuladas, 109
visando aperfeiçoar todos os aspectos envolvidos neste processo: a transcrição, a tradução, a
estabilidade da proteína e a sua secreção para o meio. Para isso, diferentes elementos
genéticos têm sido modificados e testados na construção de novos vetores de expressão
procariotos e eucariotos. De maneira geral, as principais características que têm sido
manipuladas para aumentar os níveis de expressão de proteínas recombinantes são:
I. As sequências relacionadas com a transcrição, como os promotores e os
terminadores;
II. O número de cópias do gene clonado, além da localização da sequência
codificadora em um plasmídeo ou integrado ao cromossomo;
III. A eficiência da tradução no organismo hospedeiro;
IV. A afinidade do sítio de ligação do ribossomo;
V. A estabilidade da proteína no hospedeiro;
VI. A localização final da proteína sintetizada.
O plasmídeo pKO1 foi desenvolvido para ser utilizado na seleção de promotores fortes.
Com esta finalidade, sua estrutura foi construída de forma a apresentar alguns requisitos, como:
I. Um gene repórter que permita a pronta detecção de uma sequência promotora
quando esta for clonada a jusante do gene;
II. Um marcador de seleção, que, no caso, corresponde a um antibiótico;
III. Um sítio múltiplo de clonagem que deve se localizar antes da sequência do gene
repórter;
IV. Um plasmídeo que seja estável na célula hospedeira, com o número de cópias
conhecido.
Estruturalmente, o vetor pKO1 contém como marcador de seleção o gene da
ampicilina, o que permite a seleção de clones que foram transformados com o vetor. Seu sítio
múltiplo de clonagem inclui sítios de restrição únicos reconhecidos por diferentes enzimas. Além
disso, possui três códons de paradas nas três fases de leitura, evitando que a transcrição
continue além da sequência de interesse, o que pode gerar um resultado falso-positivo. O gene
repórter utilizado na construção do plasmídeo pKO1 é uma quinase derivada do operon gal de E.
coli. Este é constituído pelos genes galE, galT e galK, que codificam uma epimerase, uma
transferase e uma quinase, respectivamente. A quinase é uma proteína cuja detecção ocorre por
métodos relativamente simples e sensíveis, medindo os níveis da galactose-1-fosfato.
Para a seleção de promotores funcionais em E. coli, sequências de DNA suspeita de
conterem promotores são digeridas e clonadas no pKO1. A mistura de DNA contendo os
possíveis recombinantes são então utilizadas para transformar uma E. coli de genótipo galE+, 114
galT+ e galK-. Esta linhagem, quando transformada com um plasmídeo expressando a quinase,
são facilmente selecionada por sua habilidade de crescer em meio cuja única fonte de carbono é
a galactose. Os transformantes com o vetor pKO1, nos quais foi clonada uma sequência
promotora, são diferenciados pelas características fenotípicas de coloração no meio McConkey.
A expressão do gene da quinase gera uma enzima com atividade fermentadora, o que
resulta em colônias que apresentam coloração vermelha no meio de eleição. Os vetores cuja
sequência clonada não contém um promotor funcional em E. coli não expressam a quinase,
sendo distinguidas pela coloração branco-amarelada das colônias.
A seleção dos clones pelas características fenotípicas utilizadas no vetor pKO1 ainda
permite a distinção entre a força das sequências promotoras clonadas. Para isso, inicialmente
este vetor foi testado com sequências promotoras já conhecidas. O que se utilizou como base
para a diferenciação foi o crescimento das colônias. Promotores fortes induzem uma
superexpressão da enzima quinase, produzindo colônias vermelhas de crescimento lento. Isto
demonstra que altos níveis de transcrição de genes heterólogos representam um esforço
metabólico significativo para a célula. Este resultado confirma a potencialidade deste vetor no
diferenciamento da força dos promotores.
O plasmídeo pKO1 foi originalmente desenvolvido para o isolamento de sequências
promotoras. Apesar disso, este vetor também demonstrou a sua utilidade no isolamento e
caracterização de sequências terminadoras. Com este propósito, os fragmentos que os
contenham são inseridos entre um promotor conhecido e o gene galK. Os resultados destes
experimentos demonstraram uma redução de 50 vezes nos níveis de expressão da quinase,
apesar das colônias ainda se apresentarem vermelhas. Se o terminador fosse inserido em um
vetor contendo um promotor mais fraco, os níveis de expressão eram reduzidos de tal forma que
as colônias chegavam a apresentar-se de coloração branco-amarelada.
Portanto, a presença destas colônias indica que uma sequência terminadora foi
clonada no vetor pKO1, quando este contém uma sequência promotora conhecida. Estes
resultados demonstram a utilidade do plasmídeo pKO1 para o isolamento e caracterização, tanto
de sequências promotoras, como de terminadoras.
O isolamento e a caracterização de sequências promotoras é um dos passos iniciais
para atingir altas produções de uma proteína de interesse. Contudo, esta característica deve ser
analisada com cautela. Altos níveis de expressão e de forma constitutiva podem ser prejudiciais
à célula hospedeira. Isso constitui um grande gasto energético, podendo até mesmo impedir 115
algumas de suas funções vitais. Por isso, as pesquisas a respeito da caracterização de
promotores prosseguiram, com a finalidade de isolar os que apresentassem uma expressão
indutível ao invés de constitutiva.
119
Este vetor de expressão, comercialmente disponível, contém o forte promotor tac (em
destaque no boxe vermelho).
Como os níveis de expressão obtidos pelos promotores tac e trc são significativamente
mais elevados, foi exigido um mecanismo que permitisse uma regulação mais apropriada.
Considerando este fato, os vetores frequentemente utilizam como estratégia para regular a
expressão gênica dos promoteres tac e trc uma variante da proteína repressora LacI, a LacIq
(Fig. 54). A diferença entre as duas é uma mutação na sequência promotora da última, que
permite uma produção mais elevada do repressor. A imposição de uma regulação mais forte é
importante para manter as funções metabólicas da célula e para inibir níveis de expressão basal
de proteínas tóxicas para a hospedeira.
FIGURA 54: VETOR DE EXPRESSÃO PPROEX-HTA (GIBCO)
120
Este vetor contém a sequência do promotor trc, sendo que seus níveis de expressão
são regulados pela proteína repressora LacIq (destacada na figura pelo boxe vermelho). (Fonte:
Coelho, 2007).
A questão de obter níveis de expressão gênica significativos ainda enquadra outro
promotor muito utilizado em vetores de expressão, o pT7. Este promotor é derivado do fago T7 e
representa uma sequência de alta afinidade para a RNAP, gerando altos níveis de transcritos. A
força deste promotor impulsionou o desenvolvimento de vetores de expressão como os pET,
tornando-os a escolha para a expressão de genes de interesse (Fig. 55).
FIGURA 55: FIGURA REPRESENTATIVA DO VETOR DE EXPRESSÃO PET
121
123
127
A estabilidade das proteínas é um ponto chave para obter uma alta produção dos
produtos desejados. A instabilidade das mesmas se deve, principalmente, à degradação as que
estão expostas. Este aspecto é dependente de diferentes fatores, como: a espécie hospedeira,
que está sendo utilizada para produzir as proteínas recombinantes, e a própria estrutura da
macromolécula.
A linhagem que está sendo utilizada para a expressão de proteína recombinante afeta
a estabilidade e a estrutura da macromolécula produzida. Este fato está diretamente relacionado
com a presença e concentração de proteases produzidas naturalmente pelas células
hospedeiras.
As proteases podem estar presentes tanto no meio intracelular como na membrana
externa. Dentre elas, as mais estudadas são a proteína Lon, e a OmpT. Linhagens deficientes
para estas duas proteases já se encontram disponíveis comercialmente, como as BL21 (DE3),
BL21 (DE3) pLysS e a BL21 (DE3) pLysE (Invitrogen). A ausência destas duas proteases
demonstrou que a expressão nestas linhagens de bactérias modificadas apresenta uma redução
na degradação das proteínas produzidas.
O uso de bactérias deficientes em proteases demonstrou seu valor na expressão de
proteínas heterólogas e a redução da degradação de macromoléculas aumentou os níveis de
produção. Outra estratégia para alcançar o mesmo objetivo é a modificação da estrutura da
proteína.
Sistemas de expressão eucariotos são muito similares aos de procariotos. Eles são
constituídos por vetores de clonagem que contém os elementos genéticos que permitem a
expressão do gene de interesse em células eucariotas. Logo, estes vetores são constituídos por:
I. Uma sequência que permita a seleção do transformante em células eucariotas;
II. Sequências que permitam uma eficiente transcrição de genes eucariotos, como
um promotor eucarioto,
III. Sequência de poliadenilação, permitindo a adição da cauda poliA ao RNAm.
Um exemplo de vetor de expressão eucarioto está representado na Fig. 59. O pVAX é
um vetor que possui todos os elementos genéticos para a expressão gênica em células de
mamíferos. É um vetor muito utilizado no desenvolvimento de vacinas de DNA.
FONTE:
Este vetor possui todos os elementos genéticos necessários para a expressão gênica
em células de mamíferos, como o promotor do citomegalovírus humano (CMV), que permite
altos níveis de expressão; o sinal de poliadenilação derivado da sequência codificadora do
hormônio bovino (BGH), que confere maior eficiência na terminação da transcrição e da
poliadenilação do RNAm. Além disso, o vetor foi construído de acordo com as normas do “Food
and Drug Administration (FDA)”, contendo somente as sequências necessárias à replicação em
E. coli ou para a expressão em células de mamíferos. (Fonte: Coelho, 2007).
Assim como discutido para os organismos procariotos, outras sequências importantes
também podem ser adicionadas ao vetor de expressão eucarioto, dependendo dos objetivos. No
caso de o vetor ser um plasmídeo, o qual se replicará de maneira independente aos
cromossomos, este deve conter uma origem de replicação eucariota. Contudo, como a
manipulação deste tipo de células é um processo mais complicado, geralmente os
procedimentos se realizam inicialmente em células procariotas, para depois prosseguirem em
eucariotas.
Para isso, frequentemente se utilizam plasmídeos que possuam duas origens de
replicação: um procariota e outro eucariota. Estes vetores são conhecidos como “shuttle”. Além
da origem de replicação, estes plasmídeos são construídos contendo dois genes que permitam a
seleção das células transfectadas com o vetor recombinante.
Assim como a origem de replicação, uma das sequências está relacionada com a
seleção em células procariotas e, a outra, em células eucariotas. Estes vetores “shuttle” têm sido
desenvolvidos para a expressão de proteínas recombinantes em leveduras e para células de
insetos e de mamíferos.
Uma alternativa à expressão em plasmídeo consiste na integração desta sequência ao
DNA cromossomal da célula hospedeira. Neste caso, o vetor deve conter um segmento de DNA 136
homólogo a uma região do cromossomo do hospedeiro – o sítio de integração cromossomal -
para permitir o processo de recombinação homóloga.
Apesar do desenvolvido e aperfeiçoamento de vetores de expressão eucarioto, não há
um sistema que atenda todas as modificações proteicas de interesse. Por isso, devem-se
analisar as características da proteína de interesse e, a partir disso, examinar diferentes
sistemas de expressão e tipos celulares a serem utilizados na produção da proteína de
interesse.
S. cerevisiae é uma levedura constituída por uma única célula, a qual pode se
apresentar de forma esférica ou oval (Fig. 60A). A multiplicação destas células dá um aspecto
em ágar semelhante a uma bactéria (Fig. 60B).
138
FONTE:
PICHIA PASTORIS
Pichia pastoris é uma levedura metilotrófica, o que significa que ela é capaz de crescer
em meio de cultura contendo metanol como única fonte de carbono. Historicamente, o que
chamou a atenção quanto a esta levedura é que a mesma cresce facilmente em meio de cultura
barato sob produções a nível industrial.
Outros aspectos, além dos baixos custos de manutenção da cultura de Pichia pastoris,
são vantajosos para a utilização desta levedura para processos biotecnológicos. A sua cultura
não apresenta um alto nível de fermentação. Este processo resulta na geração de etanol, um
componente que em culturas de alta densidade celular pode atingir níveis tóxicos. A toxicidade 143
desta substância inviabiliza o crescimento da cultura de leveduras.
Por apresentar baixos níveis de fermentação, isto constitui uma vantagem do uso de
Pichia pastoris como hospedeiro para a expressão de proteínas em comparação a S. cerevisiae,
pois a cultura de Pichia pastoris pode alcançar altas densidades celulares. Há relatos de que o
crescimento em peso seco obtido pode atingir cerca de 100g/L, ou mesmo, quantidades maiores.
Considerando todas as vantagens descritas e o fato de que a densidade celular está diretamente
relacionada com a quantidade de proteínas produzidas, ideias surgiram com a finalidade de
transformar Pichia pastoris como um sistema de produção de proteínas recombinantes.
Um dos experimentos iniciais com a levedura para a expressão de proteínas de
interesse comercial foi à tentativa de expressar, em altos níveis, o antígeno de superfície do
vírus da hepatite B. Para isso, foi desenvolvido um sistema de expressão do tipo integrativo, que
continha a sequência promotora e a terminadora derivadas do gene da enzima álcool oxidase.
Atualmente, esta é uma das características que tornam esta levedura como uma
hospedeira atraente para a expressão de proteínas heterólogas, pois este vetor permite obter
altos níveis de expressão proteica.
O vetor de expressão é constituído do promotor, da sequência terminadora e do sinal
de poliadenilação derivados do gene que codifica a enzima álcool oxidase. O plasmídeo é um
vetor “shuttle”, contendo uma origem de replicação para Pichia pastoris e outra para E. coli. Além
disso, o vetor contém a sequência codificadora da ampicilina, o que permite a seleção dos
plasmídeos recombinantes em E. coli. Outro gene encontrado no plasmídeo é o codificador da
enzima histidiol desidrogenase (his4). Esta marca permite a seleção de transformantes
prototróficos His+ quando os vetores são transformados em uma linhagem de Pichia pastoris
deficiente para a expressão deste gene, as his4. Portanto, somente as células transformadas
serão hábeis de crescer em meio deficiente em histidina. O mapa do vetor está demonstrado na
Fig. 61.
144
FONTE:
Os vetores de expressão utilizados em Pichia pastoris geralmente são integrativos. O
objetivo é permitir que a sequência de interesse, clonada entre a região promotora e
terminadora, se integre ao genoma do hospedeiro, a fim de evitar problemas de instabilidade do
plasmídeo. Estes vetores possuem em sua estrutura sequências de DNA homólogas às do DNA 145
do cromossomo da levedura nas regiões proximais do gene histidiol desidrogenase, o que tem
por finalidade facilitar a integração do material genético transformado por recombinação
homóloga.
O processo de recombinação homóloga está envolvido com dois fatos interessantes. O
primeiro, é que a sua conclusão ocorre com a troca do gene AOX1 pela sequência de interesse.
Isto permite uma segunda forma de seleção dos transformantes. Há um segundo gene funcional
presente no cromossomo da célula hospedeira, o AOX2. Este gene, apesar de funcional, ele é
menos efetivo, resultando em um crescimento lento da levedura na presença de metanol. Outro
ponto a considerar, é que várias cópias podem ser integradas ao genoma, o que está
relacionado com os níveis de expressão.
O promotor AOX1 é regulado transcricionalmente pelo substrato metanol. O uso deste
indutor é vantajoso sob o ponto de vista econômico, pois seu custo é considerado como
relativamente barato. A regulação da transcrição, a partir deste promotor, também é regulada
pela presença de glicose na cultura. A ativação de AOX1 e, portanto, o início da transcrição
somente se inicia na ausência completa de glicose.
Após a indução da expressão com o metanol, são obtidos altos níveis de expressão,
equivalentes àqueles obtidos por genes altamente expressos e que estão sob o controle dos
promotores envolvidos com a via glicolítica. Na presença de metanol, observa-se que os níveis
de expressão da enzima álcool oxidase representam cerca de 30% da proteína celular total de
Pichia pastoris, o que confirma os altos níveis de expressão obtidos a partir deste promotor.
Além disso, esta sequência promotora é fortemente regulada, sendo reprimida em condições de
crescimento com a ausência de metanol.
Assim, por a transcrição ser fortemente regulada, a expressão da proteína de interesse
é acionada e desligada em tempos determinados. Essa característica impede a expressão por
períodos inapropriados de proteínas tóxicas à cultura celular e dificulta a proliferação, na cultura
de leveduras, daquelas que não expressem o gene de interesse.
As proteínas expressas por este sistema podem ser apresentadas tanto como
intracelulares como sendo secretadas. Essa característica depende da adição ao vetor de
expressão de um peptídeo sinal que permita o endereçamento proteico. Nestes casos,
frequentemente é utilizado o peptídeo sinal derivado de S. cerevisiae (Fig. 62).
146
Os fungos filamentosos são assim, como as leveduras, um sistema em teste que tem
ganhado cada vez mais espaço na biotecnologia para a expressão de proteínas recombinantes.
Entre os fungos utilizados com este propósito estão o Filamentous fungus, o qual exibe alta
capacidade de secreção de proteínas, e os fungos Aspergillus niger e Aspergillus oryzae, que
têm sido, há algum tempo, utilizados na produção de alimentos. Outros fungos, como o
Metarhizium anisopliae, vêm sendo testados quanto ao seu potencial no controle de insetos.
O uso de fungos filamentosos apresenta propriedades que os tornam hospedeiros
potenciais para a expressão de proteínas eucariotas. Contudo, este sistema também apresenta
desvantagens como o baixo nível de expressão. Apesar de estudos na área terem apontado
alternativos potenciais para solucionar o problema, estes hospedeiros ainda apresentam como
desvantagem a escassez de conhecimentos, o que dificulta a sua manipulação e o
desenvolvimento de ferramentas para a expressão de proteínas. Enquanto isso, uma opção é o
uso de outros hospedeiros, como os baculovírus.
BACULOVÍRUS
FONTE:
5 APLICAÇÕES DA BIOTECNOLOGIA
5.9 BIORREMEDIAÇÃO
179
6.2 ALINHAMENTO DE SEQUÊNCIAS
O base calling é um programa que permite a leitura dos dados gerados pelo
sequenciador, reconhecendo a sequência nucleotídica obtida a partir dos dados brutos da
sequência e, ainda, atribuindo valores de qualidade sobre a sequência gerada. Alguns
programas podem ser utilizados neste tipo de processamento, e geralmente, cada sequenciador
vem com um determinado programa. Contudo, um dos mais utilizados com esta finalidade é o
PHRED.
O PHRED é um software desenvolvido na Universidade de Washington e é
referenciado como o programa padrão para o base calling. Inicialmente, ele reconhece a
sequência de nucleotídeos gerada a partir de determinados arquivos, como os de
cromatogramas de sequenciadores automáticos de DNA. Em seguida, o programa atribui valores
de qualidade a cada nucleotídeo gerado, determinando a precisão do resultado obtido pelo
sequenciamento. Estes valores são importantes, pois determina a confiabilidade de uma
sequência obtida, indicando qual deve ser submetida a um novo sequenciamento.
Após o processamento da sequência de dados brutos, o passo seguinte consiste na
análise da sequência propriamente dita. O passo inicial é a busca de contaminantes na
sequência obtida, ou o mascaramento de vetores. 182
184
FONTE:
A seta vermelha indica onde o usuário deve clicar (BLAST) para ter acesso ao
programa VecScreen.
FONTE:
Ao clicar sobre “BLAST”, imediatamente, a página abrirá, e, ao final dela, haverá o
quadro representado na Fig. 65.
Ao final dela, o usuário encontrará diversas opções de programas de BLAST
especializados. Dentre eles, o VecScreen (representado em roxo na figura) pode ser utilizado
para analisar a sequência de interesse quanto à presença de contaminantes.
O usuário deve escolher a opção vetor contaminação (VecScreen). Esta escolha 185
permitirá a abertura da página (Fig. 66). A sequência a ser analisada deve ser depositada no
quadro que aparece abaixo da palavra “FASTA”. A sequência é então submetida pela escolha
“run VecScreen”.
FONTE:
A figura apresenta o quadro onde a sequência a ser analisada deve ser depositada (já
representada aqui por uma aleatória). Após este passo, a análise prosseguirá após o comando
do usuário, que deve clicar sobre “Run VecScreen”.
O formato “FASTA” se refere a uma sequência identificada por uma terminologia
iniciada pelo símbolo “>”. Isto significa que uma nova sequência está sendo iniciada. A
sequência propriamente dita é dita estar neste formato quando não apresenta qualquer espaço 186
ou quebra.
O resultado obtido após a utilização do programa VecScreen é apresentado sob uma
forma gráfica, como demonstrado na Fig. 67.
FONTE:
188
FONTE:
>A1
GTACAAAAAAGTTGGGCGCCTCGCCCAAAAGAGTTTGGTTAATAACCTCGTGAGAGGATATGCGAAAGA
TGTTAAGTTTGGTGCTGAGGGTAGGAAAGCAATGCTTGTTGGTGTCAACCTCCTAGCTGATGCTGTATC
TGTAACAATGGGTCCAAAGGGTAGGAATGTCATCATTGAACAATCTTGGGGAAGTCCGAAAATTACCAA 189
AGATGGAGTCACAGTGGCCAAAGCTATTGACTTGAAAGACAAGTATCACAACCTTGGAGCTAAACTTAT
TCAGGATGTAGCAAATAAAGCCAATGAGGAAGCGGGAGATGGAACTACTTGCGCTACTGTTCTTGCTAG
ATCTATTGCTAAAGAGGGATTCGATAATATTAGCAAGGGTGCAAATGCCGTTGAAATCAGACGTGGAGT
CATGGCTGCTGTTGATATTATCGTGCAAGAGCTTAAAGGTCTCAGCAGGCAGGTTACTACTCCTGAAGA
GATAGCTCAGGTTGCTACAATCTCTGCTAATGGTGATCAAACTATCGGAAATTTGATTTCCGAGGCAAT
GAAGAAGGTGGGCAATAAAGGTGTTATCACGGTCAAGGATGGAAAAACTCTTACGGATGAACTAGAACT
TATTGAGGGAATGATATTTGATCGCGGATATATTTCTCCATATTTTATACACACTTCTAAGGGAGC
>A2
GTACAAAAAAGTTGGGCGCCTCGCCCAAAAGAGTTTGGTTAATAACCTCGTGAGAGGATATGCGAAAGA
TGTTAAGTTTGGTGCTGAGGGTAGGAAAGCAATGCTTGTTGGTGTCAACCTCCTAGCTGATGCTGTATC
TGTAACAATGGGTCCAAAGGGTAGGAATGTCATCATTGAACAATCTTGGGGAAGTCCGAAAATTACCAA
AGATGGAGTCACAGTGGCCAAAGCTATTGACTTGAAAGACAAGTATCACAACCTTGGAGCTAAACTTAT
TCAGGATGTAGCAAATAAAGCCAATGAGGAAGCGGGAGATGGAACTACTTGCGCTACTGTTCTTGCTAG
FONTE:
Cada uma deve ser iniciada pelo símbolo “>” seguidas por nomes diferentes.
Após submeter às sequências para a análise, uma página será aberta com tópicos à
disposição da escolha do usuário. Neste caso, deve-se optar pela formação de “contigs” (Fig.
70).
FIGURA 70: OPÇÕES DE ANÁLISES DAS SEQUÊNCIAS OFERECIDAS PELO PROGRAMA
CAP3
190
FONTE:
Para o agrupamento de sequências, o usuário deve clicar sobre “Contigs”, o que está
representado em roxo na figura.
O resultado ideal é a apresentação de apenas uma única sequência, demonstrando
que apenas um contíguo se formou (Fig. 71). A presença de duas ou mais sequências implica na
ausência de similaridade ou mesmo de uma sobreposição adequada para a formação de um
contíguo.
FIGURA 71: RESULTADO DO AGRUPAMENTO DE SEQUÊNCIAS PELO PROGRAMA CAP3
191
FONTE:
6.7.1 Blast
O programa BLAST (“Basic Local Alignment Search Tool”) realiza um alinhamento local
de sequências, sendo comumente utilizado na análise de similaridades. Ele representa um
programa de busca projetado para explorar todas as bases de dados disponíveis de sequências
de DNA ou de proteínas presentes em bancos de dados. A sua implementação mais conhecida é
aquela presente no NCBI - National Center for Biotechnology - e o da Universidade de
Washington, conhecido como WU-BLAST.
O Programa BLAST exposto pelo NCBI representa um conjunto de serviços, os quais
podem beneficiar os usuários de diversas maneiras. As opções aos pesquisadores variam de
acordo com o tipo de sequência inicial a ser analisada, se é de nucleotídeos ou de aminoácidos,
se o banco de dados utilizado na busca é de nucleotídeos ou de aminoácidos, se a pesquisa
está restrita a um determinado microrganismo. Além de parâmetros relacionados aos algoritmos
de busca. Para melhor exposição das diversidades que o BLAST oferece para a busca de
sequências, este programa pode ser dividido em:
I. blastp, o qual é utilizado para comparar sequências de aminoácidos em bancos
de dados de proteínas;
II. blastn, programa formulado para comparar sequências de nucleotídeos em
bancos de dados de DNA;
III. blastx, para a comparação de uma sequência de nucleotídeos, representadas
em todas as fases de leitura (ORFs), com bancos de dados de proteínas;
IV. tblastn, utilizado na comparação de sequências de proteínas com um banco de
dados de sequências de nucleotídeos representados em todas as ORFs;
V. tblastx para comparar as ORFs de uma sequência de nucleotídeos com as
ORFs de todos os nucleotídeos depositados em um banco de dados de nucleotídeos.
A subdivisão do BLAST encontrada na página está demonstrada na Fig. 72.
193
FONTE:
Os pesquisadores podem optar por uma das subdivisões disponíveis nesta página, de
acordo com o tipo de sequência inicial a ser analisada e com o se banco de dados utilizado na
busca.
A análise de sequências pelo BLAST pode ser realizada de diversas maneiras. O
primeiro ponto consiste em delimitar o espaço da busca, como:
a. O banco de dados a ser utilizado na busca; e
b. O organismo específico.
II. Para que uma determinada sequência seja submetida à busca de
similaridades pelo BLAST, ela deve se apresentar sob determinados formatos específicos, como:
III. Formato FASTA;
IV. Por identificadores, que geralmente são códigos para acesso aos bancos de
dados mantidos pelo NCBI como o GenBank;
V. Sequências puras, que podem ou não ser intercaladas por caracteres 194
brancos ou numéricos.
As buscas de BLAST serão exemplificadas aqui, nesta apostila, pelo BLASTn, pois é
um dos programas de alinhamento local mais utilizado pelos pesquisadores. Para iniciar as
buscas de similaridade pelo BLASTn, inicialmente deve-se clicar sobre a opção de escolha
(Fig.73).
FONTE:
O usuário deve clicar sobre “nucleotide blast”, local apontado pela seta vermelha na
figura.
A opção, que no caso específico foi a análise de nucleotídeos pelo alinhamento do
mesmo tipo de sequência depositada no banco de dados, abre a página demonstrada na Fig. 74.
Esta página inclui alguns tópicos que permitem que a pesquisa seja refinada em uma direção
específica.
FIGURA 74: PÁGINA DE ACESSO AO PROGRAMA BLASTN
195
FONTE:
196
FONTE:
197
FONTE:
FONTE:
No caso da Fig., onde não há uma especificação do organismo a ser pesquisado,
podem-se utilizar as iniciais do nome científico do organismo, ou mesmo de seu táxon. Após esta
inclusão, alguns nomes de organismos aparecerão, o que pode ser utilizado na busca (Fig. 78).
FONTE:
199
FONTE:
FONTE:
Os resultados obtidos a partir de buscas no BLASTn são representados em formas
gráficas, como demonstrado na Fig. 81. A Fig 81A representa graficamente o grau de
similaridade, em cores, por de toda a sequência de nucleotídeos. A Fig. 81B apresenta uma
tabela de dados, onde sequências similares são representadas pelo seu número de acesso ao
GenBank, por uma breve descrição do que ela representa, e pelo e-value. Este valor é mais
significativo quanto menor ele for. 200
201
FIGURA 82: RESULTADO DO ALINHAMENTO ENTRE A SEQUÊNCIA DE INTERESSE E
OUTRA DO BANCO DE DADOS PELO BLASTN
FONTE:
FONTE:
FIGURA 84: PÁGINA INICIAL DO PROGRAMA BLASTX.
Esta opção abre a página inicial referente ao programa BLASTx (Fig. 84).
203
FONTE:
204
FONTE:
(1) Local onde a sequência de interesse deve ser depositada; (2) seleção do código
genético referente ao organismo de análise.
O BLASTx ainda permite selecionar o tipo de sequência depositada no banco de dados
contra a qual a sequência de interesse deve ser alinhada. As sequências no banco de dados
estão organizadas pelo seu conteúdo informacional ou mesmo pela técnica de sequenciamento
adotada (Fig.). O último passo é clicar no “Blast”, assim como feito para o BLASTn, permitindo o
alinhamento das sequências.
FIGURA 86: REFINAMENTO DO ALINHAMENTO PELO BLASTX DE ACORDO COM O TIPO
DE SEQUÊNCIAS DEPOSITADAS NO BANCO DE DADOS
205
FONTE:
Os resultados do BLASTx são apresentados sob uma forma gráfica (Fig. 87) e de
alinhamentos (Fig. 88), assim como o BLASTn. Contudo, vale ressaltar que os resultados se
referem ao alinhamento entre aminoácidos, e não de nucleotídeos.
FIGURA 87: RESULTADO GRÁFICO DO ALINHAMENTO PELO PROGRAMA BLASTX
206
FONTE:
207
Vários programas podem ser utilizados com este objetivo. Para tanto, um conjunto de
ferramentas de bioinformática disponíveis on line está presente no NCBI e no portal Expasy (Fig.
89).
FIGURA 89: FERRAMENTAS PARA A ANÁLISE DE PROTEÍNAS APRESENTADAS NO
PORTAL EXPASY
210
FONTE:
211
FONTE:
Outros programas similares ao “pI Mw tool” também são muito utilizados, como o
Protparam. Este fornece os mesmos dados do outro programa, porém com informações
adicionais (Fig. 91)
212
FIGURA 91: RESULTADO DA ANÁLISE DE CARACTERÍSTICAS FÍSICO-QUÍMICAS COM O
PROGRAMA PROTPARAM
213
FONTE:
A figura demonstra que, além do peso molecular e do ponto isoelétrico, este programa
fornece dados extras como a composição atômica e de aminoácidos da proteína. Além disso, ele
ainda prediz a meia-vida da proteína após a expressão em células de mamíferos de leveduras e
em E. coli e o coeficiente que estima a estabilidade da proteína (dados não demonstrados).
A análise molecular permitiu aprofundar ainda mais as comparações entre as
sequencias de diferentes organismos. Observou-se que quanto mais próximo os organismos 214
estão na escala evolutiva, maior a similaridade em nível de nucleotídeos e de aminoácidos.
Estas são a base de uma ciência, a genômica comparativa.
As observações feitas pela genômica comparativa são utilizadas em estudos da
estrutura primária da proteína. Um dos pontos iniciais é a realização de um alinhamento entre as
sequências de aminoácidos. Isto pode ser realizado facilmente pelo ClustalW, programa
disponível no portal do Expasy. Para isso, as sequências devem ser depositadas na página
inicial deste programa (Fig.), assim como demonstrado na Fig. 92.
FIGURA 92: PÁGINA DO PROGRAMA CLUSTALW
215
FONTE:
216
(*) significa identidade; (:) representa aminoácidos semelhantes em tamanho e carga; (.), aminoácidos
semelhantes em tamanho ou carga. FONTE: Coelho, 2007.
218
FONTE:
219
FONTE:
FONTE:
223
FONTE:
225
FONTE:
REFERÊNCIAS BIBLIOGRÁFICAS
LOODISH, H. et al. Molecular Cell Biology. 4. ed. Cidade: Media Connected, 1999.
YIN, J.; LI, G.; REN, X.; HERRLER, G. Select what you need: A comparative evaluation of the
advantages and limitations of frequently used expression systems for foreign genes. Journal of
Biotechnology. V. 127, p. 335-347, 2007.