Sei sulla pagina 1di 23

MODELAGEM COMPARATIVA EM ESCALA GENMICA DE

STAPHYLOCOCCUS AUREUS IDENTIFICA CAPACIDADES METABLICAS


DE LINHAGENS ESPECIFICAS RELACIONADAS COM A PATOGENICIDADE

O preeminente patgeno bacteriano gram-positivo, Staphylococcus


aureus, capaz de colonizar diversos nichos dentro de seu hospedeiro
humano, incluindo o trato respiratrio, pele, narinas. Como uma espcie que
possui vrias resistncias imunes e fatores de evaso, toxinas e mecanismos
de invaso. Como resultado, S. aureus uma das principais causas de
infeces de pele e tecidos moles, pneumonia, sepse e endocardite. Nos
ltimos anos, o manejo clnico deste patgeno tem sido complicado. Pela sua
contnua aquisio de resistncia aos antibiticos de linha de frente (1). Apesar
deste status mortal, existe ampla diversidade entre as cepas dentro dessa
espcie. Algumas cepas esto presentes como colonizadores assintomticos do
nariz humano (2), outras causam infeces de pele e tecidos moles, e alguns
podem causar risco de vida e doena grave (3). Uma cepa, conhecida como
USA300, substituiu outras estirpes de S. aureus para se tornar a causa
predominante de infeces causadas por MRSA nos Estados Unidos (4) e a
prevalncia est aumentando rapidamente em todo o mundo (5). Assim,
importante compreender os fatores genticos que permitem que algumas
linhagens se espalhem agressivamente, enquanto outros existem
assintomaticamente.
A epidemiologia de S. aureus e a diversidade fenotpica presente nas
diferentes estirpes se reflete em seus gentipos. Portanto, pode ser possvel
analisar mltiplos genomas de S. aureus para descobrir fatores que poderiam
ser preditores de fentipos de doena e capacidades de virulncia.
Infelizmente, as metodologias clssicas de genotipagem usados hoje na clnica,
como eletroforese em gel de campo pulsado (PFGE) e sequncia multilocus
(MLST) dependem da avaliao de genes housekeeping altamente
conservados, representativos do gene que no fornecem resoluo suficiente
para a previso de fentipos da doena (6). Devido revoluo no
sequenciamento de DNA, centenas de sequncias completas do genoma de S.
aureus so agora disponveis e podem ser analisadas usando novos mtodos.
Um desses mtodos a anlise de genes compartilhados e nicos,
dentro de uma espcie, descrito como pangenoma. Uma espcie
bacteriana pode ser efetivamente descrita pelo pangenoma que pode
ser dividido no core ncleo/central genoma (genes compartilhados
por genomas de todas as estirpes nas espcies e que so susceptveis
por codificar funes relacionadas com a biologia celular bsica). E o
genoma dispensvel [genes presentes em alguns, mas no em todos,
os representantes de uma espcie (8)]. O genoma dispensvel inclui
funes que conferem vantagens especficas condies ambientais,
como adaptao a nichos distintos, resistncia a antibiticos e
capacidade de colonizar novos hospedeiros.
Apesar de existirem muitos estudos enfocando a genmica de S. aureus,
epidemiologia, mecanismos de resistncia a frmacos e citotoxicidade, existem
relativamente poucos estudos que examinam a bioqumica bsica de S. aureus
e a funo metablica em uma escala do genoma. As reconstrues de redes
metablicas provaram ser poderosas ferramentas para a diversidade gentica
do metabolismo entre organismos (9) e entre estirpes dentro de uma espcie
(10, 11). To til como a anotao do genoma , isto no fornece uma
compreenso da integrao na funo dos produtos genticos para produzir
estados fenotpicos. Becker et al. forneceu um modelo de escala de genoma
bem acurado do modelo de S. aureus N315 (denominado iSB619) que
representou a primeira base bioqumica, genmica e gentica estruturada para
o metabolismo de S. aureus, e vrias atualizaes do modelo para esta estirpe
tm seguido este modelo (12-14). Contudo, o conhecimento de uma estirpe
nunca suficiente para representar uma espcie inteira. Atualmente, existem
48 sequncias genmicas completas disponveis para S. aureus no Centro
Nacional de Informao Biotecnolgica (NCBI) Genoma banco de dados (15)
com um adicional de 450 drafts sequncias para comparao, que permite a
compreenso dentro do pangenoma da espcie S. aureus. Neste estudo ns
partimos para construir o pangenome da espcie de S. aureus e para construir
GEMs de estirpes que representam amplitude gentica, fenotpica e patognica
dentro dessa espcie. Juntas, as sequncias genmicas e os GEMs fornecem
duas formas diferentes e complementares de explorar a diversidade dentro das
espcies de S. aureus e para comparar o ncleo genmico versus pangenmico
funcionalidade e capacidades metablicas. Nossa integrao de genmica e
os dados bioqumicos ilustram a evoluo dinmica de cepas de S. aureus, e
os resultados fornecem viso sobre os determinantes metablicos de
patogenicidade.

RESULTADOS
Caractersticas do core genoma e Pangenoma dos S. aureus
Um conjunto de sequencias do genoma de S. aureus publicamente
disponvel foi transferido do NCBI incluindo 48 genomas completamente
montados (completely assembled genomes ). A partir deste conjunto, uma rvore
filogentica foi construda usando a sequncia concatenada de sete genes
conservados housekeeping (arcC, aroE, glpF, gmk, pta, tpi e yqiL) comumente
usados para definir complexo clonal em estudos clnicos de S. aureus usando o
MLST (Figura 1A). A cepa mais afastada foi a o isolado MSHR1132 australiano
de S. aureus pertencente ao complexo clonal 75 (17). Em seguida, um conjunto
representativo de 64 cepas de S. aureus (Dataset S1) foram filtradas a partir
deste maior conjunto de dados baseado em quatro critrios: (i) resistncia a
frmacos [MRSA, MSSA, VRSA e VISA] (Figura 1B), (ii) especificidade do
hospedeiro (humano versus animal) (Fig. 1C), e (iii) epidemiolgica (MRSA
associado comunidade), cuidados de sade MRSA (HA-MRSA) e MRSA
associado ao gado (LA-MRSA)] (Fig. 1D). Assim, a topologia da rvore acoplada
com informaes fenotpicas clnicas e epidemiolgicas permitindo o
desenvolvimento de um conjunto heterogneo de cepas representativas da
espcie S. aureus.
Utilizamos estas 64 cepas para construir o pangenome do S. aureus que
pode ser usado para descrever esta espcie bacteriana. O pangenome est
dividido em trs sees: (i) o genoma central (core) (o conjunto de
genes compartilhados por praticamente todas as cepas em uma
espcie), (ii) o genoma acessrio (o conjunto de genes presentes em
alguns, mas no em todos, representantes de uma espcie), e (iii) o
genoma nico (genes nicos para membros individuais da espcie).
Porque o pangenome composto de milhares de genes, ele oferece
uma maior resoluo para a tipagem de estirpes em comparao com
tcnicas de genotipagem como MLST.
As 64 estirpes de S. aureus examinadas produziram um
tamanho de pangenoma de 7,457 genes. Baseado neste conjunto de
dados, o genoma central composto de 1.441 genes, o genoma
acessrio composto por 2.871e o genoma nico composto de
3.145 genes (Fig. 2A). Anotaes funcionais de genes no pangenome
realizado usando a base de dados Clusters of Orthologous Groups (COG) (19)
revelaram uma distribuio nica de categorias funcionais entre os trs
diferentes conjuntos de pangenomas. Quando os genes foram classificados em
metablicos e no metablicos, a maior frao do genoma do ncleo consistia
de genes com funes metablicas (58%). Estes incluram aqueles envolvidos
no metabolismo central, incluindo gliclise/gliconeognese, a via de fosfato de
pentose, e ciclo TCA. Uma frao muito menor do contedo do gene metablico
observado no genoma acessrio e nico (33% e 18%, respectivamente).
O tamanho do pangenoma e seu aumento no tamanho aps a adio
novas estirpes pode ser usado para prever a taxa futura de descoberta de
novos genes em uma espcie. Utilizamos uma abordagem de amostragem para
obter um conjunto de pangenomas de S. aureus permutados aleatoriamente
(com desagregaes especficas de genes totais, genes partilhados, e novos
genes). Ao ajustar uma funo de decaimento exponencial duplo para o
nmero de genes compartilhados, estimamos o genoma ncleo/central de S.
aureus para 1.425 genes (Fig. 3). Descoberta de novos genes e contagem de
genes totais foram usados para obter ajustes funo da lei do Heap,
resultando em valores de -0,58 e 0,31, respectivamente. O parmetro
determina o comportamento da curva. Para valores> 0, a funo no tem
assntota, indicando que o repertrio do pangenome de S. aureus pode crescer
indefinidamente quanto mais sequncias so sequenciadas.

Tamanho e contedo do genoma central fornecem informaes


sobre capacidades essenciais dos S. aureus
A cobertura do genoma de S. aureus codifica 2.800 genes; Portanto, o
tamanho do genoma central representa uma alta proporo (56%, em mdia)
de cada genoma de S. aureus (Fig. 2B). Esta poro particularmente elevada
em comparao com outros organismos incluindo Clostridium difficile (genoma
central representa 25% da mdia do genoma) (20) e Escherichia coli (central
representa 40% do genoma) (21). O fato de que cada estirpe de S. aureus ter
uma poro to elevada de genes partilhados pode ser interpretada como uma
consequncia da estrutura clonal proposta para a espcie (22). A maioria dos
1.441 genes centrais (compartilhados por todos as 64 cepas de S.
aureus examinadas) esto envolvidas nos processos housekeping.
Estes incluem funes no metablicas tais como transcrio (15%),
traduo, estrutura ribossomal e biognese (14%), e processamento e
modificao de RNA (7%). Um conjunto de 239 genes funcionalmente
anotados para serem envolvidos na transcrio e na traduo foi encontrada
em todas as estirpes de S. aureus examinadas (Fig. S1). Uma discusso
detalhada destes genes fornecida em SI Text. Destes 239 genes conservados,
94 e 87 so conhecidos por serem experimentalmente essenciais em meios LB
em E. coli (23) e Bacillus Subtilis (24), respectivamente. Portanto, os inibidores
destas protenas podem ser alvos bons para terapias antibiticas contra S.
aureus. Genes envolvidas nas funes metablicas tambm foram altamente
conservadas. Tal como funes incluindo o transporte e o metabolismo de
aminocidos (11%), transporte e metabolismo de carboidratos (7%), transporte
e metabolismo de coenzima (4%), parede celular e biossntese de membrana
(5%), e produo e converso de energia (12%). Genoma-escala da rede
reconstrues (Genome-scale network Reconstructions) para cada uma das 64 cepas
foram construdas para uma anlise integrada da funo desses genes
metablicos (ver abaixo). Juntos, os genes envolvidos no metabolismo,
transcrio e nos processos de traduo constituem 75% do genoma central de
S. aureus.
Relativamente ao genoma central, atribuies funcionais muito
diferentes esto presentes nos genes acessrio e genomas nicos. O
genoma acessrio tem uma grande poro de genes associados a
elementos genticos mveis tais como transposons e bacterifagos
[replicao, recombinao e reparao (24%)] ou aqueles com funes
no metablicas incluindo defesa (5%). As funes metablicas tambm
foram includas no genoma acessrio, incluindo aqueles relacionados ao
metabolismo de aminocidos (8%), transporte de ies inorgnicos (7%) e
metabolismo de carboidratos (6%). O genoma central enriquecido de genes
relacionados aos elementos mveis (62%), com as outras categorias sendo
pouco representado. Esta elevada proporo de elementos moveis no genoma
central semelhante para outros organismos, incluindo E. coli, e indica que a
transferncia horizontal de genes (HGT) teve um grande efeito na evoluo de
S. aureus (25-27). Na verdade, o arcaico MRSA clone, pensado para ser o
antepassado de cepas de MRSA na Europa, obteve resistncia meticilina
devido transferncia horizontal do gene mecA de uma fonte desconhecida
(1). Mesmas cepas da mesma famlia demonstraram se engajar em HGT com
outras espcies de Staphylococcus (28). Assim, a anlise de todos os eventos
de HGT em diferentes estirpes de S. aureus e sua fonte putativa podem lanar
luz sobre a evoluo destas especies (Ver SI Text para anlise de genes atpicos
s sua fonte de transferncia putativa).
Eventos Ancestrais de Perda e Aquisio de Gene afetam a
Patogenicidade de S. aureus.
Utilizamos os 1.441 genes centrais identificados para produzir uma
filogenia de S. aureus baseada numa sequncia concatenada de genes
alinhados. Os padres de presena gnica foram usados baseada na filogenia
do genoma central para inferir eventos de ganhos e perdas de genes
ancestrais usando uma abordagem de parcimnia (29). Esta anlise permitiu,
para cada n node interno da rvore filogentica, calcular (i) o nmero de
ganhos e perdas de genes e (ii) o correspondente repertrio gentico. Em
particular, ns focamos nos eventos evolutivos relacionados aos fatores de
virulncia em cada cepa porque eles tm implicaes profundas na patognese
de diferentes clones de S. aureus. O mapeamento dos eventos de ganhos
e perdas de genes revelaram que as estirpes de S. aureus foram
submetidas a reorganizao do seu repertrio gentico. Um grande
nmero de eventos evolucionrios ocorreram ancestralmente e
recentemente (Fig. S2). Por exemplo, o antepassado da linhagem
ST228 caracterizado por pela reduo macia do genoma (522 genes
perdidos), enquanto que todos as cepas LA-MRSA adquiriram
recentemente um grande nmero de genes. Considerando que o
ltimo antepassado comum de S. aureus (Sa-LCA) compreendeu 2.673
grupos ortlogos, a espcie adquiriu um grande nmero de novos
genes (4.784) durante sua histria evolutiva.

Fatores de Virulncia conhecidos de S. aureus so distribudos


de forma desigual entre os genomas central e acessrio.
Para obter informaes sobre a conservao dos fatores de virulncia em
todas as espcies de S. aureus, ns avaliamos um conjunto de fatores de
virulncia conhecidos (VFs) presentes em diferentes linhagens baseada na
literatura e pesquisa de banco de dados (30). Foram identificados um total de
90 VFs diferentes que estavam presentes em pelo menos uma das 64 cepas de
S. aureus. Dos 90 VFs, 35 foram partilhados por todas as estirpes, formando
um conjunto central de VFs. Nove dos VFs conservados so genes cap8 (B, C,
E, F, L, M, N, O e P), que esto envolvidos na sntese da cpsula de
polissacrido (PC). Outros FV conservados incluram cinco envolvidos na
produo de duas citotoxinas diferentes, nomeadamente, a Leukocidina
Panton-Valentine (PVL), codificada pelos genes lukS e lukF, e a gama-
hemolisina, codificada por hlgA, HlgB e hlgC. Quatro outros VFs conservados
codificam protenas (isdA, isdC, isdE e isdF) que se ligam componentes da
matriz extracelular como fibrinognio e fibronectina para promover aderncia.
Entre estes, o gene isdA desempenha um papel no sistema de aquisio de
ferro do S. aureus, importante para a replicao in vivo de S. aureus e
patognese da doena (31). Outro fator de virulncia cannica de S. aureus
foram altamente conservados, mas no foram encontrados entre as 64
estirpes. A Protena A (liga a imunoglobina G para interromper a
fagocitose, codificado por spa) foi encontrado em 90% das estirpes.
Alfa toxina (interrompe a membrana e aumenta a invasividade, codificada por
Hla) em 96% das estirpes. Os genes de biossntese para o pigmento de
estafiolxantina (codificado por crtMNPQ) foram encontrados em todas menos
uma das cepas. Esta estirpe (MSHR1132) foi especificamente sequenciada
devido ausncia do pigmento amarelo (17).
Vrios outros VFs foram especficos da cepa. Por exemplo, a protena do
complemento inibidor do estafiloccico (SCIN) (codificada por Scn) estava
presente em 48 das 64 cepas, e protenas inibidoras da quimiotaxia de
staphylococci (CHIPS, codificado por chp) estava presente em 27 das 64 cepas.
O sistema de deteco de quorum AGR (regula o desenvolvimento de
biofilme, codificado por agrABCD) foi encontrado em 25% De estirpes.
Entretanto, a toxina B exfoliativa foi encontrada apenas em um nica estirpe
(S. aureus 11819-97). Verificou-se que S. aureus MW2 tem uma contagem mais
alta de fatores de virulncia estabelecidos (79 VFs) seguido pelo MSSA476 (74
VFs), Mu3 e Mu50 (70 VFs). Em contraste, as estirpes ST288 apresentaram o
menor nmero de VFs (53 no total).

Modelos metablicos facilitam a investigao sobre a base


gentica da capacidade de crescimento de espcies especficas.
Muito do genoma central de S. aureus dedicado s funes
metablicas, por isso 64 genomas sequenciados de S. aureus foram utilizadas
para construir a escala genmica de reconstruo metablica espcie
especifica (Dataset S2) que foram usados para comparar o gene, a reao e o
metabolito contido entre as estirpes. Cada reconstruo serve como uma
representao compreensiva da capacidade metablica de uma estirpe de S.
aureus. O contedo compartilhado entre todas as reconstrues definem as
capacidades metablicas das cepas de S. aureus. Do mesmo modo, as
capacidades metablicas de todas as estirpes foram combinadas para definir
todo o potencial das capacidades metablicas para a espcie S. aureus, ou sua
rede panmetablica (Fig. 4A) (10).
A rede metablica central continha 700 genes metablicos que
catalisam 1.222 reaes envolvendo 1.257 metablitos. Subsistemas
metablicos altamente conservados em todos os modelos de S. aureus incluem
metabolismo lipdico, metabolismo energtico, biossntese de glicanos e
metabolismo de policetdeos e terpenoides. Reaes envolvidas nestes
subsistemas metablicos estavam altamente representados (> 95%
conservado) na rede metablica central. Em contraste, apenas 80% das
reaes de biossntese dos aminocidos foram parte da rede metablica
central. As vias de biossntese de aminocidos conservadas incluram valina,
alanina e serina. A rede metablica central tambm continha determinantes
conhecidos de virulncia metablica, incluindo catalase, uma enzima que
hidrolisa perxido de hidrognio em gua e oxignio e que usado no
laboratrio clnico para distinguir estafilococos de enterococos e estreptococos.
A produo de catalase e resistncia aos oxidantes tm mostrado ser fatores
predisponentes para colonizao nasal e subsequente infeco (32).
As reaes panmetablicas so constitudas pela unio de
diferentes reaes metablicas encontradas em todas as cepas e,
portanto, indica o pool de capacidade metablica dentro de uma
espcie. A rede panmetablico de S. aureus contm 1.090 genes
metablicos, 1.592 reaes, e 1.519 metabolitos. Cerca de 45% das reaes no
metabolismo de carboidratos no estavam presentes na rede metablica
central. Assim, estas reaes no foram partilhadas por todas as estirpes de S.
aureus examinadas. Estes formaram o maior grupo de reaes presentes nos
diferentes locais entre a rede metablicas central e panmetablicas (Fig. 4B). A
maioria destas reaes est envolvida em metabolismo do carbono alternado,
incluindo as vias catablicas para nutrientes especificos. O metabolismo de
aminocidos tambm foi desproporcionalmente presente na rede
panmetablica, incluindo as vias de biossntese para o metabolismo de leucina,
arginina e histidina, indicando que essas capacidades podem ter sido perdidas
por vrias cepas de S. aureus.
A converso de reconstrues de redes metablicas em modelos
matemticos permite a computao de fentipos em diversos ambientes de
nutrientes com base no contedo de cada reconstruo. Deste modo, as 64
estipes especificas de S. aureus das redes reconstrudas foram convertidas em
modelos metablicos de escala genmica (GEMs- genome-scale metabolic models)
que foram utilizados para calcular fentipos em mais de 300 condies
ambientais nicas, favorveis ao crescimento. Uma detalhada composio da
biomassa foi definida (Tabela S1) e utilizada para a distribuio de fluxos
metablicos levando a um crescimento timo. Reaes pertencentes ao
subsistema do metabolismo dos aminocidos fizeram a maioria das reaes em
conjuntos diferentes entre os reactomes centrais e os panreactomas (Fig. 4B).
Assim, formulamos a hiptese de que diferenas funcionais nas capacidades de
biossntese de aminocidos nas diferentes cepas de S. aureus podem permitir
que diferentes estirpes se adaptem aos diferentes ambientes nutricionais. Para
testar esta hiptese, ns simulamos o crescimento em silica para todos os 64
S. aureus GEMs em uma variedade de condies mnimas de crescimento no
meio, incluindo um meio de crescimento para S. aureus N315 (12). A anlise do
crescimento in slica revelou que todos os 64 modelos que crescem em meio
com mnimo de glicose com pelo menos as vitaminas B1 (tiamina) e B3
(niacina) para serem adicionados ao meio. Algumas das estirpes requerem
mais componentes a serem adicionados ao meio (Tabela 1). A auxotrofia de
tiamina deve-se falta de via que converte tirosina em tiamina via tirosina-
liase e tiazole fosfato sintase. A auxotrofia da niacina deve-se falta de
nicotinato-nucleotideo-difosforilase (EC 2.4.2.19). Estes auxotrofos tinham sido
demonstradas experimentalmente para S. aureus no passado (33).
Houve tambm vrias auxotrofias adicionais especficas de estirpes com
90% dos modelos (55/64) incapazes de crescer no meio silica glicose contendo
tiamina e niacina (Tabela S2). Estes modelos no tinham a capacidade de
sintetizar compostos adicionais incluindo o nucleotdeo guanina e a vitamina
riboflavina, assim como os aminocidos leucina, arginina, histidina, triptofano,
fenilalanina, metionina, prolina e tirosina (Tabela 1). Trabalhos anteriores
demonstraram que algumas cepas de S. aureus so capazes de crescer em
meios mnimos desprovidos de aminocidos depois de um longo perodo de
treinamento ou desmame para a adio de aminocido (33, 34). Confirmamos
experimentalmente que quatro cepas (USA300, N315, 8325 e Mu50) poderiam
crescer em meios suplementados com quantidades mnimas de prolina, serina
leucina, treonina, tiamina e niacina (Fig. S3). S. aureus conhecido por ter uma
complicada estrutura reguladora de genes que pode inibir seu crescimento em
meios mnimos, apesar da presena de vias biossintticas para estes
metabolitos (12, 14). Crescimento a longo prazo ou treinamento no laboratrio
para estas estirpes pode permitir um crescimento em meios mnimos definidos
aqui (35).

As cepas de S. aureus podem ser diferenciadas usando


capacidades metablicas GEM predita e pela presena de fatores de
Virulncia.
Os 64 GEMs de S. aureus foram utilizados para prever capacidades de
crescimento em carbono alternativo, nitrognio, fsforo e enxofre por remoo
de glicose, amnia, Sulfato e fosfato a partir do meio de crescimento in silico e
acrescentando fontes alternativas uma de cada vez. Mais de 300 nutrientes
alternativos foram testados em condies aerbicas e anaerbias usando
anlise do balano de fluxo (FBA) (36) para avaliar se cada S. aureus crescia
em silico (Fig. 5A). No geral, 238 nutrientes foram universalmente
catabolizados por todas as estirpes incluindo glicose e glicerol como fontes de
carbono e arginina como uma fonte de nitrognio. Outros nutrientes foram
estirpe especfica, incluindo a dulcose (42 estirpes) e a inosina (13 estirpes)
como fontes de carbono e uracilo e timidina como fontes de azoto (42 estirpes
cada). Ns olhamos especificamente para ver se os modelos eram preditivos
para avaliar o uso da arginina para o crescimento. O elemento mvel
catablico de arginina mvel (ACME- arginine mobile catabolic element ) est
presente em cepas de MRSA USA300 e tem se mostrado um elemento-chave
para sua bem-sucedida colonizao (37). No entanto, descobrimos que a
capacidade catablica da arginina foi conservado em todos os modelos de S.
aureus devido presena de um separado operon arc (codificado por arcA-
arcD) presente em todas as estirpes. Esse achado consistente com trabalhos
anteriores (38). Apesar dessa similaridade, vrias outras capacidades de
crescimento poderiam ser distinguidas nos grupos de estirpes (Fig. 5). Por
exemplo, resultados de simulao mostraram que dois isolados de S. aureus
USA300 eram as nicas estirpes capazes de usar a espermidina como nica
fonte de carbono e nitrognio devido presena de espermidina
acetiltransferase (codificada para por speG). A espermidina produzida em
nveis elevados em reas de proliferao de queratincitos, inflamao e
cicatrizao de feridas (39), condies sob as quais S. aureus invade e provoca
infeco cutnea. Confirmamos experimentalmente que apenas S. aureus
USA300 pode crescer em meio TSB suplementado com 6 mM de Espermidina,
enquanto as estirpes de S. aureus Newman e NCTC8325 no poderiam (Fig.
S4).
Outro exemplo do uso de modelos de previso para distinguir as
linhagens foi possvel atravs da combinao dos resultados simulados de
presena/ausncia de fatores de virulncia em cada estirpe. Esta combinao
permitiu a formao de um esquema de classificao que poderia ser usado
para diferenciar as cepas com um estilo de vida associado ao gado (LA) em
comparao com aqueles que foram associados humanos (HA). A classificao
foi capaz de distinguir as cepas para esses dois hospedeiros preferenciais com
base na avaliao de apenas trs fatores: presena de precursor da
estafilocinase (sak), a capacidade de catabolizar maltotriose (mlttr) e presena
de precursor de protena A de ligao a IgG (Sak) (Fig. 5B). Curiosamente,
100% das cepas positivas sak
foram associados ao ser humano. Observamos tambm que embora muitas
estirpes dos mesmos complexos clonais fossem agrupadas prximas uma da
outra, apresentaram algumas diferenas importantes. Por exemplo, as estirpes
da linhagem ST228 parece ter perdido vrias capacidades metablicas em
relao a outros, causando dois grupos separados deste complexo clonal para
agrupar-se um do outro. Portanto, capacidades metablicas do GEM-predito e
a presena de fatores de virulncia podem ser utilizado para classificar as
cepas de S. aureus com base no estilo de nicho. Assim, as ferramentas
apresentadas aqui so capazes de oferecer esquemas de classificao mais
precisos do que os usados rotineiramente para S. aureus hoje.

DISCUSSO
O pangenoma de S. aureus foi montado e aplicado para destacar a
diversidade gentica, metablica e patognica das espcies. Uma nfase
particular foi colocada na anlise de capacidades metablicas e na distribuio
de fatores de virulncia. Com base no contedo do pangenoma, os GEMs do
metabolismo foram reconstrudos e implantados para 64 cepas de S. aureus
para determinar suas diferenas funcionais atravs da computao de mdia
mnima composies (omputing minimal media compositions) e capacidades de
crescimento em mais de 300 nutrientes de fontes aerbicas e anaerbicas.
Todas as estirpes foram preditas por serem auxotrfica para a niacina e a
tiamina, enquanto que as estirpes auxotrficas especificas foram preditos para
riboflavina, guanina e leucina entre outros (Tabela 1). Modelos de capacidades
de crescimento predito e identificao de fatores de virulncia permitiram a
criao de esquemas de classificao que poderiam distinguir grupos de
estirpes baseado em relativamente poucos traos. Os resultados aqui
apresentados demonstram que as comparaes das capacidades metablicas
preditas pelo GEM entre diferentes estirpes de uma espcie que pode ser
usado para identificar biomarcadores de estirpes e para descobrir e elucidar
determinantes metablicos de virulncia.
Identificao e caracterizao da composio de uma espcie
Pangenome uma poderosa ferramenta para analisar a diversidade
genmica de uma taxonomia. O pangenome de S. aureus aqui descrito
composto por 7.457 genes nicos. Destes, 1.441 genes so compartilhados
entre todas as estirpes na espcie, formando um genoma central. A atribuio
funcional dos genes centrais revelou que eles esto mais associados com
funes housekeeping (i.e., controle de maquinaria de expresso gentica e
bioqumica bsica). Em mdia, 56% dos genes do genoma de S. aureus faz
parte do genoma central (core). Isso confirma observaes de que S. aureus
uma espcie clonal (22). Recentes estudos demonstraram que mesmo as
mutaes no genoma de isolados de S. aureus estreitamente relacionados
podem ter efeitos na virulncia, proliferao e persistncia de cepas de S.
aureus (6). Portanto, uma anlise mais profunda do conjunto das variantes
genticas poderia oferecer insights adicionais sobre a patogenicidade de S.
aureus.
Os 1.441 genes centrais foram alinhados para produzir uma filogenia
confivel comparados com aqueles derivados de um nmero limitado de genes
(Fig. S2). Em geral, a filogenia consistente com a informao da literatura,
incluindo a concordncia entre as ST e a clade. Contudo, foram observadas
algumas excees: (i) a o grupo ST5 est includo dentro de um clade
parafiltico correspondente a CC5 e (ii) S. aureus COL (ST250) colocado no
ST8 Clade embora essas excees sejam consistentes com histria evolutiva
de S. aureus [i.e., o clade parafiltico inclui membros do mesmo complexo
clonal e ST8 o predito antepassado de ST250 (40)], as diferenas entre
genotipagem do MLST e a filogenia apresentada sublinham as limitaes de
tcnicas de tipagem molecular para diferenciar entre estirpes. Alm disso, no
que se refere especificidade da distribuio das estirpes de LA-MRSA ao
longo da rvore indica que eles se originaram atravs de diferentes eventos
independentes. Em particular, identificamos um clade monofiltico de cepas
ST398, um clade de cepas de diferentes linhagens (ST425, ST133 e ST151), e
duas estirpes includas em diferentes clades (correspondentes a ST5 e ST1).
Em contraste com o genoma central, o tamanho do pangenome foi
usado para prever, via extrapolao, o nmero de sequncias genmicas
necessrias para delimitar o repertrio de genes de um clade. Nossa anlise de
regresso mostra que o pangenome de S. aureus aberto, indicando que o
repertrio de genes desta espcie teoricamente ilimitado. Este resultado est
de acordo com um experimento de microarranjo de DNA envolvendo 36 cepas
de S. aureus (41), em que a variabilidade gentica extensiva foi relatada. Uma
parte elevada de genes nicos foram encontrados por estarem
relacionados com elementos genticos mveis (isto , transposons,
fagos e plasmdeos), que podem sofrer aquisio de novos mdulos
funcionais via HGT, incluindo resistncia aos frmacos e virulncia
(42). Alm dessas ideias evolucionrias, o pangenome tem
implicaes prticas importantes. A presena/ausncia de genes a
partir do genoma dispensvel (isto , genes exclusivo de algumas
cepas) representa uma alternativa de alta resoluo para o MLST que
utilizamos para diagnosticar grupos distintos de patognicos
baseadas em biomarcadores especficos.
Examinamos especificamente a presena de fatores de virulncia no
genoma central e no pangenomes. Em geral, a maior parte do viruloma de S.
aureus conservado nas 64 estirpes examinadas. Existe apenas um VF nico
para uma nica estirpe (i.e., o gene etb, codificando a toxina exfoliativa B),
enquanto 54 VFs foram compartilhados por um pequeno nmero de estirpes,
mas no estavam presentes em todas as estirpes. Alguns fatores de virulncia
esto redundantemente presentes em todas para superar a imunidade do
hospedeiro. Por exemplo, vrias enterotoxinas so variantes nicas em
diferentes estirpes para evitar a deteco por um sistema imunolgico
dinmico do hospedeiro. A grande maioria do viruloma composto dos genes
core (central) e pseudocore (compartilhado pela maioria das cepas). A
presena destes genes interessante a partir do ponto de vista da evoluo
porque implica que S. aureus tem desenvolvido um sistema altamente
conservado para realizar seu ciclo infeccioso. De um ponto de vista aplicado,
esses genes podem representar alvos para inibidores da virulncia ou
estratgias teraputicas baseadas em anticorpos (43).
Para obter insights sobre a diversidade metablica entre cepas de S.
aureus, produzimos 64 GEMs especficos de estirpes e os utilizamos para
simular capacidades de crescimento em diferentes fontes de nutrientes. A
verificao experimental de meios de suporte de crescimento foram
parcialmente confirmadas. concebvel que certos nichos de doenas podem
ativar caminhos biossintticos latentes sob condies, e o fato de que os genes
nestas vias no se desenvolveram em pseudogenes indica que podem ter
relevncia na adaptao de nichos (44).
Uma anlise de agrupamento baseada em fentipos metablicos
calculados distinguem grupos de estirpes uns dos outros. Uma distino que
surgiu foi a identificao do isolado USA300 como o nico com a capacidade de
catabolizar a espermidina devido a presena de espermidina acetiltransferase
codificada por speG. Em humanos, sabe-se que a espermidina potencializa a
morte de queratincitos S. aureus em conjunto com pptidos antimicrobianos
(45) e vrias classes de antibiticos, especialmente -lactamicos (46).
Recentemente, estudos descobriram regies de ACME (incluindo a arginina
regio de arco catablico) em muitas estirpes diferentes, no-USA300 (47,48).
No entanto, a associao do locus speG com o ACME incomum fora de
USA300. Portanto, a aquisio de speG tem provavelmente foi til na rpida
disseminao das cepas USA300. O geme speG foi transferido horizontalmente
de S. epidermis, um colonizador de pele humana (49). Portanto, uma
comparao futura de capacidades metablicas compartilhadas entre as cepas
de S. aureus e S. epidermis pode fornecer mais informaes. Alm disso, o
antibiticos que interferem especificamente com as capacidades especficas da
estirpe tais como os identificados aqui oferecem novas formas de inibir
propagao epidemiolgicos de estirpes particularmente infecciosas.
Os GEMs aqui apresentados abrem as espcies de S. aureus para um
conjunto de mtodos e tcnicas de biologia de sistemas (50). Por exemplo,
usando esses modelos, fcil prever genes essenciais em diferentes condies
(encontramos uma mdia de 190 genes essenciais para as 64 estirpes em
meio LB; Dataset S1). Alm disso, um nico gene tem sido estendido ao estudo
de letalidade e descoberta de antibiticos sinrgicos (51). Em concluso, a
abordagem comparativa multiescala utilizada neste trabalho fornece
percepes sobre a diversidade das espcies de S. aureus. Mtodos histricos
para a classificao de cepas de S. aureus desenvolveram-se desde a digitao
de fagos at abordagens PFGE e MLST (52). Novo tecnologias de
sequenciamento de DNA de alto rendimento e tcnicas de anlise continuaro
a melhorar a nossa capacidade de rastrear e patgenos. Anlise computacional
de GEMs construdos para mltiplos estirpes de uma espcie fornece uma
poderosa ferramenta que pode fornecer informaes sobre os determinantes
metablicos da virulncia, novos biomarcadores capazes de distinguir certas
cepas uma da outro, e descobrir novos alvos farmacolgicos.

MATERIAIS E METODOS
Construindo um conjunto de dados representativo de S. aureus
Species.
As sequncias genmicas para todas as cepas de S. aureus foram
baixadas a partir do site ftp do NCBI (ftp://ftp.ncbi.nlm.nih.gov/genomes/). Para
estabelecer a relao filogentica existente entre representantes de S. aureus,
a anlise filogentica conduzido usando um concatamer de um jogo de sete
housekeeping genes (arcC, aroE, glpF, gmk, pta, tpi e yqiL) para construir uma
rvore filogentica (Fig. 1). Mltiplos alinhamentos de sequncia foram
realizado com ClustalW (55). Anlise de mxima verossimilhana (ML) foi
realizado utilizando-se a ferramenta Phyml (56), com um Whelan e Goldman
modelo de substituio de aminocidos. Apoio estatstico foi obtido por
bootstrapping no paramtrico em 100 resampled conjuntos de dados. Um
conjunto de 64 estirpes foram seleccionadas a partir do dendrograma para
criar um conjunto heterogneo de dados em termos de (i) (MRSA, MSSA, VRSA
e VISA), (ii) hospedeiro especificidade (humano vs. animal), (iii) virulncia /
associao ambiental (CA-MRSA, HA-MRSA e LA-MRSA), e (iv) rvore topologia.
Queremos amostrar estirpes de diferentes clusters de a rvore. Portanto, o
conjunto de dados final foi projetado para ser, como possvel, uma
representao imparcial de todo as espcies de S. aureus.

Identificao de genes ortlogos e construo de pangenomas.


As relaes de homologia entre os genes de cada estirpe foram
avaliados utilizando InParanoid (57). Considerando que o conjunto foi composto
por 64 cepas de S. aureus, o uso sistemtico de InParanoid para todas as
combinaes pairwise resultou em um total de 2.016 tabelas de InParanoid
como sada, representando os genes ortlogos para cada par do genoma. Estes
foram tambm utilizados para mapear o contedo genmico de todas as
estirpes de S. aureus na GEM de S. aureus N315 (ver abaixo). Os genes
representativos para cada cluster foram funcionalmente anotadas usando o
COG Base de dados (19), permitindo-nos atribuir uma categoria funcional a
cada conjunto de genes ortlogos.

Estimao de genomas e pangenomas nucleares.


Para calcular o pangenoma da espcie S. aureus, o conjunto de dados que
compreende cada S. aureus foi analisada utilizando-se o mdulo dgenoma da
Ductape suite [Galardini et al. (58)], que permitiu uma computao rpida do
pangenome usando um hit pairwise melhor bidirecional abordagem. A
estimao de mtricas de pangenome generalizadas, como core genoma e
tamanho do pangenome, foi realizada simulando pangenomas aleatrios com
nmero de genomas (N) variando de 2 a 64. Para cada N, um total de 10
combinaes aleatrias de organismos foram amostradas. De cada um destes
pangenomas, o nmero total de genes e o nmero de genes conservados e
novos foram determinados, correspondendo a pangenome, ncleo, e tamanhos
de genoma nico, respectivamente. Alm disso, esses nmeros foram usados
para estimar o pangenome parmetros (veja abaixo). Conforme relatado por
Tettelin et al. (7), a lei de Heap, uma lei emprica originalmente usada no
campo da informao (59), pode ser usado para descrever o pangenome de S.
aureus tamanho e o nmero de novos genes. Essas leis de poder, Npan =
k1N e Nnew = k2N-, foram ajustados ao nmero de genes totais e novos
genes, respectivamente, para encontrar os o melhor ajuste, usando a funo
curve_fit do pacote Python Scipy. De forma semelhante, para estimar o
genoma do ncleo de S. aureus, a funo de decaimento exponencial foi
ajustada ao nmero de genes do ncleo: Ncore = k1exp? -N = 1? + K2exp?
-N = 2? + . Para obter uma estimativa, os parmetros livres a serem
otimizados (k1, k2, 1, 2 e ) Foram optimizados com a funo curve_fit com
as seguintes inicial: 1, 1, 0,1, 0,1 e 1,400, respectivamente.

Identificao de genes atpicos de S. aureus.


O contedo GC e cdon bias de todos os genes nucleares foi utilizada
para detectar genes com composio. Para cada estirpe, o ncleo GC
distribuio foi obtido por meio do clculo do teor mdio de CG de cada core,
que representa genes que no foram transferidos; Portanto, sua distribuio
GC reflete o valor GC de no-transferido genes. Isto tem sido usado para
estimar um valor limite superior, correspondente aos valores que 99% da
distribuio. Os genes com valores de GC no includos entre esses valores
foram relatados como genes atpicos. O codo as diferenas de uso entre
genes de ncleo e pangenes foram determinadas usando a ferramenta Hidden
Markov Model (HMM) (SIGI-HMM) (60, 61) que detecta ilhas genmicas com
base em anlise estatstica do uso de codes com alta preciso (62).

Reconstruo de Modelo Especfico-Especfico.


Reconstrues metablicas em escala genmica estavam disponveis
para algumas cepas de S. aureus (12-14), incluindo um modelo previamente
publicado do nosso grupo denominado iSB619. Este modelo consiste em 615
genes que catalisam 742 reaes. Ns primeiro combinou este modelo com
outros modelos de S. aureus para formar uma referncia modelo para S. aureus
N315. Ento, ns estendemos este modelo por adicionando o ndice das bases
de dados metablicas including o enciclopdia de Kyoto De Genes e Genomas
(KEGG), SEED (63) e MetaCyc. Finalmente, a reconstruo foi curada
manualmente para formar uma reconstruo de S. aureus N315 que representa
um genoma-Representao de escala do metabolismo desta estirpe, contendo
1.475 reaes, 1.232 metablitos e 850 genes. Este modelo foi
Ento utilizado com a sequncia genmica de S. aureus N315 como
referncia
Para mapear o contedo genmico de outras cepas de S. aureus para
obter
Um conjunto de genes e reaes compartilhados presentes em todos os
genomas. Todos os genomas
Foram reannotated usando o servidor RAST (63). Em seguida, outros
Modelos de cepas de S. aureus e organismos relacionados foram
Contedo metablico especfico da estirpe. Estes incluram o
metabolismo
Modelos de 13 cepas de S. aureus (Mu50, MW2, COL, EMRSA-16
Estirpe 252, estirpe sensvel meticilina 476, JH1, JH9, RF122,
USA300, USA300 TCH1516, Newman, e N315) (14) e a
Modelo curado de B. subtilis 168 (iBsu1103) (64). Reao adicional
Foi adicionado a partir de ModelSEED (63), KEGG (65, 66) e
BIOCYC (67). Todas as reaes adicionadas foram manualmente
Para o protocolo publicado (68). MetaNetX (69) foi usado para padronizar
Metabolitos e reaes ao Grupo de Pesquisa em Biologia de Sistemas
(70)
Abreviaturas. Todas as sequcias do genoma foram descarregadas a
partir de Gen-
Bank (71) em 16 de julho de 2015. Nomes de genes conformes com o
locus NCBI
Nome de acordo com a anotao original no GenBank.
Composio da biomassa. Uma composio detalhada da biomassa
baseada na cultura
Para S. aureus no est disponvel na literatura, por isso combinamos
Biomassa de trs modelos anteriores de S. aurues (12,
13) para formar a composio de biomassa para os modelos especficos
da estirpe
Apresentado aqui. Estes modelos tambm assumiram que a produo
Metabolitos necessrios para o crescimento celular foram semelhantes
As do organismo Gram-positivo B. subtilis (64). Ns
Ajustada a composio de cidos graxos da funo de biomassa
Em dados especficos de S. aureus (72). A composio detalhada da
biomassa
fornecida no conjunto de dados S1, planilha 8 e tabela S1.
Em Silico Simulaes de Crescimento. Cada um dos 64 modelos de S.
aureus
Disponvel como um arquivo SBML (Dataset S1). Os modelos foram
carregados
Na caixa de ferramentas COBRApy (54) para realizar a anlise do
balano de fluxo
(FBA) (73). M9 mdia mnima foi simulada pela definio de um menor
Limite de -1.000 (permitindo a captao ilimitada) na bolsa
Para Ca2 +, Cl-, CO2, Co2 +, Cu2 +, Fe2 +, Fe3 +, H +, H2O, K +, Mg2
+, Mn2 +, MoO4
2-, Na +, Ni2 +, SeO4
2-, SeO3
2, e Zn2 +.
A fonte de carbono por defeito era glucose com um limite inferior de -10,
A fonte de azoto padro foi NH4
- com um limite inferior de -1000,
A fonte de fsforo padro foi HPO4
2 com um limite padro de
-1000, ea fonte de enxofre padro foi SO4
2- com um padro
Limite de -1,000 (Dataset S1, planilha 5). Para identificar
Fontes de carbono, nitrognio, fsforo e enxofre, cada
Destes compostos padro foram removidos do meio
Ligado a 0) um de cada vez, e foram adicionados compostos diferentes
Para determinar se eles apoiaram o crescimento. Para simulaes
aerbicas, O2
Foi adicionado com um limite inferior de -20 e a 0 para simulaes
anaerbicas.
Para os modelos com auxotrofias identificadas, o composto
Para a qual uma deformao era auxotrica (Dataset S1, folha de
trabalho 6) foi
Adicionado ao M9 mnimo de mdia para cada simulao com um
Limite inferior de -1. Os fentipos de crescimento modelo foram
determinados
Usando FBA um de cada vez em cada condio com a biomassa do
ncleo
Reao como o objetivo. Fontes de nutrientes com taxas de crescimento
acima
Zero foram classificados como sustentveis ao crescimento, enquanto
fontes de nutrientes
Com taxas de crescimento de zero foram classificadas como no
sustentveis.
O solucionador de programao linear Gurobi 6.0 (Gurobi Optimization,
Inc.) foi utilizado para realizar FBA.
Preenchimento de lacunas. A reconstruo e anlise baseada em
restries
Implementao do algoritmo SMILEY (growMatch) (74)
Foi utilizado para prever conjuntos de reaes de troca e preenchimento
de
Modelos que no conseguiram simular biomassa in silico em M9
Com glicose aerbia utilizando FBA. O universal
Conjunto de reaes utilizadas para preencher lacunas foi baseado no
MetaNetX.
O solver de programao linear de inteiros mistos Gurobi 5.0.0 foi
Usado (Gurobi Optimization Inc.) para implementar SMILEY. Quando
Adicionar contedo para permitir que as estirpes cresam, reaes de
troca
Indicando que as auxotrofias especficas da estirpe foram priorizadas em
relao adio de
Novas reaes sem evidncia gentica. Glucose (carbono
Fosfato, sulfato, nicotinamida e tiamina foram
Tanto experimentais como computacionalmente verificados. Contudo,
Outros substratos, tais como os nucleosidos citidina e uridina,
Foram preditos que no eram necessrios no seu modelo metablico.
Previso de todo o crescimento-suporte de carbono, nitrognio, fsforo,
E Fontes de Enxofre. O possvel carbono, azoto,
Fsforo e enxofre de cada estirpe de S. aureus
Foram identificados usando FBA. Em primeiro lugar, todas as reaes de
troca
Metabolitos contendo os quatro elementos foram identificados
A partir das frmulas de metabolitos. Cada composto extracelular
Carbono foi considerado uma fonte potencial de carbono,
exemplo. Em seguida, para determinar o possvel carbono de suporte ao
crescimento
Fontes, o limite inferior da reao de troca de glicose foi
Restrita a zero. Ento o limite inferior de cada troca de carbono
A reaco foi ajustada, uma de cada vez, a -10 mmol gDW-1 h-1 (um
Taxa de captao para substratos de suporte ao crescimento), eo
Maximizada pela FBA utilizando a reao de biomassa. O substrato alvo
Foi considerado o crescimento suportando se a taxa de crescimento
prevista foi
acima de zero. Ao identificar fontes de carbono, o nitrognio padro,
Fsforo e enxofre foram amnio (nh4), inorgnico
Fosfato (pi) e sulfato inorgnico (so4), respectivamente. Predio
Fontes de apoio ao crescimento desses outros trs elementos
Da mesma maneira que o crescimento em carbono, com
A fonte de carbono padro.
Previso de Gene Essentialidade. Para simular os efeitos do gene
Knockouts, cada modelo de S. aureus foi usado com suas restries
padro
E objetivo de reao de biomassa. Para o crescimento em glicose,
O limite inferior da reaco de permuta de glucose foi ajustado para
-10 mmol gDW-1 h-1. Todos os genes em cada modelo foram batidos
Out one a time, e o crescimento foi simulado pela FBA. Esta avaliao
Pode ser realizada usando o FBA com a restrio adicional de
Ajustando os fluxos atravs de todas as reaes que no podem ocorrer
Sem um dado gene (i.e., quando as isoenzimas catalisam de forma
independente

Uma mesma reao no esto presentes) para os quais a essencialidade


est sendo
Testado igual a zero. Gene knockout cepas com uma taxa de crescimento
Acima de zero foram considerados no essenciais.
Virulome Construo. Um conjunto curado de fatores de virulncia foi
Obtidos a partir da base de dados do fator de virulncia e referncias
bibliogrficas
(30, 75). A presena destes FV dentro do S. aureus
Genomas foi determinada usando uma pesquisa BLAST no
Usando o algoritmo blastp com os seguintes limiares: e-value
<1e-20, similaridade de sequcia> 70%, e comprimento de
alinhamento> 60%.
Mapa de Calor e Construo de rvore Filogentica. Os resultados
binrios
Das simulaes crescimento / sem crescimento para cada estirpe foram
utilizadas
Para calcular uma matriz de correlao baseada em ndices de
dissimilaridade
Calculado usando o mtodo de Jaccard na funo vegdist do
Vegan R pacote. A aglomerao aglomerada de Ward da matriz
Das correlaes foi usada para agrupar as espcies usando o hclust
Funo do pacote Vegan R e usado para formar um dendrograma.
O mapa de calor foi visualizado usando o pacote gplots R
Com valores alinhados com base no dendrograma calculado.
Construo da rvore de deciso. Uma rvore de deciso (Fig. 5) foi
calculada
Valores de crescimento / sem crescimento para cada estirpe classificada
Seus principais pattipos: InPec, ExPec ou comensal. A classificao
Ferramenta de rvore, parte do pacote de software Orange Canvas (76),
Foi utilizado para calcular e exibir a rvore de deciso usando um ndice
de Gini
Critrios de seleo de atributos sem binarizao, duas folhas mnimas
Para prepruning, e m = 2 estimativa para postpruning com folhas de
Sendo a mesma classe de maioria recursivamente fundida.

Texto SI
Anlise de genes de S. aureus atpicos. Para investigar o efeito de HGT
Eventos na espcie S. aureus, buscamos genes atpicos
Dentro de cada estirpe por computao da composio de DNA (teor de
GC)
E as diferenas de uso de codes entre genes centrais e pangenes (59).
Um total de 4,277 e 1,788 genes atpicos foram identificados com o
Genoma mdio com 49 e 28 genes nicos presentes com base em
GC contedo e codon bias, respectivamente. A maioria dos
Os genes atpicos no tm nenhuma classe funcional COG conhecida. A
filogentica
Origem de cada gene atpico de S. aureus foi
O nr-banco de dados. Para cada gene o melhor no-S. Aureus hit foi
Tomada como a fonte de transferncia putativa (PTS). Hiptese
Que eventos mais recentes de HGT foram indicados por genes com
menos
S. aureus hits, i.e., aqueles mais semelhantes ao gene de consulta do
que a
PTS. Utilizamos este nmero como um ndice para estimar a
ancestralidade de
Os eventos HGT para cada PTS, uma medida que chamamos de
"ancestralidade
ndice "(AI). S foi possvel encontrar um PTS significativo
Para 25% dos genes atpicos que identificamos. Aqueles PTS com um AI
> 2 corresponderam principalmente a eventos de HGT ocorridos no
gnero
Nvel, enquanto a maioria dos mais recentes PTS (um AI 2)
Correspondeu a eventos de HGT em nveis taxonmicos mais altos
(ordem,
Classe e filo). Neste grupo, encontramos uma alta representatividade
Protenas, tais como protenas hipotticas, protenas de mobilizao,
E genes de resistncia a antibiticos, e factores de virulncia.
Avaliamos o efeito de eventos de HGT na formao da diversidade
Dentro dessa espcie. A anlise de genes atpicos mostrou como esses
So principalmente derivados de dadores taxonmicamente
relacionados (isto ,
Representantes da mesma espcie / gnero), com uma parte menor
De genes provenientes de bactrias associadas ao hospedeiro. Esta
descoberta
Sugere a presena de uma barreira taxonmica que
Quantidade de HGT nesta espcie. Os eventos do HGT podem ser
Fonte de novas resistncias aos antibiticos. Portanto, o
Nmero de genes nicos por genoma pode identificar estirpes mais
Propensos a HGT e, portanto, mais propensos a adquirir novas
funcionalidades.
Como a virulncia e os genes de resistncia aos antibiticos
Envolvidos em eventos de HGT (42, 77), cepas com maior
Genes nicos (e, portanto, mais predispostos troca de
Podem representar uma grande ameaa para a sade pblica,

Estes podem desenvolver fenotipos virulentos e / ou multirresistentes


Pela aquisio horizontal de cassetes de genes correspondentes (78-80);
Entretanto, no observamos correlao entre o nmero de
Genes atpicos eo nmero de fatores de virulncia identificados.
Conservao do gene E. A maioria dos antibiticos no apenas
Metablicas, mas tambm visam a transcrio e
Translacional do organismo alvo. Ns comparamos
A conservao de mquinas de transcrio e de traduo
Dentro de S. aureus em toda a espcie. Genes envolvidos
Estes processos foram curados a partir de E. coli e B. subtilis porque
E. coli o organismo para o qual quase todos os
Mquinas de transcrio e de traduo foram identificadas e
Caracterizada experimentalmente. No entanto, como S. aureus
Filogenticamente mais prximo de B. subtilis (ambos so Firmicutes),
Protenas de B. subtilis foram utilizadas para
Conjunto de dados. Embora existam homlogos de B. subtilis para a
maioria dos E. coli
Genes envolvidos na transcrio e traduo, alguns B. subtilis
Existem genes para os quais no se encontram homlogos no genoma
de E. coli
e vice versa. Ao todo, selecionamos 289 genes de consulta dos quais
192 so partilhados entre E. coli e B. subtilis, enquanto que 59 so
nica para E. coli e 42 so nicas para B. subtilis (Fig. S3). O conjunto
Includos genes que codificam funes para transcrio, ribossoma
Biognese, maturao de ARNt e aminoacilao e protenas
E cofactores necessrios para a traduo de mRNA e decaimento de
RNA.
Utilizando estes genes experimentalmente validados como entrada (81),
os genes
Codificando protenas da maquinaria de transcrio e traduo de ncleo
Foram preditos nas 64 cepas de S. aureus.
Acore conjunto de 239 genes envolvidos na transcrio e traduo
Foi encontrado em todas as estirpes de S. aureus examinadas. A maioria
dos genes
Codificao para protenas ribossmicas, aminoacil-tRNA sintetases,
Fatores de traduo e vrios fatores de biognese / maturao
As enzimas so universalmente conservadas em cepas de S. aureus.
Estes
Mesmos genes so essenciais tanto em E. coli quanto em B. subtilis (82-
84)
E outros organismos bacterianos (85, 86). Inversamente, 47 dos 289
Os genes estavam ausentes em todas as estirpes de S. aureus
examinadas. De genes ausentes
Em todas as estirpes de S. aureus examinadas, 7 esto presentes tanto
em E. coli como em B.
Subtilis, 33 so nicos para E. coli e 7 so nicos para B. subtilis. A
maioria
Destes genes em falta codificam funes na transcrio, o tRNA
Modificaes de ARNr e processamento de ARN.
Em seguida, examinamos genes presentes em algumas cepas de S.
aureus, mas no
outras. Estes incluram a ribonuclease RNE envolvida em RNA
E a protena ribossomal 50s L33 (RPMGA). Estes dois
As proteas foram conservadas em 28 das estirpes de S. aureus
examinadas.
RMPGA faltou em 19 estirpes, e RNE estava faltando em 10
Estirpes Embora a maioria das estirpes de S. aureus tenha retido os dois
genes
Codificando L33a (RpmGa) e L33b (RpmGb), L33a foi perdido em 19 de
As 64 cepas examinadas. L33 responsvel pelo ribossoma celular
Heterogeneidade e podem gerar ribossomos especializados em resposta
a
Condies de estresse e mudanas ambientais (87). Estas protenas
Poderia ter evoludo para satisfazer inovaes especficas no essenciais
(88) e
Portanto facilmente perdidos em evolues redutivas. O gene L33
tambm
No essencial em E. coli e B. subtilis (23, 89-91). Nossa anlise define
O conjunto mnimo e conservado de genes necessrios para codificar
funes
Que sustentam a sntese protica em vrias estirpes de S. aureus.
Acore conjunto de 239 genes envolvidos na transcrio e traduo
Foram encontradas em todas as estirpes de S. aureus examinadas (Fig.
S1). Destes,
183 estavam presentes tanto em E. coli como em B. subtilis, enquanto
23 foram
nica para E. coli, e 33 foram nicas para B. subtilis.
Protenas Ribossmicas, Aminoacil-ARNt Sintetases, Factores de
Traduo,
E vrias enzimas de biognese / maturao do ribossoma so altamente
Conservado em S. aureus. Apenas um fator de traduo, ArfA, a
alternativa
Fator A de resgate de ribossoma, estava ausente de todos os S. aureus
Estirpes Foi demonstrado recentemente que os ribossomas estavam
paralisados
MRNAs so resgatados por mecanismos duplos em E. coli: tmRNA
mediado
Transtranslao [codificada por SsrA e mediada por ArfA
Peptidil-ARNt (92)]. ArfA funciona recrutando a verso

Factor 2 (RF2) para libertar tRNA, ea presena de ArfA essencial


Na ausncia de Ssra. Alm de todos os S. aureus
Estirpes, ArfA tambm est ausente em B. subtilis. Assim, porque so
Faltando a funo de backup ArfA, a funo SsrA essencial
Esses organismos.
Certas drogas como a tetraciclina impedem que o aminoacil-tRNA
De ligao subunidade ribossomal em procariotas. Todos os S. aureus
Genomas analisados codificaram o conjunto completo de aminoacil-tRNA
Sintetases e cofatores proteicos necessrios para cobrar todas as 20
aminocidos. Das 33 aa-tRNA sintetases examinadas, 31 foram
Conservadas em todas as estirpes de S. aureus. Os dois genes em falta
incluem
SelA e SelD. SelA codifica selenocysteine sintase que catalisa
A converso de serina em selenocistena em
TRNASec. SelD codifica selenide, e gua dikinase catalisa o
Reao que produz selenofosfato, o doador de selnio para
Biossntese de selenocistena e modificao da tiuridina para
Selenouridina em certos ARNt (89). Ambos os genes esto ausentes
B. subtilis e todas as estirpes de S. aureus examinadas.
Genes Codificando para Enzimas Envolvidas em Transcrio, rRNA e
Protena
Processamento, ARN ou modificao de protenas e maturao de
ribossomas
RNases so menos conservadas em S. aureus. Dos 29 genes envolvidos
na
Transcrio, 12 estavam ausentes em todas as cepas de S. aureus. Dos
12 genes
Faltando, 7 tambm esto ausentes de B. subtilis incluindo RpoE, RpoH,
E RpoZ bem como FecL, DmsD, Mfd e TorD. RpoN era
Presente tanto em E. coli como em B. subtilis, mas faltando em todos os
S. aureus
Estirpes examinadas. Finalmente, SigVWXZ estava ausente em todos os
S. aureus
Apesar de estarem presentes em B. subtilis indicando diferentes
Estratgias de controle transcricional.
Dos 33 genes que codificam as enzimas de modificao do rRNA
Em E. coli e B. subtilis, 7 esto ausentes em todas as estirpes de
S. aureus examinado. Destes, 4 subunidades grandes de ARN ribossomal
Metiltransferases tambm esto ausentes em B. subtilis (RlmE, RlmF,
RlmJ, e RlmM). RlmA e RsmJ encontram-se tanto em E. coli
E B. subtilis mas no S. aureus. Os mutantes RsmJ em E. coli so frios
Sensveis e apresentam um defeito de crescimento a 16 C. Dos 39
genes
Examinados na montagem de ribossomas, 33 esto presentes em todos
os S. aureus
Estirpes Dos genes em falta, todos os cinco tambm esto todos
ausentes em B. subtilis.
Dos 27 genes que codificam RNases e protenas relacionadas, 9 foram
Ausncia em todas as cepas de S. aureus. Foram encontrados 18 em
todos os
Cepas analisadas, incluindo dois genes exclusivos de E. coli (ausente de
B. subtilis, RNB e RNT). RNases geralmente abrigam ampla,
s vezes se sobrepem com outras RNases, tornando
Difcil determinar a sua essencialidade intrnseca. Alm disso, comparou
Com as outras categorias de protenas analisadas acima, o conjunto de
As ARNases em bactrias gram-negativas e gram-positivas so
Diferentes, e algumas RNases so essenciais em um organismo, mas
no
No outro (89, 93). Alm disso, descobriu-se que um gene
Diferencialmente distribudo em cepas de S. aureus, o RAD
Protena de ligao RnE. O RnE encontrado em E. coli mas no em B.
Subtilis e foi encontrado em 43 dos 64 genomas de S. aureus analisados.
RnE uma endonuclease que cliva regies de cadeia simples de
Transcritos de pr-ARN. Sua funo semelhante conservada RnjA
E RnjB, duas enzimas encontradas apenas em bactrias gram-positivas.
Proteas Ribossicas. A principal funo de uma protena ribossomal

Estabilizao da estrutura do rRNA. Dos 60 genes que codificam


R-protenas presentes em ribossomas de E. coli e / ou B. subtilis, 58 so
Presente nas 53 cepas de S. aureus examinadas. Apenas um gene
(RpsV / sra) que codifica a protena S22 / RpsV associada ao ribossoma
Estava ausente em todas as estirpes de S. aureus examinadas. Este
gene tambm
Ausente em B. subtilis. No essencial em E. coli e
Subestoqumetro da subunidade ribossmica 30S.
A maioria das estirpes tende a reter os dois genes que codificam L33a
(RpmGa) e L33b (RpmGb), mas L33a foi perdido em 19 dos
53 estirpes examinadas. L33 conhecido por ser responsvel pela
Heterogeneidade ribossmica, provavelmente gerando ribossomos
especializados
Em resposta a condies de estresse e mudanas ambientais. Estes

Protenas poderiam ter evoludo para satisfazer inovaes no essenciais


E portanto poderia facilmente ser perdida em evolues redutivas. Esse
gene
tambm no essencial em E. coli e B. subtilis.
Fatores de traduo. Alm dos componentes ribossmicos centrais,
Sntese de protenas requer vrios fatores de traduo que garantem
Velocidade e fidelidade da traduo, bem como a funcionalidade da
O poliptido nascente. A maioria deles so encontrados em todos os S.
aureus
Cepas examinadas, ilustrando a conservao desta bactria
Aparelho no mundo bacteriano. Apenas um fator de traduo,
ArfA, o fator alternativo A de resgate de ribossomo, estava ausente de
Todas as cepas de S. aureus. Foi recentemente demonstrado que os
ribossomas
Em mRNAs nonstop so resgatados por mecanismos duplos em E. coli:
A transtranslao mediada por tmRNA (codificada por ssrA) e
ArfA mediada peptidyl-tRNA hidrlise (55). Funes ArfA
Recrutando o factor de libertao 2 (RF2) para libertar tRNA e
A presena de ArfA essencial na ausncia de Ssra. Alm
A todas as estirpes de S. aureus, ArfA tambm est ausente em B.
subtilis,
Tornando a funo SsrA essencial nesses organismos.
Aminoacilo-tRNA Sintetases. Aminoacil-tRNA (aa-tRNA ou carregado
TRNA) tRNA ao qual o seu aminocido cognato ligado quimicamente
(carregada). Certas drogas como a tetraciclina impedem que o
aminoaciltRNA
De ligao subunidade ribossomal em procariotas. Todos
Os genomas de S. aureus analisados codificaram o conjunto completo de
aminoaciltRNA
Sintetases e cofatores proticos necessrios para
20 aminocidos cannicos. Das 33 aa-tRNA sintetases examinadas,
29 foram conservadas em todas as estirpes de S. aureus.
SelA codifica selenocysteine sintase que catalisa a converso
De serina para selenocistena em tRNASec carregado com serina.
SelD codifica selenide, e gua dikinase catalisa a reao
Que produz selenofosfato, o doador de selnio para
Biossntese de selenocistena e modificao da tiuridina para
Selenouridina em certos ARNt (94). Ambos os genes esto ausentes
B. subtilis e todas as estirpes de S. aureus examinadas.
Dois outros genes, glyQ e glyS, esto presentes em B. subtilis mas no
Conservados ao nvel da sequncia com os seus homlogos em S.
aureus
Estirpes Determinou-se que glyS e glyQ esto realmente presentes
S. aureus em uma posio equivalente dentro de uma regio sintnica
que
Codifica uma glicil-tRNA sintetase de classe II, semelhante quela
codificada por
Bacillus cereus (31). Estes genes so tambm essenciais em S. aureus
(95).
Transferncia de Enzimas de Modificao de RNA. Os precursores de RNA
de transferncia (ARNt)
Esto sujeitos a modificao enzimtica ps-transcricional em
Muitas posies das pores de base ou ribose. Essas modificaes
Estabilizar a estrutura terciria do ARNt, introduzir o reconhecimento
E antideterminantes em relao s macromolculas que interagem com
RNA,
E ajustar o processo de descodificao ao nvel de ambos
Eficincia e fidelidade. Dos 44 enzimas de modificao de ARNt
Examinados, 35 dos 44 esto presentes em todas as estirpes de S.
aureus. Todos os
Nove genes ausentes (cmoA, cmoB, mnmC, selU, tmcA, trmJ, truD,
TsaA e ttcA) todos esto tambm ausentes em B. subtilis. No entanto,
dos 35
Genes presentes em todas as cepas de S. aureus, 6 esto ausentes em
B. subtilis mas
Presente em E. coli. Estes genes so dusA, dusC / DUS2, gluQ, trmA,
TrmH e truC e foram possivelmente adquiridos em transferncia lateral
de genes.
Enzimas de modificao de ARN ribossomal. Muitas bases e riboses de
Os rRNAs so ps-transcricionalmente modificados como nos ARNt. A
maioria
Modificaes so introduzidas durante a maturao pr-rRNA e
Conjunto de ribossomas, e apenas alguns so formados ao nvel do
30S e 50S ou de todo o ribossoma 70S. o
Conservao e agrupamento de modificaes no centro de decodificao
Da subunidade 30S e no centro de peptidil-transferase do 50S
Subunidade atesta seus importantes papis no processo de traduo.
Dos 33 genes que codificam as enzimas de modificao do rRNA
Em E. coli e B. subtilis, apenas 7 esto ausentes em todas as estirpes de
S. aureus examinado. Destes, 4 subunidades grandes de ARN ribossomal
Metiltransferases tambm esto ausentes em B. subtilius (RlmE, RlmF,
RlmJ, e RlmM). RlmA e RsmJ so encontradas em E. coli e
B. subtilis mas no S. aureus. Os mutantes RsmJ em E. coli so sensveis ao frio
E mostram um defeito de crescimento a 16C. YqxC encontrado em B. subtilis
S, mas no S. aureus; Este gene codifica um FtsJ / Spb1 / SPOUT-like
2'-O-ribose RNA metiltransferase (81).
Conjunto de Ribossomas, Protenas Chaperonas, Helicases e Protenas
Modificaes. Em bactrias, a montagem de r-protenas em
Precursores de rRNA para formar subunidades 30S e 50S funcionais
Requer mais de uma dzia de fatores de montagem / estabilidade, bem
Modificaes proticas. Dos 39 genes examinados, 33 so
Presente em todas as estirpes de S. aureus. Dos genes que faltam, os cinco
Todos ausentes em B. subtilis. Estes incluram rimF, rimK, ycaO, yibL e
YjgA. Em E. coli, RimK uma L-glutamato ligase que catalisa ps-translacional
Adio de at quatro resduos de glutamato C-terminal
protena S6 da subunidade ribossomal 30S, e uma mutao na rimK foi
Que conferem resistncia neomicina e canamicina (nek).
Processamento de RNA / Ribonucleases. Os vrios componentes de ARN
Mquinas de traduo bacteriana so sintetizadas como precursores
Molculas que requerem passos de processamento subsequentes,
dimensionamento e 5 'ou 3'
Por uma combinao de endonucleases e exonucleases.
Estas ribonucleases tambm desempenham um papel importante no
Actividade e qualidade dos servios de traduo e da regulamentao
Expresso de genes por RNA volume de negcios. RNases geralmente abrigam
ampla,
s vezes se sobrepem a outras RNases, dificultando a
Para determinar sua essencialidade intrnseca. Alm disso, em desacordo com
os seis
Outras categorias de protenas analisadas acima, o conjunto de RNases
Gram-negativas e gram-positivas so bastante diferentes;
Algumas RNases so essenciais em um organismo, mas no no outro.
Dos 27 genes que codificam RNases e protenas relacionadas que analisamos,
18 foram encontradas em todas as estirpes analisadas, incluindo 2
Genes nicos para E. coli (ausente de S. aureus) (RNB e RNT).
Sete genes estavam ausentes de todas as estirpes de S. aureus examinadas:
Bsn, nrnB, orn, rna, rnd e rng; Destes, apenas rnhA, bsn e
Nrna so encontrados em B. subtilis, e os outros so nicos para E. coli.
Bsn (YurI em B. subtilis) uma RNase de bactrias gram-positivas
E hidrolisa RNA inespecificamente em oligonucletidos com
5'-fosfato, portanto, provavelmente desempenhando um papel na ciclagem de
nutrientes.
Considerando que E. coli e outras bactrias gram-negativas possuem apenas
Uma oligoribonuclease essencial (nano-RNase, Orn) para degradar
Oligoribonucleidos de dois a cinco resuos sem comprimento, B. subtilis
Possui duas nano-RNases no ortolgicas com especificidade redundante:
NrnA (Ytql) e NrnB (YngD). Todas as cepas de S. aureus
O gene nrnA. RnhA uma das multivariantes Ribonucleases H
(HI = RnHA, HII = RnHB e HIII = RnHC) que clivam RNA
De hridos de ARN-ADN. Sua principal funo evitar
Replicao de DNA em locais diferentes de oriC. Todas as estirpes de S. aureus
Examinou RnHA perdido (HI), mas a funo redundante com o
Outros dois genes presentes em todas as estirpes.
Alm disso, descobriu-se que um gene estava distribudo
Estirpes de S. aureus: rnE. Este gene est presente em E. coli, mas no
B. subtilis e foi encontrado em 43 dos 53 genomas analisados. Codifica
Uma endonuclease que cliva regies de cadeia simples de pr-
Transcritos de RNA, com uma funo similar RnjA conservada e
RnjB, duas enzimas encontradas apenas em bactrias gram-positivas.
Transcrio. A transcrio o primeiro passo da expresso gnica,
Que um determinado segmento de DNA copiado para RNA pelo
Enzima RNA polimerase. Dos 29 genes envolvidos na transcrio,
17 foram conservadas em todas as cepas de S. aureus, incluindo rpoA-D e
RpoS, nusABG, greAB, rho e sigBEFH, fliA e rhiB. Dos 12
Genes ausentes, 7 tambm esto ausentes de B. subtilis, incluindo rpoE, H,
E Z, bem como fecL, dmsD, mfd e torD. RpoN estava presente em
Tanto E. coli como B. subtilis, mas sem todas as estirpes de S. aureus
examinadas.
Finalmente, o sigVWXZ estava ausente em todas as cepas de S. aureus,
Apesar de estarem presentes em B. subtilis, indicando diferentes
Estratgias de controle.

Potrebbero piacerti anche