Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1. Brasília - DF
2018
1
Brasília
2018
C376s Cavalcante, Roberto Carlos Cavalcanti e.
Suporte a decisão em Serviços de Saúde de cidades inteligentes baseado
em Prontuários Eletrônicos dos Pacientes / Roberto Carlos Cavalcanti e
Cavalcante – 2018.
101 f. : il. ; 30 cm
CDU 004.8
RESUMO
The public health system in Brazil is based on a model of decentralized care without the elec-
tronic records of patients integrated into the entire Health Care Network (RAS). This conduct
generates a large volume of patient information repetition among Health Care Units and does
not generate timely management information for making decisions that are effectively useful
for enhancing the health and well-being of the Brazilian citizen. This paper proposes a cogni-
tive system, apoiado em uma plataforma informacional integrada focused on continuous med-
ical care aimed at supporting municipal public managers in the decision-making process.
Key Words: Health Information System, Electronic Patient Records, Cognitive Computing,
Smart City
LISTA DE FIGURAS
1. INTRODUÇÃO ....................................................................................................................... 10
1.1 LEVANTAMENTO BIBLIOGRÁFICO .......................................................................... 12
1.2 FORMULAÇÃO DO PROBLEMA .................................................................................. 14
1.3 OBJETIVOS ...................................................................................................................... 15
1.3.1 Geral ........................................................................................................................ 15
1.3.2 Específicos ............................................................................................................... 15
3. METODOLOGIA ................................................................................................................... 31
3.1 CLASSIFICAÇÃO ............................................................................................................ 31
3.2 PLANEJAMENTO DA PESQUISA ................................................................................. 31
5. CONCLUSÃO..................................................................................................................... 50
5.1 OPINIÃO DE ESPECIALISTA ........................................................................................ 51
5.2 LIMITAÇÕES DA PESQUISA ........................................................................................ 52
5.3 TRABALHOS FUTUROS ................................................................................................ 53
REFERÊNCIAS .......................................................................................................................... 54
APÊNDICE I: PROVISIONAMENTO DO AMBIENTE ................................................ 61
1. INTRODUÇÃO
Em 2014, 54% da população mundial vivia nas cidades. Estimativas mostram que com
a continuidade dos processos de urbanização e do crescimento populacional, em 2050, 66%
das pessoas habitarão os centros urbanos (ONU, 2014). No Brasil, tal projeção foi atingida
antes de 1980. De acordo com o censo realizado em 2010, 84,36% da população brasileira
habita áreas urbanas (IBGE, 2010). A urbanização tem impacto direto, por exemplo, no meio
ambiente, nas habitações, na cultura, nas relações sociais e no acesso à saúde (HARALANO-
VA; MENABDE, 2005) (HARALANOVA & MENABDE, 2005), alvo dessa pesquisa. Na
busca por soluções para lidar com esse fenômeno, sugiram conceitos como os de cidades res-
ponsivas (GOLDSMITH & CRAWFORD, 2014), cidades inteligentes (Harrison & Donnelly,
2011) e cidades cognitivas (PORTMANN & FINGER, 2016).
Em particular, a preocupação relacionada ao controle da qualidade dos serviços de sa-
úde oferecidos à população nos grandes centros urbanos tem crescido nos últimos anos
(CAIAFFA, et al., 2008). No Brasil, um dos pilares do sistema de saúde é o subsistema públi-
co de saúde, que financia e presta serviços nas esferas federal, estadual e municipal através do
Sistema Único de Saúde (SUS). Os subsistemas privado e suplementar completam o sistema
(PAIM, et al., 2011). Nos anos 90, o SUS iniciou um processo de descentralização que trans-
feriu responsabilidades e recursos para estados e municípios, o que aprimorou suas capacida-
des na gestão da saúde e expandiu a rede de serviços de saúde dos municípios. Por outro lado,
evidenciou problemas referentes à gestão e à prestação daqueles serviços (SOUZA, 2001).
A regionalização, incluindo-se a municipalização, é apontada como a estratégia a ser
seguida na implantação do SUS, embora as peculiaridades e desigualdades dos municípios
brasileiros representem um grande desafio. A organização da Rede de Atenção à Saúde
(RAS), por suas características de regionalização e integração, pode reequilibrar a coerência
entre a situação da saúde e o sistema de atenção à saúde (PUPO, et al., 2014). Em 30 de De-
zembro de 2010, o Ministério da Saúde do Brasil publicou a Portaria 4.279, que define a RAS
como “arranjos organizativos de ações e serviços de saúde, de diferentes densidades tecnoló-
gicas, que integradas por meios de sistemas de apoio técnico, logístico e de gestão, buscam
garantir a integralidade do cuidado”. A mesma Portaria prevê que os sistemas logísticos, for-
temente ancorados nas tecnologias da informação, estão voltados para a promoção da integra-
ção dos pontos de atenção à saúde. Entre os principais sistemas de atenção à saúde estão: (i)
os sistemas de identificação e acompanhamento dos usuários, (ii) as centrais de regulação,
11
(iii) os sistemas de transportes sanitários e (iv) o registro eletrônico em saúde, também conhe-
cido como prontuário eletrônico do paciente (BRASIL, 2010).
O prontuário do paciente é um documento único, constituído de um conjunto de in-
formações, sinais e imagens registradas, geradas a partir de fatos, acontecimentos e situações
sobre a saúde do paciente e a assistência a ele prestada, de caráter legal, sigiloso e científico,
que possibilita a comunicação entre membros da equipe multiprofissional e a continuidade da
assistência prestada ao indivíduo (CFM, 2002). As informações consideradas fundamentais
para o atendimento ao paciente tornam-se dispensáveis após a alta, mas podem ser de grande
valor para a gestão pública, pesquisa e educação em saúde. O aumento da quantidade de in-
formações e os progressos da Tecnologia da Informação e Comunicações (TIC) têm motivado
o desenvolvimento dos prontuários eletrônicos (PATRICIO et al., 2011).
Um prontuário eletrônico é um repositório de informações sobre o estado de saúde de
um paciente, em formato computadorizado, transmitido de forma segura e acessível por usuá-
rios autorizados, baseado em um modelo de informações definido e que tem como objetivo
principal apoiar a prestação de cuidados de forma continuada, eficiente e integrada (ISO,
2005). A adoção desse instrumento na atenção à saúde proporciona maior qualidade ao aten-
dimento e à gestão pública, pois os gestores municipais poderiam reduzir a redundância de
procedimentos, aumentar a produtividade do serviço prestado e compartilhar informações
entre as unidades de atendimento (GONÇALVES, et al., 2013).
Em 2012 foram realizadas aproximadamente 537 milhões de consultas pelo SUS no
Brasil, o que representou 2,77 consultas por habitante (Brasil, 2012). Embora esta seja a últi-
ma informação oficial fornecida pelo Datasus, o site Gov-Br, informa que, em 2014, o SUS
realizou 1,4 bilhão de consultas (GOV BR, 2018). O prontuário eletrônico de cada paciente
inclui em sua estrutura: (i) a ficha clínica do paciente, (ii) os dados referentes aos exames clí-
nicos e complementares, incluindo imagens e seus respectivos resultados, (iii) diagnósticos,
(iv) tratamentos efetuados, (v) avaliações diárias, (vi) dados referentes à nutrição, (vii) prescri-
ção de medicações e (viii) relatos cirúrgicos (PINTO, 2006). O grande volume de dados gera-
dos nos atendimentos à saúde, em vários formatos e oriundos de diversas fontes de informa-
ção, bem como a velocidade em que esses dados são gerados tornam complexo o trabalho de
análise e gestão para métodos e softwares tradicionais (RAGHUPATHI & RAGHUPATHI,
2014). A computação cognitiva, que imita alguns aspectos de processos do pensamento hu-
mano, incluindo-se a capacidade de processar grandes quantidades de informação sem as ten-
dências, que são parte da natureza humana, surge como uma ferramenta capaz de vencer este
desafio (CHEN, et al., 2016). No contexto das organizações de cuidados com a saúde, a des-
12
coberta de padrões nos dados, permite a identificação e solução de questões complexas relaci-
onadas aos pacientes e à população em geral (HURWITZ, et al., 2015).
Neste trabalho propõe-se uma solução para a gestão do Prontuário Eletrônico do Paci-
ente no contexto de uma cidade inteligente como base para a proposição de um modelo cogni-
tivo que considere o PEP como fonte de informação. Este modelo prevê a produção de insu-
mos para o processo de gestão da saúde pública de modo a possibilitar ações preventivas de
forma tempestiva. Uma prova de conceito será desenvolvida para avaliação do modelo.
Uma pesquisa bibliométrica para o objeto desse estudo foi realizada sobre o tema em
análise, a saber, sistemas de suporte a decisão em serviços de saúde das cidades inteligentes
baseados em prontuários eletrônicos, com a adoção de recursos de computação cognitiva,
conforme mostrado na Tabela 1. Após o refinamento da busca, chegou-se a um total de 131
artigos. Foram descartados nove artigos repetidos, restando 122. Estes foram examinados e
categorizados segundo seu grau de adesão ao tema da pesquisa: 8 com forte adesão, 24 neu-
tros, 20 com fraca adesão e 70 sem conexão com a pesquisa. Foram considerados como esta-
do-da-arte os oito artigos com forte adesão ao tema da pesquisa.
Alemzadeh e Devarakonda (2017) apresentam um sistema de suporte à decisão cogni-
tivo, baseado em processamento de linguagem natural que identifica o estado de doenças a
partir dos registros médicos realizados nos prontuários eletrônicos dos pacientes. Os pesqui-
sadores utilizaram os modelos implementados no IBM Watson para identificar os casos em
que a doença dos pacientes hipertensos era classificada como “Desconhecida”, “Controlada”
ou “Descontrolada” e assim auxiliar os médicos na tomada de decisões sobre o tratamento
clínico, tratando-se assim de uma ferramenta de suporte ao diagnóstico e tratamento.
Os demais trabalhos, comentados a seguir, abordam questões relacionadas ao tema em
discussão a partir de perspectivas distintas, que podem ser classificadas como: aprendizado de
máquina, identificação de padrões, big data e suporte à decisão em saúde pública.
13
Prakashar & Sarkar (2015) afirmam que os sistemas baseados em computação cogniti-
va possuem, como função principal, o apoio ao processo de tomada de decisões de seus usuá-
rios. Em seu artigo descreveram um sistema inteligente baseado em um algoritmo de aprendi-
zado de máquina, que apresenta alternativas de decisões que um usuário pode tomar, a partir
de decisões tomadas anteriormente pelo próprio ou por outros usuários. O presente estudo
segue o mesmo princípio para o uso de sistemas cognitivos, ou seja, uma ferramenta de supor-
te ao processo de decisões de gestores públicos de saúde.
A eficiência dos métodos preditivos foi estudada por Padula et al. (2015), que compa-
raram a eficiência desses métodos entre a abordagem de Markov e a inferência Bayesiana.
Através de uma abordagem supervisionada de aprendizado de máquina, analisaram prontuá-
rios eletrônicos. O resultado do estudo mostrou ser viável utilizar o aprendizado de máquina
para avaliar dados reais de prontuários para análise de custos e suporte ao processo de tomada
de decisões. Nishiwake, Kanamori & Ohwada (2017) utilizaram o aprendizado de máquina,
14
1.3 OBJETIVOS
1.3.1 Geral
1.3.2 Específicos
2. REFERENCIAL TEÓRICO
Em 2008, a quantidade de habitantes das cidades atingiria pela primeira vez na história
mais de 50% da população mundial, quando cerca de 3.3 bilhões de pessoas estariam vivendo
nos centros urbanos. Prevê-se que, em 2030, esse número chegará próximo a cinco bilhões de
indivíduos (UNFPA, 2007). Em 2014, 54% da população mundial residia em áreas urbanas e
novas projeções apontam que por volta em 2050, esse percentual chegará a 66%. Cem anos
antes, apenas 30% da população era urbana (ONU, 2014).
O processo de urbanização no Brasil não é causado apenas pela migração da zona ru-
ral para as cidades, mas também pelo processo de migração, que atraiu pessoas de diversas
partes do mundo, que buscavam trabalhar na exploração de metais preciosos, como ocorreu
nos séculos XVIII e XIX (MATOS, 2012). No entanto, foi a partir da década de 1950 que
esse processo foi intensificado, por atrair a população para regiões com expansão industrial,
em busca de melhores oportunidades de emprego e qualidade de vida (VASCONCELO, et al.,
2007). A estimativa da ONU, que previa que mais da metade da população mundial habitaria
as cidades a partir de 2008, foi alcançada pelo Brasil entre as décadas de 1960 e 1970, en-
quanto as previsões para 2050 foram atingidas na década de 1980. O último censo brasileiro
realizado em 2010 apurou que 84% da população brasileira já habitava as áreas urbanas
(IBGE, 2010). Na Tabela 2 e na Figura 1 é apresentada a evolução histórica das populações
urbana e rural no Brasil.
90%
84%
80% 81%
75%
70%
68%
60%
55% 56%
50%
45% 44%
40%
32%
30%
25%
20% 19%
16%
10%
0%
1960 1970 1980 1991 2000 2010
Urbana Rural
e maior qualidade de vida para seus cidadãos (BAKIC, et al., 2012). Há ainda a definição de
que cidades inteligentes utilizam toda tecnologia e recursos disponíveis de forma coordenada
e inteligente para desenvolver centros urbanos que são integrados, habitáveis e sustentáveis
(BARRIONUEVO, et al., 2012). Existem outras diversas declarações na linha de tecnologia e
fora dela.
As grandes corporações de tecnologia da informação como IBM, SIEMENS e CISCO
entendem que a tecnologia é a base para suas definições de cidades inteligentes(ALBINO, et
al., 2015). Outros autores discordam dessa afirmação, para eles a criatividade é o elemento
viabilizador de uma cidade inteligente e assim, pessoas, educação, aprendizado e conhecimen-
to tem uma importância central para essas cidades (BOULTON, et al., 2011). A cidade criati-
va é portanto uma visão de cidade inteligente (FLORIDA, 2002).
É possível perceber a existência de um conjunto de termos que se assemelham ao ter-
mo cidade inteligente. Considerando a dimensão da tecnologia, Cidade Digital
(ANTHOPOULOS & TSOUKALAS, 2008) (ISHIDA, 2002), Ubiquitous City
(ANTHOPOULOS & FITSILIS, 2010), Cidade Cabeada (wired city) (DUTTON, et al.,
1987), Cidade da Informação (CASTELLS, 2011) e Cidades Cognitivas (PORTMANN &
FINGER, 2016). Alguns autores focam nas pessoas e apresentam termos como: Cidade Cria-
tiva (LANDRY, 2012) (FLORIDA, 2002) e outros focam na comunidade adotando o termo
Comunidade Inteligente (COE, et al., 2001).
A falta de uma definição única que ocorre para o termo cidades inteligentes, ocorre
também quando se busca identificar quais são as dimensões essenciais que as caracterizam.
Em uma dessas abordagens, tecnologia, pessoas e comunidade formam tais dimensões (NAM
& PARDO, 2011). Para Albino et al. (2015), a necessidade da integração dos diversos siste-
mas de uma cidade, como transporte, energia, educação, infraestrutura, saúde e segurança
pública, entre outros, sustentando que o ambiente das cidades não opera de forma isolada.
ARROUB et al. (2016) afirmam que uma cidade se torna realmente inteligente, quando além
da dimensão da tecnologia, as pessoas e a comunidade são destacadas igualmente. No Quadro
1 são apresentadas outras visões dessas dimensões (ALBINO, et al., 2015).
20
de forma mais inteligente ao longo do tempo (HURWITZ, et al., 2015). Os líderes e morado-
res destas cidades entenderão suas dinâmicas e a partir de insights fornecidos pelos sistemas
cognitivos, serão capazes de gerar novos benefícios para os seus cidadãos (KELLY &
HAMM, 2013).
O Sistema Único de Saúde (SUS) foi criado pela Constituição de 1988 e regulamenta-
do pela Lei Orgânica da Saúde (8.080/90), com o objetivo de prestar serviços de saúde para a
população brasileira. Os serviços são prestados pelos estados e municípios, enquanto o Go-
verno Federal realiza ações de planejamento, fiscalização e controle (BARBOSA, 2013). O
SUS possui três pilares fundamentais: (i) a universalidade do atendimento à saúde; (ii) a inte-
gralidade desta assistência e (iii) o controle social do processo através da descentralização
(STUMPF, et al., 1997). Esse processo, que foi regulamentado pelas Normas Operacionais
(NOB 01/91, NOB 01/92, NOB 01/93 e NOB 01/96), permitiu a obtenção de benefícios im-
portantes como o aumento da liberação de recursos da União, o fortalecimento das institui-
ções gestoras de saúde dos municípios e a expansão da rede de serviços municipais de saúde.
Em contrapartida, trouxe a luz problemas de gestão e da própria prestação de atendimentos
médicos (SOUZA, 2001).
A descentralização surgiu como a estratégia a ser seguida no processo de construção
do SUS. No entanto, as caraterísticas de cada município tornam-se um problema para os ges-
tores de saúde pública do País, pois existem grandes discrepâncias de infraestrutura, financi-
amento e capacidade técnica na maioria das cidades, em especial as de menor porte. Essa situ-
ação penaliza os municípios mais estruturados, que tem que atender à demanda de pacientes
vindos de outros locais, em busca de melhores condições de atendimento (PUPO, et al.,
2014). Um estudo realizado na 18ª Região de Saúde do Paraná, que possui uma população de
230.949 habitantes e conta com 21 (vinte e um) municípios, sendo 18 (dezoito) deles com
menos de 20.000 (vinte mil) habitantes, descobriu que a oferta de consultas é insuficiente para
9 das 14 especialidades médicas disponíveis (SILVA, et al., 2017).
Segundo o IBGE - Instituto Brasileiro de Geografia e Estatística 68,7% dos municí-
pios brasileiros possuem até 20.000 (vinte mil) habitantes. Ao se considerar municípios de até
cinquenta mil habitantes, esse percentual sobre para 88,2% (ver Tabela 3). Construir um sis-
tema integrado, que atenda à questão da autonomia de gestão municipal e às práticas regio-
nais, que permitam um atendimento de qualidade aos cidadãos torna-se um desafio. As redes
22
de atenção à saúde visam a consolidação de sistemas de saúde, de forma a atender aos 3 (três)
pilares fundamentais do SUS (LAVRAS, 2011).
Quantidade Percentual
Quantidade de habitantes
de municípios por faixa
Até 5.000 1.237 22,2%
De 5.001 a 10.000 1.214 21,8%
De 10.001 a 20.000 1.377 24,7%
De 20.001 a 50.000 1.087 19,5%
De 50.001 a 100.000 353 6,3%
De 100.001 a 500.000 261 4,7%
Mais de 500.000 41 0,7%
Total de municípios brasilei-
5.570 100%
ros
Fonte: IBGE (2015)
População
Modelo Sistema
de Logístico
Saúde
Unidade
Govern-
ança RAS Básica de
Saúde
Ponto de Sistema
Atenção de Apoio
Terciário Ponto de
Atenção
Secundário
processo de tomada de decisões (NOOR, 2015). Garcia e Neri (2015) mapearam diversas de-
finições sobre computação cognitiva, conforme apresentado no Quadro 2.
Language Processing - NLP (BHATY & PRASAD, 2016). A NLP é um conjunto de técnicas
computacionais para análise e representação de textos escritos em linguagem humana, que
visa extrair seu significado, de forma análoga ao processo de entendimento de uma pessoa
(LIDDY, 2001). Um estudo recente elaborado pela IBM utilizou técnicas de NLP em um sis-
tema cognitivo para apresentar, de forma automatizada, a situação da doença de pacientes
hipertensos, a partir de dados estruturados e não-estruturados presentes em seus respectivos
prontuários médicos (ALEMZADEH, et al., 2016). O estudo considerou casos de hipertensão
para avaliar o sistema, uma vez que se trata de uma doença que atinge 29% da população
americana. Os dados de treinamento foram coletados de 414 prontuários clínicos destes paci-
entes. Posteriormente, os prontuários de 5.035 potenciais pacientes foram avaliados, estes
prontuários foram extraídos de 55.000 anotações clínicas, coletadas durante 7 anos. O expe-
rimento mostrou viabilidade para a aplicação prática, embora não tenha gerado melhorias no
desempenho do atendimento médico, o que foi considerado tema para trabalhos futuros pelos
pesquisadores.
Durante a execução dessa pesquisa, grandes fornecedores do mercado de tecnologia
como IBM, Microsoft e Amazon já defendiam a eficiência de suas soluções cognitivas. Por
exemplo, o Watson, da IBM, ficou famosO por vencer um jogo de perguntas e respostas con-
tra dois campeões do concurso em 2011. As cinco capacidades principais da solução incluem:
(i) interação com humanos em linguagem natural, a partir de preferências pessoais; (ii) carga
de conteúdo orientados à indústria, tornando possível escalar e elevar o conhecimento em
parceria com especialistas de domínio; (iii) permitir que produtos e serviços detectem, racio-
cinem e aprendam sobre seus usuários e sobre o mundo ao redor; (iv) utilizar dados para
aprimorar processos de negócios e previsões, aumentando a eficiência operacional e (v) apri-
morar a exploração e a descoberta de padrões únicos, oportunidades e hipóteses viáveis (IBM,
2018). A Microsoft oferece serviços cognitivos através da plataforma Azure, que disponibiliza
recursos para: (i) processamento de imagens; (ii) mapeamento de dados e informações com-
plexas; (iii) processamento de linguagem natural e (iv) conversão de aúdios para textos
(MICROSOFT, 2018). A Amazon oferece o Amazon Rekognition, serviço de reconhecimento
de imagens e o Polly, que é utilizado para conversão de áudio para textos (AMAZON, 2018).
31
3. METODOLOGIA
3.1 CLASSIFICAÇÃO
− Preparação dos dados. Nessa fase, foi realizada a preparação da base de dados de
prontuários eletrônicos de pacientes, inclusão de novas estruturas de dados de forma a
torná-la mais próxima da realidade de uma cidade com cerca de 100.000 pacientes. Adi-
cionalmente foram apresentados casos de uso que podem suportar o gestor público de
saúde, a partir dos diagnósticos proferidos para os pacientes de uma determinada popu-
lação.
− Provisionamento do Ambiente de Simulação. Nessa fase, foi criada uma área de tra-
balho no IBM Bluemix, para que os componentes necessários à criação da ferramenta
fossem disponibilizados. Nesta área foram adicionados os serviços de banco de dados
MYSQL e WATSON. Em seguida, foi realizado o mapeamento dos serviços do WAT-
SON, a fim de identificar a melhor forma de construir modelos de análise relacionados à
situação da saúde de uma determinada população. Após a definição dos serviços, foi re-
alizada a manipulação de dados através de script SQL de modo a ajustar a base de dados
ao caso em estudo.
− Execução da Simulação. Nessa fase, foi realizada a carga da amostra, a fim de treinar
os modelos com 60% dos dados da amostra e em seguida testá-los com os 20% da
amostra, outros 20% foram descartados aleatoriamente durante o processo de treina-
33
4. EXECUÇÃO DA PESQUISA
Esta pesquisa propõe a existência de uma Rede Integrada de Atenção à Saúde - RIAS -
que disponha de uma base de dados única para armazenamento dos prontuários eletrônicos
dos pacientes. Desta forma, o acesso a tais prontuários deve ocorrer a partir de qualquer uni-
dade de atendimento (básica, secundária ou terciária). Desta forma, torna-se possível cumprir
um dos objetivos principais dos prontuários médicos: ser um documento único, fonte de co-
municação entre equipes multidisciplinares e que permita um assistência continuada ao paci-
ente.
A base única de prontuários é uma rica fonte de dados referentes à saúde de uma de-
terminada população. A partir desta base, os prestadores de serviços médicos teriam à sua
disposição todo o histórico médico do paciente, com suas consultas, exames, procedimentos,
receituários, informações valiosas sobre questões pessoais que possam interferir em um tra-
tamento, como alergias por exemplo. Outro benefício direto que poderia ser percebido é a
redução de custos, ao se evitar a repetição de exames de forma desnecessária. A indisponibili-
dade do recurso de prontuário eletrônico único pode gerar solicitação de exames já realizados
e dentro do período de validade. Os processos de análise de dados que gerem informações
quantitativas e qualitativas seria facilitado, pois não haveria necessidade de prazos de envios
das informações para posterior verificação, consolidação e disponibilização. Os dados já esta-
riam disponíveis em uma base de dados centralizada.
O objetivo deste trabalho foi o de apresentar soluções baseadas em computação cogni-
tiva, possíveis graças à disponibilidade de dados possibilitada pela integração das unidades e
pela base única de prontuários eletrônicos, como representado na Figura 4. No entanto, as
soluções tecnológicas envolvidas nesta integração, bem como as soluções de armazenamento
de dados, não serão detalhadas, pois tratam-se de soluções comuns à comunidade científica e
ao mercado de tecnologia da informação.
35
Unidade
Básica de
Saúde
PProntuários
Eletrônicos
Ponto de Ponto de
Atenção Atenção
Terciário Secundário
Nesta pesquisa, foi utilizada uma base de dados preparada por Kartoun (2015), deta-
lhada no Apêndice III, que possuia uma modelagem inicial contendo uma base de pacientes,
suas entradas em unidades de saúde, os diagnósticos finais destas entradas e um conjunto de
resultados de exames laboratoriais, que não foram utilizados neste trabalho. Foram acrescen-
tadas novas tabelas e dados com o objetivo de se obter validações sobre os dados existentes e
aprimorar a qualidade do resultado final. Essas mudanças foram documentadas em uma nova
versão do modelo de dados (Apêndice IV), que inclui as tabelas Internatio-
nal_Diagnoses_Codes_chapters, International_Diagnoses_Codes_Categories e Internatio-
nal_Diagnoses_Codes, referentes ao CID versão 10, disponível na internet e conhecido como
CID-10. Os dados das três tabelas foram consolidados em uma visão única através de um ob-
jeto view (vw_cids). Além disso, foram incluídas tabelas e dados referentes a distribuição etá-
ria (ages_ranges_expected_distribution), faixa etária (ages_ranges), bairros (neighborhoods)
e demografia dos bairros (demograph_neighborhoods).
Após a disponibilização dos dados, foi iniciada a fase de pré-processamento, para mi-
nimizar inconsistências e aprimorar a qualidade final dos dados. O processo foi iniciado pela
validação dos CIDs existentes na tabela original admissions_diagnoses, que foram compara-
dos aos dados da vw_cids. O resultado dessa comparação apresentou um percentual de 53%
de CIDs válidos. Para se buscar um conjunto de dados de maior volume, foi iniciado um pro-
cesso de ajuste dos dados, que consistia em substituir os CIDs inválidos por outros válidos.
O primeiro passo consistiu da criação de um programa em linguagem Java 1.8 que
acessou todos os CIDs da tabela admissions_diagnoses, em seguida buscou na visão vw_cids
um CID real, dentro da mesma categoria do CID em análise. Caso a categoria do CID também
não existisse, buscava-se um CID de uma categoria de código menor (-1) em relação à catego-
ria original. O programa de ajuste da base de dados está disponível no Apêndice V. Após a
execução do procedimento, 361.760 diagnósticos foram validados.
37
A cidade de referência é formada por 40 bairros, de acordo com o Censo 2010 (IBGE,
2010), que apresenta os bairros e suas respectivas populações. A população do bairro “Ou-
tros”, que consolida bairros com populações menores, foi distribuída proporcionalmente aos
demais bairros. A inclusão de um bairro genérico poderia distorcer a apresentação dos resul-
tados dessa pesquisa. Por isso, o percentual de habitantes de cada bairro foi recalculado sem
incluir os habitantes deste bairro. Os novos percentuais foram aplicados aos 99.999 pacientes
existentes na tabela Patients e uma nova distribuição quantitativa foi obtida. A Tabela 6 apre-
senta estas operações.
39
O último passo em relação aos pacientes foi distribuí-los entre os bairros da cidade, de
acordo com o sexo e a faixa etária desta população, com o objetivo de dar à base dados carac-
terísticas equivalentes às da cidade utilizada como referência e assim aprimorar os resultados
40
da pesquisa. Em uma planilha Excel foram carregados os bairros, suas respectivas populações,
as distribuições de faixa etária ajustadas nos passos anteriores. Foi realizada a multiplicação
da quantidade de habitantes de cada bairro pelo percentual de habitantes em cada faixa etária,
observando-se também o sexo do paciente. Os resultados destes cálculos (Tabela 7) foram
inseridos na tabela neighborhood_demograph do banco de dados da aplicação. Pequenos ajus-
tes manuais foram necessários por questões de arredondamento. Mais um programa Java foi
criado para acessar esses dados e atualizar a coluna neigh_id com os códigos dos bairros indi-
cados para os pacientes da tabela Patients. Após a conclusão do processo, as ações sobre esta
tabela foram concluídas, pois passou-se a ter uma distribuição demográfica significativa para
a execução da simulação. O programa utilizado para o a designação de bairros entre os paci-
entes está disponível no Apêndice VI.
A etapa final do ajuste da base de dados consistiu em representar alguns dados de saú-
de da cidade de referência. Através de uma pesquisa realizada no site do DATASUS
(www.datasus.gov.br), foi possível descobrir que a cidade de referência confirmou 610 casos
de tuberculose no período de 2006 a 2017. O caminho percorrido no site foi selecionar a op-
ção ACESSO À INFORMAÇÃO no menu principal, INFORMAÇÕES DE SAÚDE (TABNET), EPIDE-
MIOLÓGICAS E MORBIDADE. Em seguida foi selecionado o grupo de opções CASOS DE TUBER-
CULOSE – DESDE 2001 (SINAN), selecionada a opção TUBERCULOSE – DESDE 2001 e o Estado
da cidade de referência. Na tela de consulta, foram passados os parâmetros a seguir: (i) Linha:
Fx Etária 13; (ii) Coluna: Ano Diagnóstico; (iii) Conteúdo: Casos Confirmados; (iv) Períodos
Disponíveis: 2006 a 2017; (v) Município de Notificação: <Cidade de Referência>; (vi) Forma-
to: Texto pré-formatado.
41
Tabela 7 – Distribuição Demográfica entre os bairros, por idade e gênero dos habitantes
42
O ambiente Watson Studio permite o acesso aos dados nas formas: (i) Dados armazena-
dos no DB2 (sistema de gerenciamento de bancos de dados da IBM); ou (ii) Dados armazenados
em arquivos .csv (comma separated value) sem formatações. Foi utilizada a segunda opção, por
não exigir a contratação de serviços privados, o que geraria um custo desnecessário, uma vez que
os dados seriam os mesmos independente da opção escolhida. A partir desta premissa, foi inicia-
do o processo de geração de arquivos de dados.
Arquivo dados1.csv
Arquivo dados2.csv
Cada arquivo gerado precisou passar por um processo de tratamento. Embora o formato
fosse de texto, o MySQL 5.6 utiliza separadores “|” entre as colunas para dar uma visão de tabela
de dados. Além disso, o comando de pesquisa utilizado foi incluído na primeira linha do arquivo,
bem como os dados de quantidade de linhas resultantes, o tempo de duração da pesquisa e o co-
mando de desabilitação do modo de arquivamento.
43
O primeiro passo do tratamento foi abrir o arquivo .txt, para eliminar as linhas desneces-
sárias existentes antes e depois dos dados. Além disso foram substituídas os valores “NÃO” e
“SIM” por “NEGATIVO” e “POSITIVO”, respectivamente. Em seguida, foi criada uma nova
visão dos dados, na forma de uma planilha, sem os marcadores “|”. Para isso foi necessário iden-
tificar a posição em cada linha do arquivo em que se encontravam estes marcadores, através da
função:
Haviam vários marcadores em cada linha, então a função FIND foi usada em células dife-
rentes, sendo que cada uma guardava a posição de um marcador, considerando as suas posições
iniciais em n+1, sendo n a posição do marcador anterior.
Uma vez identificadas as posições dos marcadores, foi possível identificar o tamanho de
cada pedaço da informação, considerando todo o espaço ocupado entre os marcadores, através da
fórmula:
Utilizando-se as funções TRIM e MID foi possível montar uma função para extrair o con-
teúdo de cada informação. A função MID tem por finalidade extrair uma cadeia de caracteres em
uma string recebendo como parâmetros a string completa, sua posição inicial e a quantidade de
caracteres a serem extraídos. A função TRIM tem a finalidade de excluir caracteres em branco no
início e no final de uma string. Desta forma, foi montada a função:
para cada informação desejada. Todos os dados isolados de seus marcadores foram copiados para
uma nova planilha e o arquivo salvo no formato CSV (MS-DOS). Este processo foi seguido para
todos os arquivos gerados para as simulações.
44
Os arquivos de dados são os ativos fundamentais para treinamento e testes dos modelos
cognitivos. Após a geração e tratamento de cada arquivo foi necessário realizar seus uploads para
o projeto criado no Watson Studio. Na área Assets, o link New data asset foi acionado e uma área
para selecionar o arquivo de dados na máquina local foi aberta. A pasta onde foram gerados os
arquivos foi selecionado e cada arquivo passou por seu processo de upload. Após a conclusão dos
uploads os arquivos ficaram disponíveis como Assets de dados. Os detalhes deste procedimento
está disponível no Apêndice VII.
Resultados Obtidos
Nos três casos de uso utilizados os modelos apresentaram uma performance classificada
como pobre, de acordo com os indicadores Area Under ROC Curve, Area Under PR Curve,
Weighted True Positive, Weighted False Positive e Weighted Precision, apresentados pela ferra-
menta. O autor assumiu se tratar de uma consequência da utilização de uma base de dados fictí-
cia. Apesar disso, os modelos foram salvos e disponibilizados para uso. Para testar cada modelo,
foi necessário realizar os seguintes passos: acessar a página inicial do projeto, clicar no nome do
modelo, clicar na área deployments, clicar no nome do deployment realizado e por fim clicar em
test. Os resultados de cada modelo são apresentados a seguir.
No Caso de Uso #1, o modelo apresentou os indicadores Area Under ROC Curve e Area
Under PR Curve iguais a 0,50123 e 0,91164, respectivamente. O modelo recebeu a string ‘PO-
SITIVO’ no parâmetro ‘CONTAGIOUS’ e gerou as previsões apresentadas na Figura 5 indicando
que 50,78% dos casos de doenças contagiosas, provavelmente ocorrerão/ocorreriam nos bairros:
Bairro#03, Bairro#19, Bairro#31, Bairro#05, Bairro#23, Bairro#21, Bairro#18, Bairro#12 e Bair-
ro#09, por ordem descendente de probabilidade. Foram considerados trinta e nove bairros na mo-
delagem dos dados, diante da concentração de casos prováveis nos nove bairros apresentados, os
responsáveis pela mitigação desses casos teriam a oportunidade de planejar ações de maior inten-
sidade nestes locais, concentrando os esforços e investimentos, ampliando a possibilidade de me-
lhores resultados na contenção de contágios.
47
Para o Caso de Uso #2, o modelo apresentou uma performance classificada como pobre
pela ferramenta com os indicadores Area Under ROC Curve e Area Under PR Curve iguais a
0,50056 e 0,04134, respectivamente. O modelo recebeu a string ‘Bairro#12’ no parâmetro
‘NEIGHBORHOOD’ e gerou a probabilidade de 3,76% de casos de doenças contagiosas neste
bairro (vide imagem n Bairro#12). A pesquisa foi realizada também com a string “Bairro#19”,
indicando o a probabilidade de 3,85%. No caso do Bairro#12, houve uma estimativa próxima a
que foi obtida no Caso de Uso #1 (3,75%). No entanto, no caso do Bairro#19 a diferença foi de
uma probabilidade de -2,72% (absoluto). Em função dessa discrepância foi realizada uma terceira
comparação com o Bairro#09, que recebeu a probabilidade de 3,67%, ou seja -0,03% em relação
ao caso de uso anterior. O Bairro#19 foi o que mais recebeu diagnósticos de doenças contagiosas
durante a preparação da base. A possível explicação para tal discrepância, pode ser o fato de ter
ocorrido a geração de um novo modelo, com um novo processo de descarte de dados, em uma
base fictícia.
Para o Caso de Uso #3, o modelo apresentou uma performance classificada pela ferramen-
ta como pobre, desta vez com os indicadores Weighted True Positive, Weighted False Positive e
Weighted Precision iguais a 0,08584, 0,08800 e 0,02867, respectivamente. O modelo recebeu o
parâmetro I11 – Doença Cardíaca Hipertensiva no parâmetro ‘CIDCAT’, que indica a categoria
da doença, indicando as faixa etárias em que há maior probabilidade de ocorrências deste tipo de
48
doença, por ordem descendente de probabilidade. Em um cenário como o que foi apresentado na
Figura 9, os gestores públicos da saúde poderiam iniciar campanhas sobre ações de conscientiza-
ção que mitiguem as chances de ocorrência de doenças hipertensivas na população.
5. CONCLUSÃO
tecnologia para o suporte a decisão de gestores de saúde, que partem de análises tradicionais, ou
seja, que analisam o comportamento dos fatos passados, sem dispor de uma perspectiva futura.
Tendo em vista este problema, foi discutido neste trabalho como a computação cognitiva pode
disponibilizar aos gestores públicos informações probabilísticas obtidas a partir dos prontuários
dos pacientes, de forma a tornar possível conhecer as prováveis demandas e planejar suas respos-
tas antecipadamente, de forma a aprimorar os serviços de saúde e a qualidade de vida dos cida-
dãos.
Após a conclusão do levantamento bibliográfico, foi sugerida a arquitetura de uma base
de dados de prontuários eletrônicos centralizada que seria mantida e atualizada pelas unidades de
atendimento (básicas, secundárias e terciárias). Esse trabalho propõe a base de dados como uma
premissa fundamental para a realização destas análises. Desta forma, a identificação de probabi-
lidades de casos de saúde futuros ocorreria de forma ágil e integrada, além de ser essencial para o
atendimento continuado do paciente. Partindo desta premissa, foi realizada uma prova de concei-
to utilizando uma ferramenta cognitiva, com três casos de usos, que analisou os dados de diag-
nósticos e extraiu as probabilidades implícitas nesses dados.
Os resultados obtidos, mesmo diante das limitações dos dados existentes, mostraram que a
computação cognitiva possui um potencial de uso para o planejamento de ações relacionadas à
saúde pública, em especial por sua capacidade de analisar todos os dados de uma população e
gerar hipóteses probabilísticas relativas aos dados. Durante as simulações, foi possível identificar
os bairros com maior probabilidade de casos de doenças contagiosas, as faixas etárias com maior
exposição a doenças monitoradas e a combinação desses dois parâmetros. Essas informações
permitiriam um planejamento de ações mais eficiente, com maior intensidade, investimentos,
repasse de verbas, alocação de recursos, oferta de vacinas e medicamentos nos locais de maior
necessidade, bem com a realização de campanhas segmentadas para público adequado.
Esta pesquisa e seus resutados foram apresentados a uma especialista em saúde pública
com 27 anos de experiência na área, ex-funcionária do Ministério da Saúde, órgão onde trabalhou
por 19 anos e que atualmente trabalha no CONASS. O CONASS é um órgão representante dos
gestores públicos de saúde, com presença na Comissão Intergestores Tripartite, que atua na cria-
52
ção e implementação de políticas públicas e presta apoio técnico aos secretários estaduais em
atividades de capacitação e parcerias.
A especialista começou sua análise afirmando que a informação é essencial para a gestão.
A partir dessa afirmação, ela entende que o modelo proposto seria uma ferramenta útil para o
processo de tomada de decisões dos gestores públicos de saúde, uma vez que ao identificar a in-
cidência de doenças, permitiria a criação de planos com ações específicas para uma determinada
população. Além das ações em resposta aos eventos já ocorridos, a identificação da probabilidade
de ocorrência de novos casos por bairros, sexo ou faixa etária, permitiria atuar de forma preventi-
va através de campanhas educativas ou de vacinação para estes segmentos, por exemplo.
Uma característica importante, segundo a especialista, refere-se ao uso de dados popula-
cionais, ao invés de amostras, como ocorrem nos sistemas de business intelligence tradicionais.
Estes podem carregar tendências, baseadas nas crenças dos analistas de dados responsáveis pela
preparação das amostras.
Na opinião da especialista as informações obtidas durante a prova de conceito seriam re-
levantes para um processo decisório na área de saúde pública. Entende também que a premissa da
base de prontuários eletrônicos de pacientes centralizada é fundamental para o correto entendi-
mento da situação de saúde de uma determinada população. Finalmente, que confirma que mes-
mo com uma base de dados fictícia o uso da computação cognitiva tem um grande potencial na
área de gestão de saúde pública, corroborando, desta forma, com as conclusões obtidas nesta pes-
quisa.
A grande limitação deste trabalho foi a utilização de uma base de dados fictícia. Apesar
dos esforços de busca, a base obtida na internet mostrou-se genérica e pouco consistente, o que
dificultou a exploração dos resultados das simulações, apesar dos esforços dispendidos na reme-
diação dos problemas observados. Possivelmente, em uma base real, os casos de uso poderiam ter
melhor performance e permitiria avaliar correlações entre doenças, condições sanitárias, indica-
dores de educação e renda.
53
REFERÊNCIAS
ALBINO, V., BERARDI, U., & DANGELICO, R. M. (2015). Smart Cities: Definitions,
Dimensions, Performance, and Initiatives. Journal of Urban Technology, 22:1, pp. 3-21.
ALI, M., ARNOLD, F., MANSOURI, M., & FINGER, M. (03 de 2011). Cognitive cities and
intelligent urban governance. Network Industries Quartely.
ANTHOPOULOS, L., & FITSILIS, P. (2010). From Digital to Ubiquitous Cities: Defining a
Common Architecture for Urban Development. 2010 Sixth International Conference on
Intelligent Environments (pp. 301 - 306). IEEE Conference Publications.
ARROUB, A., ZAHI, B., SABIR, E., & SADIK, M. (2016). A Literature Review on Smart
Cities: Paradigms, Opportunities and Open Problems. Wireless Networks and Mobile
Communications (WINCOM), 2016 International Conference. Fez, Morocco: IEEE Cplore.
BAKICI, T., ALMIRALL, E., & WAREHAM, J. (Springer de 2012). A Smart City Initiative:
The Case of Barcelona. Journal of Knowledge 4(2), pp. 135-148.
BARRIONUEVO, J. M., BERRONE, P., & RICART, J. E. (2012). Smart Cities, Sustainable
Progress. IESE Insight, 14, pp. 50-57.
BHATY, R., & PRASAD, P. (2016). Open Domain Question Answering System using Cognitive
Computing. 6th International Conference of Cloud System and Bug Data Engineering
(Confluence) (pp. 34 - 39). Noida, India: IEEE.
55
BRASIL, C. F. (10 de Julho de 2012). Resolução no. 1638. Brasília, DF, Brasil.
BRASIL, P. d. (28 de Junho de 2011). Decreto No. 7.508. Brasília, DF, Brasil.
CASTELLS, M. (2011). he rise of the network society: The information age: Economy, society
and cultures vol 1. John Wiley & Sons.
CHARLES, D., GABRIEL, M., & SEARCY, T. (2015). Adoption of Eletronic Health Record
Systems among U.S. Non-Federal Acute Care Hospitals: 2008. Washington DC: The Office of
Natiotanal Coordinator for Health Information Technology.
CHEN, Y., ARGENTINIS, E., & WEBER, G. (2016). IBM Watson: How Cognitive Computing
Can Be Applied to Big Data Challenges in Life Sciences Research. Clinical Therapeutics,
Volume 38, number 4.
COE, A., PAQUET, G., & JEFFREY, R. (2001). E-governance and smart communities: a social
learning challenge. Social science computer review 19(1), pp. 80-93.
CUNHA, F. J., & Silva, H. P. (01 de 04 de 2006). O Prontuário Eletrônico como Unidade de
Transferência e Criação do Conhecimento em Saúde. Revista Eletrônica de Sistemas de
Informação.
DUTTON, W. H., KRAEMER, K. L., & BLUMIER, J. G. (1987). Wired Cities: Shaping the
future of communications. Indianapolis, IN: Macmillan Publishing Co.
EGER, J. M. (2009). Smart growth, smart cities, and the crisis at the pump a worldwide
phenomenon. The Journal of E-Government Policy and Regulation 32(1), pp. 47-53.
EMANI, C. K., CULLOT, N., & NICOLLE, C. (2015). Understandable Big Data - A Review.
Computer Science Review 17, pp. 70 - 81.
FACELI, K., LORENA, A. C., GAMA, J., & CARVALHO, A. C. (2015). Inteligência Artificial
- Uma Abordagem de Aprendizado de Máquina. Rio de Janeiro: LTC - Livros Técnicos e
Científicos Editora Ltda.
FISHER, P. (1996). Telehealth: its role in the longitudinal patient record and ontinuity of patient
care. IV Fórum Nacional de Ciência e Tecnologia em Saúde. Campos do Jordão - SP.
FLORIDA, R. (2002). The Rise of the Creative Class and How It's transforming Work, Leisure,
Community and Everyday Life. New York: Basic Books.
GANDOMI, A., & HAIDER, M. (2015). Beyond the Hype: Big data concepts, methods and
analytics. International Journal of Information Management (35), pp. 137 - 144.
GARCIA, J. O., & NERI, E. L. (2015). Cognitive Computing: A Brief Survey and Open
Research Challenges. 3rd International Conference on Applied Computing and Information
Technology/2nd International Conference on Computational Science and Intelligence (pp. 328-
333). IEEE.
GOLDSMITH, S., & CRAWFORD, S. (2014). The Responsive City. San Francisco, CA: Jossey-
Bass.
GRAY, D. E. (2012). Pesquisa no Mundo Real. Porto Alegre: Artmed Editora S.A.
HARALANOVA, M., & MENABDE, N. (2005). positive and negative public health effects of
urbanisation. European Journal of Public Health vol 15, pp. 552-553.
HARISSON, C., & DONNELLY, I. A. (2011). A theory of smart cities. Proceedings of the 55th
Annual Meeting of the ISSS-2011. Hull, UK.
HARISSON, C., ECKMAN, B., HAMILTON, R., HARTSWICK, P., KALAGGNARAM, J.,
PARASZCZAK, J., & Williams, P. (2010). Foundations for Smarter Cities. IBM Journal of
Research and Decelopment - Volume 54 Issue 4, pp. 195 - 199.
HARRISON , C., & Donnelly, I. A. (2011). A Theory of Smart Cities. 55th Annual Meeting of
the ISSS. Hull - UK.
HENDY, M. E., MINIAOUI, S., & FAKHRY, H. (2015). Towards Strategic Information &
Communication Technology (ICT) Framework for Smart City. Computer Science and
Engineering (APWC on CSE), 2015 2nd Asia-Pacific World Congress. Nadi, Fuji: IEEE Xplore.
HOUAISS, A., VILLAR, M. d., & FRANCO, F. M. (2004). Dicionário Houaiss da Língua
Portuguesa. Rio de Janeiro: Instituto Antônio Houaiss de Lexicografia.
HURWITZ, J., KAUFMAN, M., & BOWLES, A. (2015). Cognitive Computing and Big Data
Analytics. John Wiley & Sons.
IBGE. (04 de Fevereiro de 2010). Sinopse do Censo Demográfico de 2010. Fonte: IBGE:
http://www.censo2010.ibge.gov.br/sinopse/index.php?dados=8
IBGE. (2015). Pesquisa de Informações Básicas Municipais. Riode Janeiro - RJ: IBGE.
IQBAL, S., Altaf, W., Aslam, M., Mahmood, W., & Khan, M. U. (25 de 01 de 2016).
Application of intelligent agents in healt-care: review. Springer Business Media Dordrecht.
ISHIDA, T. (2002). Digital City of Kyoto. Communications of the ACM v45 n7, pp. 76-81.
ISO. (2005). Health informatics — Electronic health record — Definition, scope and context.
International Standard Organization.
KATAL, A., WAZID, M., & GOUDAR, R. H. (2013). Big data: Issues, challenges, tools and
Good practices. Sixth International Conference on Contemporary Computing (IC3) (pp. 404 -
409). Noida, India: IEEE.
58
KELLY, J. E., & HAMM, S. (2013). Smart Machines. New York: Columbia University Press.
LANDRY, C. (2012). The creative city: A toolkit for urban innovators. London, EN: Earthscan.
LIDDY, E. D. (2001). Natural Language Processing. Syracuse - USA: ACM Digital Library.
LOMBARDI, P., GIORDANO, S., FAROUH, H., & YOUSEF, W. (13 de October de 2010).
Modelling the smart city performance. Journal Innovation: The European Journal of Social
Science Research, pp. 137-149.
MATOS, R. (2012). Migração e Urbanização no Brasil. Revista Geografias v 8(1), pp. 7-23.
MAYER, V., & CUKIER, S. K. (2013). Big Data - Como Extrair Volume, Velocidade,
Veracidade e Valor da Avalanche de Informação Cotidiana. Rio de Janeiro: Editora Campus.
MENDES, E. V. (05 de 2010). As Redes de Atenção a Saúde. Ciência e Saúde, pp. 2297 - 2305.
Ministério da Saúde do Brasil. (30 de Dezembro de 2010). Portaria 4.279. Brasília, DF , Brasil.
MOLLURA, D. J., Carrino, J. A., Matuszak, D. L., Mnatsakanyan, Z. R., Eng, J., Cutchis, P., . . .
Lombardo, J. S. (2008). Bridging Radiology and Public Health: The Emerging Field of
Radiologic Public Health Informatics . Journal of the American College of Radiology Vol.5(3),
pp. 174 - 181.
NAM, T., & PARDO, T. A. (2011). Conceptualizing Smart City with Dimensions of
Technology, People, and Instituitions. The Proceedings of the 12th Annual International
Conference on Digital Government Research Conference (pp. 282 - 291). New York: ACM.
NISHIWAKI, K., KANAMORI, K., & OHWADA, H. (2017). Finding a disease-related gene
from microarray data using random forest. Cognitive Informatics & Cognitive Computing
(ICCI*CC), 2016 IEEE 15th International Conference on. Palo Alto - CA: IEEE.
NOOR, A. K. (May de 2015). Potential of Cognitive Computing and Cognitive Systems. Open
Engineering `, pp. 75-88.
PADULA, W., MELTZER, D. O., MAKIC, M. B., EPSTEIN, Z., GEMMELL, J., & MSHRA,
M. (2015). USING MACHING LEARNING TO POPULATE A MARKOV MODEL BY
MINING BIG DATA DIRECTLY FROM A HOSPITAL EHR. 37th Annual Meeting of the
Society for Medical Decision Making. St. Louis, MO: CAPES.
PAIM, J., TRAVASSOS, C., ALMEIDA, C., BAHIA, L., & MACINKO, J. (9 de Maio de 2011).
O sistema de saúde brasileiro: história, avanços e desafios. Fonte: The Lancet:
http://bvsms.saude.gov.br/bvs/artigos/artigo_saude_brasil_1.pdf
PARRA, D., & SANTOS, J. A. (2000). Metodologia Científica. São Paulo: Editora Futura.
PATRICIO, C. M., MAIA, M. M., MACHIAVELLI, J. L., & NOVAES, M. d. (08 de 2011). O
prontuário eletrônico do paciente no sistema de saúde brasileiro: Uma realidade para os médicos.
Scientia Médica, pp. 121-131.
PELLICER, S., SANTA, G., BLEDA, A. L., MAESTRE, R., JARA, A. J., & SKARMENTA, A.
G. (2013). A Global Perspective: A Survey. Seventh International Conference on Innovative
Mobile and Internet Services in Ubiquitous Computing. IEEE.
PORTMANN, E., & FINGER, M. (2016). Towards Cognitives Cities. Springer International
Publicshing.
PRAKASHAR, n., & Sarkar, A. (2015). Development of an intelligent system which assists in
decision making based upon previous decisions. Computing and Communication (IEMCON),
2015 International Conference and Workshop on. Vancouver - CA: IEEE.
PUPO, G. D., DIEHL, E. E., SOARES, L., FARIAS, M. R., & SANTOS, R. I. (2014). Rede de
Atenção à Saúde. Florianópolis, Santa Catarina, Brasil.
RAGHUPATHI, W., & RAGHUPATHI, V. (2014). Big data analytics in healthcare: promise and
potencial. Health Information Science and System.
RAYMOND, I. P., DERMIKAN , L. H., & AZAD, A. K. (30 de Nov de 2016). Smart health: Big
data enabled health paradigm within smart cities. Expert System and Application, pp. 370 - 383.
SAGIROGLU, S., & SINANC, D. (2013). Big data: A review. International Conference on
Collaboration Technologies and Systems (CTSP) (pp. 42-47). San Diego: IEEE.
SANTOS, S. R., FERREIRA, J. d., CRUZ, E. M., LEITE, E. M., & PESSOA, J. d. (Out-Dez de
2014). Sistema de Informações em Saúde: gestão e assistência no Sistema Único de Saúde.
Cogitare Enferm. , pp. 833-840.
SEPÚLVEDA, M. J. (Novembro de 2014). Public Health Informatics and the Public Health
Workforce in an Era of Change. American Journal of Preventive medicine, pp. 386-387.
SILVA, C. R., CARVALHO, B. G., JÚNIOR, L. C., & NUNES, E. d. (2017). Dificuldade de
acesso a serviços de média complexidade em municípios de pequeno porte:um estudo de caso.
Ciência e Saúde Coletiva, pp. 1109 - 1120.
SOMVANSHI, M., TAMBADE, S., CHAVAN, P., & SHINDE, S. V. (2016). A Review of
Machine Learning Techniques using Decision Tree and Support Vector Machine. 3rd
International Conference on Computing for Sustainable Global Development (INDIACom). New
Delhi, India: IEEE.
SOUZA, R. R. (2001). A regionalização no contexto atual das políticas de saúde. Ciência &
Saúde Coletiva, 451-455.
STUMPF, M. K., FISHER, P. D., FREITAS, H. M., & BECKER, J. L. (1997). Um Modelo de
Integração de informações para o Apoio à Decisão na Gestão da Assistência à Saúde. Série
Documentos para Estudos.
TOWNSEND, A. M. (2013). Smart Cities - Big data, civic hackers and the quest of a new utopia.
New York: W.W. Norton & Company.
UNFPA. (2007). State of world population - Unleashing the Potential of Urban Growth. New
York: United Nations Population Fund.
VASCONCELOS, L. C., FELIX, G. D., & FERREIRA, F. H. (2007). Aspectos gerais sobre
região e o processo de urbanização Brasileira. Espacio y Desarrollo.
WHO, W. O. (2004). Developing health management information systems - a practical guide for
developing countries. Regional Ofiice for the wetesrn pacific: WHO.
YANG , S., WEI, R., & GUO, J. (01 de Mar de 2017). Semantic Inference on Clinical
Documents: Combining Machine Learning Algorithms With an Inference Engine for Effective
Clinical Diagnosis and Treatment. IEEE Access Volume 5, pp. 3529 - 3546.
61
PASSO 12 – Criei um token, essencial para realizar o acesso ao conjunto de dados. Cliquei em
New Token.
77
Dicionário de dados
Nas Tabelas de 4 a 7 são descritos os dados que serão analisados nesta pesquisa.
package br.com.mestrado;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;
import java.text.DateFormat;
import java.text.SimpleDateFormat;
import java.util.Date;
} catch (ClassNotFoundException e) {
System.out.println("Exceção no módulo principal");
e.printStackTrace();
}
return conn;
}
} catch(SQLException e) {
System.out.println("Ocorreu um erro de conexão");
} catch (ClassNotFoundException e) {
System.out.println("Classe do driver jdbc não encontrada");
e.printStackTrace();
}
return null;
}
try {
PreparedStatement ps = conn.prepareStatement(sql);
ResultSet rs = ps.executeQuery();
if (rs == null) {
System.out.println("Conjunto nulo");
}
return rs;
} catch (Exception e) {
System.out.println("Falha na preparação da declaração");
}
return null;
}
String novoCid;
int qtdeLinhasOper = 0;
int qtdeLinhasTotal = 0;
try {
while (rs.next()) {
qtdeLinhasOper = 0;
novoCid="";
String cidInvalido = rs.getString("cid");
novoCid = trocaCid(cidInvalido);
84
// categoria
initialCat = cidInvalido.substring(0, 1);
numCat = cidInvalido.substring(1, 3);
try {
numCatN = Integer.parseInt(numCat);
} catch(Exception e) {
numCatN = 10;
}
// sub-categoria
try {
numSubCat = cidInvalido.substring(4);
numSubCatN = Integer.parseInt(numSubCat);
} catch(Exception e) {
numSubCatN = 10;
}
85
while (!valido) {
if (numSubCatN >= 0) {
numSubCatN--;
}
if (numSubCatN == -1) {
numCatN--;
if (numCatN == 0) {
char initial = initialCat.charAt(0);
initial--;
initialCat = String.valueOf(initial);
numCatN=99;
}
numSubCatN = 99;
}
if (existeCid(novoCid)) {
valido = true;
}
return novoCid;
}
String cat="";
String numCat="";
String numSubCat="";
cat = initialCat;
numCat = zerosAFrente(Integer.toString(numCatN),2);
numSubCat = Integer.toString(numSubCatN);
novoCid = cat + numCat + "." + numSubCat;
return novoCid;
}
try {
Connection conn2 = getConexao();
stmt = conn2.createStatement();
rs = stmt.executeQuery(sql);
rs.next();
quantidade = rs.getInt(1);
if (quantidade > 0) {
existe = true;
}
rs.close();
stmt.close();
conn2.close();
} catch (SQLException | ClassNotFoundException e) {
System.out.println("Falha ao Abrir conexão");
System.out.println(e.getCause());
}
return existe;
}
int qtdeLinhas = 0;
try {
Connection conn2 = getConexao();
stmt = conn2.createStatement();
stmt.executeUpdate(sql);
qtdeLinhas = stmt.getUpdateCount();
return qtdeLinhas;
package br.com.mestrado;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;
import java.text.DateFormat;
import java.text.SimpleDateFormat;
import java.util.Date;
} catch (ClassNotFoundException e) {
System.out.println("Exceção no módulo principal");
e.printStackTrace();
}
} catch(SQLException e) {
System.out.println("Ocorreu um erro de conexão");
} catch (ClassNotFoundException e) {
System.out.println("Classe do driver jdbc não encontrada");
e.printStackTrace();
}
return null;
}
try {
PreparedStatement ps = conn.prepareStatement(sql);
ResultSet rs = ps.executeQuery();
if (rs == null) {
System.out.println("Conjunto nulo");
}
return rs;
} catch (Exception e) {
System.out.println("Falha na preparação da declaração");
System.out.println(e.getMessage());
}
return null;
}
try {
PreparedStatement ps = conn.prepareStatement(sql);
ResultSet rs = ps.executeQuery();
if (rs == null) {
System.out.println("Conjunto nulo");
}
return rs;
} catch (Exception e) {
System.out.println("Falha na preparação da declaração");
}
return null;
}
ResultSet rsPatients;
// Variáveis de parametros
String p_genero = "";
int p_rangeId = 0;
int p_neighbor = 0;
int p_quant_esperada = 0;
//variáveis de pacientes
String pac_id="";
// variáveis auxiliares
int v_qtdeProcessada = 0;
try {
while (rsParametros.next()) {
p_genero = rsParametros.getString("PatientGender");
p_rangeId = rsParametros.getInt("ageRangeId");
p_neighbor = rsParametros.getInt("neighborhoodId");
p_quant_esperada = rsParametros.getInt("quantidade");
System.out.println("p_genero="+p_genero);
System.out.println("neighborhood="+p_neighbor);
System.out.println("p_rangeId="+p_rangeId);
System.out.println("quantidade esperada="+p_quant_esperada);
v_qtdeProcessada = 0;
while (v_qtdeProcessada < p_quant_esperada) {
rsPatients.next();
pac_id = rsPatients.getString("patientID");
setNeighborhood(pac_id, p_neighbor);
v_qtdeProcessada++;
conn2.close();
System.out.println("processados="+v_qtdeProcessada);
}
} catch (Exception e) {
System.out.println("Exception em executa Ajuste");
System.out.println(e.getMessage());
e.printStackTrace();
}
try {
Connection conn3 = getConexao();
stmt = conn3.createStatement();
stmt.executeUpdate(sql);
conn3.close();
} catch (SQLException | ClassNotFoundException e) {
System.out.println(sql);
e.printStackTrace();
}
}
92
2. Ao clicar em browse foi aberto uma tela para seleção dos arquivos:
94
4. Após a conclusão do processo, o arquivo de dados foi disponibilizado com Data asset
95
Caso de Uso #1