Sei sulla pagina 1di 97

Pró-Reitoria Acadêmica

Escola de Educação, Tecnologia e Comunicação


Programa de Pós-Graduação Stricto Sensu em Gestão do
Conhecimento e Tecnologia da Informação

Suporte a decisão em Serviços de Saúde de cidades


inteligentes baseado em Prontuários Eletrônicos dos
Pacientes

Autor: Roberto Carlos C. E Cavalcante


Orientador: Edilson Ferneda
Coorientador: Hércules Antonio do Prado

1. Brasília - DF
2018
1

ROBERTO CARLOS CAVALCANTI E CAVALCANTE

SUPORTE A DECISÃO EM SERVIÇOS DE SAÚDE DE CIDADES INTELIGENTES


BASEADO EM PRONTUÁRIOS ELETRÔNICOS DOS PACIENTES

Projeto de Dissertação apresentado ao Programa de Pós-


Graduação Stricto Sensu em Gestão do Conhecimento e da
Tecnologia da Informação da Universidade Católica de
Brasília, como requisito parcial para obtenção do grau de
Mestre em Gestão do Conhecimento e da Tecnologia da
Informação.

Orientador: Prof. Dr. Edilson Ferneda


Coorientador: Prof. Dr. Hércules Antônio do Prado

Brasília
2018
C376s Cavalcante, Roberto Carlos Cavalcanti e.
Suporte a decisão em Serviços de Saúde de cidades inteligentes baseado
em Prontuários Eletrônicos dos Pacientes / Roberto Carlos Cavalcanti e
Cavalcante – 2018.
101 f. : il. ; 30 cm

Dissertação (Mestrado) – Universidade Católica de Brasília, 2018.


Orientação: Prof. Dr. Edilson Ferneda
Coorientação: Prof. Dr. Hércules Antonio do Prado

1. Sistema de Informação em Saúde. 2. Prontuários Eletrônicos dos


Pacientes. 3. Computação Cognitiva. 4. Cidades Inteligentes. I. Ferneda,
Edilson, orient. II. Prado, Hércules Antonio do, coorient. III. Título.

CDU 004.8
RESUMO

O sistema de saúde pública do Brasil baseia-se em um modelo de atendimento descentralizado


sem a disponibilização de prontuários eletrônicos dos pacientes integrados a toda a Rede de
Atenção à Saúde (RAS). Essa conduta gera uma quantidade excessiva de informações sobre
os pacientes muitas vezes repetidas, complementares e esparsas entre as Unidades de Atendi-
mento à Saúde e não gera informações gerenciais tempestivas para a tomada de decisões efe-
tivamente úteis para o aprimoramento da saúde e do bem estar do cidadão brasileiro. Neste
trabalho, propõe-se um sistema cognitivo, apoiado em uma plataforma informacional integra-
da, orientado para a assistência médica continuada, visando apoiar a tomada de decisão dos
gestores públicos municipais.

Palavras chave: Sistema de Informação em Saúde. Prontuários Eletrônicos dos Pacientes.


Computação Cognitiva. Cidades Inteligentes.
ABSTRACT

The public health system in Brazil is based on a model of decentralized care without the elec-
tronic records of patients integrated into the entire Health Care Network (RAS). This conduct
generates a large volume of patient information repetition among Health Care Units and does
not generate timely management information for making decisions that are effectively useful
for enhancing the health and well-being of the Brazilian citizen. This paper proposes a cogni-
tive system, apoiado em uma plataforma informacional integrada focused on continuous med-
ical care aimed at supporting municipal public managers in the decision-making process.

Key Words: Health Information System, Electronic Patient Records, Cognitive Computing,
Smart City
LISTA DE FIGURAS

Figura 1: Comparação da evolução da população urbana e rural brasileira (1960-2010) ......... 18


Figura 2: Representação de uma Rede de Assistência à Saúde.................................................. 23
Figura 3: Evolução da implantação de prontuários eletrônicos nos Estados Unidos ................. 26
Figura 4: Integração dos prontuário eletrônicos entre as unidades de atendimento................... 35
Figura 5: Tela de parâmetros para previsão de valores do modelo ............................................ 47
Figura 6: Resultado da previsão para o Bairro#12 ..................................................................... 48
Figura 7: Resultado da previsão para o Bairro#19 ..................................................................... 48
Figura 8: Resultado da previsão para o Bairro#09 ..................................................................... 49
Figura 9: Resultado da previsão de doença hipertensiva por faixa etária .................................. 49
LISTA DE QUADROS

Quadro 1: Dimensões de cidades inteligentes ............................................................................. 20


Quadro 2: Definições de Computação Cognitiva ........................................................................ 28
Quadro 3: Etapas do percurso metodológico ............................................................................... 32
Quadro 4: Casos de uso considerados na pesquisa ...................................................................... 45
LISTA DE TABELAS

Tabela 1: Resultados da busca durante pesquisa bibliométrica .................................................. 13


Tabela 2: Distribuição da população brasileira entre as áreas urbanas e rurais 2010................. 17
Tabela 3: Distribuição de municípios por quantidade de habitantes .......................................... 22
Tabela 4: Distribuição por faixa etária original da base de dados .............................................. 37
Tabela 5: Distribuição por faixa etária da base de dados ajustada ............................................. 38
Tabela 6: Distribuição Populacional Entre os Bairros ................................................................ 39
Tabela 7: Distribuição Demográfica entre os bairros, por idade e gênero dos habitantes.......... 41
SUMÁRIO

1. INTRODUÇÃO ....................................................................................................................... 10
1.1 LEVANTAMENTO BIBLIOGRÁFICO .......................................................................... 12
1.2 FORMULAÇÃO DO PROBLEMA .................................................................................. 14
1.3 OBJETIVOS ...................................................................................................................... 15
1.3.1 Geral ........................................................................................................................ 15
1.3.2 Específicos ............................................................................................................... 15

2. REFERENCIAL TEÓRICO ................................................................................................. 17


2.1 CIDADES INTELIGENTES ............................................................................................. 17
2.2 O SUS E A REDE DE ATENÇÃO A SAÚDE ................................................................. 21
2.3 PRONTUÁRIOS MÉDICOS ............................................................................................ 24
2.4 SISTEMAS DE INFORMAÇÕES DE SAÚDE NO BRASIL ......................................... 26
2.5 COMPUTAÇÃO E SISTEMAS COGNITIVOS .............................................................. 27

3. METODOLOGIA ................................................................................................................... 31
3.1 CLASSIFICAÇÃO ............................................................................................................ 31
3.2 PLANEJAMENTO DA PESQUISA ................................................................................. 31

4. EXECUÇÃO DA PESQUISA ................................................................................................ 34


4.1 REDE INTEGRADA DE ATENÇÃO À SAUDE ............................................................ 34
4.2 FERRAMENTA DE SIMULAÇÃO ................................................................................. 35
4.3 BASE DE DADOS DE PRONTUÁRIOS ELETRÔNICOS ............................................ 36
4.3.1 Geração dos arquivos de dados ............................................................................. 42
4.3.2 Tratamento dos dados ............................................................................................ 42
4.3.3 Carga dos arquivos no Watson Studio ................................................................. 44
4.4 CASOS DE USO UTILIZADOS NA SIMULAÇÃO ....................................................... 44

5. CONCLUSÃO..................................................................................................................... 50
5.1 OPINIÃO DE ESPECIALISTA ........................................................................................ 51
5.2 LIMITAÇÕES DA PESQUISA ........................................................................................ 52
5.3 TRABALHOS FUTUROS ................................................................................................ 53

REFERÊNCIAS .......................................................................................................................... 54
APÊNDICE I: PROVISIONAMENTO DO AMBIENTE ................................................ 61

APÊNDICE II: CRIAÇÃO DO PROJETO ........................................................................ 69

APÊNDICE III: AMOSTRA DE DADOS ............................................................................ 78

APÊNDICE IV: AMOSTRA DE DADOS AJUSTADO ..................................................... 81

APÊNDICE V: AJUSTE DOS CIDs DA BASE DE DADOS ............................................ 82

APÊNDICE VI: AJUSTE DEMOGRÁFICO – DISTRIBUIÇÃO PARA BAIRROS ..... 88

APÊNDICE VII: PROCESSO DE CARGA DE ARQUIVO DE DADOS PARA O


PROJETO NO WATSON ......................................................................... 93

APÊNDICE VIII: CRIAÇÃO DE MODELOS COGNITIVOS ............................................ 95


10

1. INTRODUÇÃO

Em 2014, 54% da população mundial vivia nas cidades. Estimativas mostram que com
a continuidade dos processos de urbanização e do crescimento populacional, em 2050, 66%
das pessoas habitarão os centros urbanos (ONU, 2014). No Brasil, tal projeção foi atingida
antes de 1980. De acordo com o censo realizado em 2010, 84,36% da população brasileira
habita áreas urbanas (IBGE, 2010). A urbanização tem impacto direto, por exemplo, no meio
ambiente, nas habitações, na cultura, nas relações sociais e no acesso à saúde (HARALANO-
VA; MENABDE, 2005) (HARALANOVA & MENABDE, 2005), alvo dessa pesquisa. Na
busca por soluções para lidar com esse fenômeno, sugiram conceitos como os de cidades res-
ponsivas (GOLDSMITH & CRAWFORD, 2014), cidades inteligentes (Harrison & Donnelly,
2011) e cidades cognitivas (PORTMANN & FINGER, 2016).
Em particular, a preocupação relacionada ao controle da qualidade dos serviços de sa-
úde oferecidos à população nos grandes centros urbanos tem crescido nos últimos anos
(CAIAFFA, et al., 2008). No Brasil, um dos pilares do sistema de saúde é o subsistema públi-
co de saúde, que financia e presta serviços nas esferas federal, estadual e municipal através do
Sistema Único de Saúde (SUS). Os subsistemas privado e suplementar completam o sistema
(PAIM, et al., 2011). Nos anos 90, o SUS iniciou um processo de descentralização que trans-
feriu responsabilidades e recursos para estados e municípios, o que aprimorou suas capacida-
des na gestão da saúde e expandiu a rede de serviços de saúde dos municípios. Por outro lado,
evidenciou problemas referentes à gestão e à prestação daqueles serviços (SOUZA, 2001).
A regionalização, incluindo-se a municipalização, é apontada como a estratégia a ser
seguida na implantação do SUS, embora as peculiaridades e desigualdades dos municípios
brasileiros representem um grande desafio. A organização da Rede de Atenção à Saúde
(RAS), por suas características de regionalização e integração, pode reequilibrar a coerência
entre a situação da saúde e o sistema de atenção à saúde (PUPO, et al., 2014). Em 30 de De-
zembro de 2010, o Ministério da Saúde do Brasil publicou a Portaria 4.279, que define a RAS
como “arranjos organizativos de ações e serviços de saúde, de diferentes densidades tecnoló-
gicas, que integradas por meios de sistemas de apoio técnico, logístico e de gestão, buscam
garantir a integralidade do cuidado”. A mesma Portaria prevê que os sistemas logísticos, for-
temente ancorados nas tecnologias da informação, estão voltados para a promoção da integra-
ção dos pontos de atenção à saúde. Entre os principais sistemas de atenção à saúde estão: (i)
os sistemas de identificação e acompanhamento dos usuários, (ii) as centrais de regulação,
11

(iii) os sistemas de transportes sanitários e (iv) o registro eletrônico em saúde, também conhe-
cido como prontuário eletrônico do paciente (BRASIL, 2010).
O prontuário do paciente é um documento único, constituído de um conjunto de in-
formações, sinais e imagens registradas, geradas a partir de fatos, acontecimentos e situações
sobre a saúde do paciente e a assistência a ele prestada, de caráter legal, sigiloso e científico,
que possibilita a comunicação entre membros da equipe multiprofissional e a continuidade da
assistência prestada ao indivíduo (CFM, 2002). As informações consideradas fundamentais
para o atendimento ao paciente tornam-se dispensáveis após a alta, mas podem ser de grande
valor para a gestão pública, pesquisa e educação em saúde. O aumento da quantidade de in-
formações e os progressos da Tecnologia da Informação e Comunicações (TIC) têm motivado
o desenvolvimento dos prontuários eletrônicos (PATRICIO et al., 2011).
Um prontuário eletrônico é um repositório de informações sobre o estado de saúde de
um paciente, em formato computadorizado, transmitido de forma segura e acessível por usuá-
rios autorizados, baseado em um modelo de informações definido e que tem como objetivo
principal apoiar a prestação de cuidados de forma continuada, eficiente e integrada (ISO,
2005). A adoção desse instrumento na atenção à saúde proporciona maior qualidade ao aten-
dimento e à gestão pública, pois os gestores municipais poderiam reduzir a redundância de
procedimentos, aumentar a produtividade do serviço prestado e compartilhar informações
entre as unidades de atendimento (GONÇALVES, et al., 2013).
Em 2012 foram realizadas aproximadamente 537 milhões de consultas pelo SUS no
Brasil, o que representou 2,77 consultas por habitante (Brasil, 2012). Embora esta seja a últi-
ma informação oficial fornecida pelo Datasus, o site Gov-Br, informa que, em 2014, o SUS
realizou 1,4 bilhão de consultas (GOV BR, 2018). O prontuário eletrônico de cada paciente
inclui em sua estrutura: (i) a ficha clínica do paciente, (ii) os dados referentes aos exames clí-
nicos e complementares, incluindo imagens e seus respectivos resultados, (iii) diagnósticos,
(iv) tratamentos efetuados, (v) avaliações diárias, (vi) dados referentes à nutrição, (vii) prescri-
ção de medicações e (viii) relatos cirúrgicos (PINTO, 2006). O grande volume de dados gera-
dos nos atendimentos à saúde, em vários formatos e oriundos de diversas fontes de informa-
ção, bem como a velocidade em que esses dados são gerados tornam complexo o trabalho de
análise e gestão para métodos e softwares tradicionais (RAGHUPATHI & RAGHUPATHI,
2014). A computação cognitiva, que imita alguns aspectos de processos do pensamento hu-
mano, incluindo-se a capacidade de processar grandes quantidades de informação sem as ten-
dências, que são parte da natureza humana, surge como uma ferramenta capaz de vencer este
desafio (CHEN, et al., 2016). No contexto das organizações de cuidados com a saúde, a des-
12

coberta de padrões nos dados, permite a identificação e solução de questões complexas relaci-
onadas aos pacientes e à população em geral (HURWITZ, et al., 2015).
Neste trabalho propõe-se uma solução para a gestão do Prontuário Eletrônico do Paci-
ente no contexto de uma cidade inteligente como base para a proposição de um modelo cogni-
tivo que considere o PEP como fonte de informação. Este modelo prevê a produção de insu-
mos para o processo de gestão da saúde pública de modo a possibilitar ações preventivas de
forma tempestiva. Uma prova de conceito será desenvolvida para avaliação do modelo.

1.1 LEVANTAMENTO BIBLIOGRÁFICO

Uma pesquisa bibliométrica para o objeto desse estudo foi realizada sobre o tema em
análise, a saber, sistemas de suporte a decisão em serviços de saúde das cidades inteligentes
baseados em prontuários eletrônicos, com a adoção de recursos de computação cognitiva,
conforme mostrado na Tabela 1. Após o refinamento da busca, chegou-se a um total de 131
artigos. Foram descartados nove artigos repetidos, restando 122. Estes foram examinados e
categorizados segundo seu grau de adesão ao tema da pesquisa: 8 com forte adesão, 24 neu-
tros, 20 com fraca adesão e 70 sem conexão com a pesquisa. Foram considerados como esta-
do-da-arte os oito artigos com forte adesão ao tema da pesquisa.
Alemzadeh e Devarakonda (2017) apresentam um sistema de suporte à decisão cogni-
tivo, baseado em processamento de linguagem natural que identifica o estado de doenças a
partir dos registros médicos realizados nos prontuários eletrônicos dos pacientes. Os pesqui-
sadores utilizaram os modelos implementados no IBM Watson para identificar os casos em
que a doença dos pacientes hipertensos era classificada como “Desconhecida”, “Controlada”
ou “Descontrolada” e assim auxiliar os médicos na tomada de decisões sobre o tratamento
clínico, tratando-se assim de uma ferramenta de suporte ao diagnóstico e tratamento.
Os demais trabalhos, comentados a seguir, abordam questões relacionadas ao tema em
discussão a partir de perspectivas distintas, que podem ser classificadas como: aprendizado de
máquina, identificação de padrões, big data e suporte à decisão em saúde pública.
13

Tabela 1: Resultados da busca durante pesquisa bibliométrica

Expressão de busca (em Inglês) Capes Scholar IEEE


1: “decision support systems” 947.309 642.000 25.872
2: ("artificial intelligence" OR "cognitive computing" OR
709.668 17.600 132
“cognitive systems”)
3: ("electronic health records" OR EHR) 82.044 342.000 427
4: (“decision support systems”) AND ("artificial intelligence"
OR "cognitive computing" OR “cognitive systems”) AND 2.252 2.510 18
("electronic health records" OR EHR)
5: (“smart cities” OR “cognitive cities”) 96.281 16.900 104
6: (“decision support systems”) AND ("artificial intelligence"
OR "cognitive computing" OR “cognitive systems”) AND
91 23 16
("electronic health records" OR EHR) AND (“smart cities”
OR “cognitive cities”)
Expressão de busca (em Português) Capes Scholar IEEE
7: “sistemas de suporte a decisão” 592 2.290 4.160
8: ("inteligência artificial" OR "computação cognitiva" OR
5.687 16.400 25
“sistemas cognitivos”)
9: ("prontuário eletrônico do paciente" OR PEP) 171.966 283.000 1.400
10: (“sistemas de suporte a decisão”) AND ("inteligência
artificial" OR "computação cognitiva" OR “sistemas
2 11 0
cognitivos”) AND ("prontuário eletrônico do paciente" OR
PEP)
11: (“cidades inteligentes” OR “cidades cognitivas”) 436 1.920 3
12: (“sistemas de suporte a decisão”) AND ("inteligência
artificial" OR "computação cognitiva" OR “sistemas
1 0 0
cognitivos”) AND ("prontuário eletrônico do paciente" OR
PEP) AND (“cidades inteligentes” OR “cidades cognitivas”)

Fonte: o autor. Consulta realizada em 21/12/2017.

Prakashar & Sarkar (2015) afirmam que os sistemas baseados em computação cogniti-
va possuem, como função principal, o apoio ao processo de tomada de decisões de seus usuá-
rios. Em seu artigo descreveram um sistema inteligente baseado em um algoritmo de aprendi-
zado de máquina, que apresenta alternativas de decisões que um usuário pode tomar, a partir
de decisões tomadas anteriormente pelo próprio ou por outros usuários. O presente estudo
segue o mesmo princípio para o uso de sistemas cognitivos, ou seja, uma ferramenta de supor-
te ao processo de decisões de gestores públicos de saúde.
A eficiência dos métodos preditivos foi estudada por Padula et al. (2015), que compa-
raram a eficiência desses métodos entre a abordagem de Markov e a inferência Bayesiana.
Através de uma abordagem supervisionada de aprendizado de máquina, analisaram prontuá-
rios eletrônicos. O resultado do estudo mostrou ser viável utilizar o aprendizado de máquina
para avaliar dados reais de prontuários para análise de custos e suporte ao processo de tomada
de decisões. Nishiwake, Kanamori & Ohwada (2017) utilizaram o aprendizado de máquina,
14

através da abordagem de Random Forest, para identificar genes relacionados ao Alzheimer,


em função do grande volume de dados a ser analisado. A tarefa de analisar a situação da saú-
de de uma população também enfrenta o desafio relacionado ao volume de dados.
Raymond, Dermikan & Azad (2016) também pesquisaram sobre big data e apresenta-
ram uma proposta sobre a implementação de sistemas inteligentes e big data no contexto da
saúde. Markus (2017) também destacou a complexidade de determinar diagnósticos, face ao
grande volume de dados atuais e reforçou a importância da identificação de padrões, a partir
de informações contidas em grandes bases de dados, a fim de se buscar o tratamento mais
adequado para as pacientes com câncer de mama, alvo de seu estudo. Segundo ele, os algo-
ritmos de aprendizado de máquina podem aprimorar o desempenho dos médicos em diversas
atividades e possibilitar a maior processa da medicina baseada no conhecimento, a medicina
de precisão.
Os sistemas de suporte às decisões clínicas foram defendidos por Yan et al. (2017),
que abordaram a necessidade de tais sistemas como resposta aos erros médicos, causados
muitas vezes pela incapacidade de análise do grande volume de informações geradas para
cada paciente, bem como pela incompatibilidade entre as informações dos diversos sistemas
de informações hospitalares. A integração com os sistemas de prontuários eletrônicos foi cri-
ticada pelos autores, que propuseram uma terminologia unificada nos sistemas de forma a
facilitar a troca de informações, que viabilizasse um sistema de suporte ao diagnóstico efici-
ente. Mollura et al. (2008) abordaram a oportunidade de integrar imagens radiológicas aos
prontuários eletrônicos da rede pública para a avaliação de epidemias, com o objetivo de iden-
tificar padrões em uma determinada área geográfica, a fim de possibilitar melhor suporte às
decisões dos agentes públicos. No entanto, não abordaram como se daria a análise destas in-
formações após sua integração com os prontuários.
Diante da análise dos estudos mencionados, é possível supor que ainda há uma lacuna
no uso das técnicas relacionadas à computação cognitiva no sentido de fornecer insights para
os gestores da saúde pública. O uso destes recursos, ainda que relevantes, concentram-se no
suporte ao diagnóstico de pacientes de forma individual. No entanto, ainda não se aplicam à
extensão do benefício para a população.

1.2 FORMULAÇÃO DO PROBLEMA

O Conselho Federal de Medicina brasileiro define o prontuário dos pacientes como um


documento único, confidencial e que, entre outras características, deve permitir a atenção à
15

saúde do paciente de forma contínua. A maioria das instituições de prestação de serviços de


saúde na rede pública ainda utiliza os prontuários em papel, que está sujeito a extravio, quebra
de sigilo, dificuldade na busca por informações históricas e ineficiência no suporte ao ensino,
à pesquisa e à gestão. O governo brasileiro, através do Ministério da Saúde, distribui gratui-
tamente um programa computacional para a implantação de prontuários eletrônicos nas pre-
feituras dos municípios brasileiros, mas que, a princípio, não prevê a integração entre as uni-
dades de saúde. Isto impede o atendimento ao requisito de atenção continuada à saúde, pois
leva o paciente a ter um prontuário diferente em cada unidade de saúde. A implantação de
prontuários eletrônicos dos pacientes, em uma rede de atendimento integrada, possui diversos
benefícios como padronização, clareza, agilidade e geração de estatísticas.
Nesse contexto, este trabalho foi desenvolvido com foco no seguinte problema de pes-
quisa: Como subsidiar a tomada de decisão na gestão da saúde pública por meio de um
sistema cognitivo utilizando prontuários dos pacientes?

1.3 OBJETIVOS

1.3.1 Geral

O objetivo geral desse trabalho é propor um modelo de suporte à decisão em gestão da


saúde pública, que utilize ferramentas de computação cognitiva como solução central para a
extração de conhecimento e identificação de probabilidades de ocorrências futuras, a partir
dos dados dos prontuários eletrônicos dos pacientes.

1.3.2 Específicos

Os seguintes objetivos específicos foram definidos para o desenvolvimento desse ob-


jetivo geral:

Propor um modelo conceitual de uma base de dados centralizada de prontuários eletrô-


nicos para a saúde pública, que poderia ser acessada por uma aplicação cognitiva para
fornecimento de insights para os gestores públicos;
Desenvolver uma prova de conceito utilizando os recursos e técnicas de computação
cognitiva para extrair informações contidas em uma base de prontuários de pacientes
fictícia;
16

Avaliar o potencial de uma solução construída a partir de ferramentas de computação


cognitiva para o processo de decisão da gestão da saúde pública.
17

2. REFERENCIAL TEÓRICO

2.1 CIDADES INTELIGENTES

Em 2008, a quantidade de habitantes das cidades atingiria pela primeira vez na história
mais de 50% da população mundial, quando cerca de 3.3 bilhões de pessoas estariam vivendo
nos centros urbanos. Prevê-se que, em 2030, esse número chegará próximo a cinco bilhões de
indivíduos (UNFPA, 2007). Em 2014, 54% da população mundial residia em áreas urbanas e
novas projeções apontam que por volta em 2050, esse percentual chegará a 66%. Cem anos
antes, apenas 30% da população era urbana (ONU, 2014).
O processo de urbanização no Brasil não é causado apenas pela migração da zona ru-
ral para as cidades, mas também pelo processo de migração, que atraiu pessoas de diversas
partes do mundo, que buscavam trabalhar na exploração de metais preciosos, como ocorreu
nos séculos XVIII e XIX (MATOS, 2012). No entanto, foi a partir da década de 1950 que
esse processo foi intensificado, por atrair a população para regiões com expansão industrial,
em busca de melhores oportunidades de emprego e qualidade de vida (VASCONCELO, et al.,
2007). A estimativa da ONU, que previa que mais da metade da população mundial habitaria
as cidades a partir de 2008, foi alcançada pelo Brasil entre as décadas de 1960 e 1970, en-
quanto as previsões para 2050 foram atingidas na década de 1980. O último censo brasileiro
realizado em 2010 apurou que 84% da população brasileira já habitava as áreas urbanas
(IBGE, 2010). Na Tabela 2 e na Figura 1 é apresentada a evolução histórica das populações
urbana e rural no Brasil.

Tabela 2: Distribuição da população brasileira entre as áreas urbanas e rurais 2010

Censo População urbana População rural População total


1960 32.004.817 45% 38.987.526 55% 70.992.343
1970 52.904.744 56% 41.603.839 44% 94.508.583
1980 82.013.375 68% 39.137.198 32% 121.150.573
1991 110.875.826 75% 36.041.633 25% 146.917.459
2000 137.755.550 81% 31.835.143 19% 169.590.693
2010 160.925.792 84% 29.830.007 16% 190.755.799

Fonte: IBGE (2010)


18

Figura 1: Comparação da evolução da população urbana e rural brasileira (1960-2010)

90%
84%
80% 81%
75%
70%
68%
60%
55% 56%
50%
45% 44%
40%

32%
30%
25%
20% 19%
16%
10%

0%
1960 1970 1980 1991 2000 2010

Urbana Rural

Fonte: IBGE (2010)

Os indicadores de crescimento das cidades percebidos no Brasil e no mundo, mostram


que as cidades estão expostas a riscos e problemas que demandam por novas abordagens, a
fim de superar os desafios criados pelo processo de urbanização. Diante de tal cenário, torna-
se essencial a adoção de uma abordagem baseada em cidades inteligentes (NAM & PARDO,
2011). Existem diversas definições para cidades inteligentes ou smart cities, embora nenhuma
seja aceita de forma genérica por pesquisadores ou instituições (ALBINO, et al., 2015). O
termo começou a ser adotado em 2005 por grandes empresas de tecnologia da informação
para o processo de adoção de sistemas de informações, que integravam os serviços e a infraes-
trutura urbana e que inovavam nas ações da gestão das cidades (HARISSON & DONNELLY,
2011).
A IBM afirma que uma cidade inteligente pode ser definida como uma cidade, instru-
mentada, interconectada e que aprende a partir de seus dados. Estas cidades, possuem a capa-
cidade de coletar dados instantaneamente através de diversos tipos de sensores, integrá-los
com o suporte computacional adequado e gerar informações analíticas para as diversas áreas
de gestão do município, com vistas a um melhor processo de tomada de decisões
(HARISSON, et al., 2010). Para Bakici et al. (2012) uma cidade inteligente dispõe de alta
tecnologia que conecta pessoas, informações e elementos da cidade através de novas tecnolo-
gias, a fim de criar uma cidade sustentável, mais verde, com comércio competitivo e inovador
19

e maior qualidade de vida para seus cidadãos (BAKIC, et al., 2012). Há ainda a definição de
que cidades inteligentes utilizam toda tecnologia e recursos disponíveis de forma coordenada
e inteligente para desenvolver centros urbanos que são integrados, habitáveis e sustentáveis
(BARRIONUEVO, et al., 2012). Existem outras diversas declarações na linha de tecnologia e
fora dela.
As grandes corporações de tecnologia da informação como IBM, SIEMENS e CISCO
entendem que a tecnologia é a base para suas definições de cidades inteligentes(ALBINO, et
al., 2015). Outros autores discordam dessa afirmação, para eles a criatividade é o elemento
viabilizador de uma cidade inteligente e assim, pessoas, educação, aprendizado e conhecimen-
to tem uma importância central para essas cidades (BOULTON, et al., 2011). A cidade criati-
va é portanto uma visão de cidade inteligente (FLORIDA, 2002).
É possível perceber a existência de um conjunto de termos que se assemelham ao ter-
mo cidade inteligente. Considerando a dimensão da tecnologia, Cidade Digital
(ANTHOPOULOS & TSOUKALAS, 2008) (ISHIDA, 2002), Ubiquitous City
(ANTHOPOULOS & FITSILIS, 2010), Cidade Cabeada (wired city) (DUTTON, et al.,
1987), Cidade da Informação (CASTELLS, 2011) e Cidades Cognitivas (PORTMANN &
FINGER, 2016). Alguns autores focam nas pessoas e apresentam termos como: Cidade Cria-
tiva (LANDRY, 2012) (FLORIDA, 2002) e outros focam na comunidade adotando o termo
Comunidade Inteligente (COE, et al., 2001).
A falta de uma definição única que ocorre para o termo cidades inteligentes, ocorre
também quando se busca identificar quais são as dimensões essenciais que as caracterizam.
Em uma dessas abordagens, tecnologia, pessoas e comunidade formam tais dimensões (NAM
& PARDO, 2011). Para Albino et al. (2015), a necessidade da integração dos diversos siste-
mas de uma cidade, como transporte, energia, educação, infraestrutura, saúde e segurança
pública, entre outros, sustentando que o ambiente das cidades não opera de forma isolada.
ARROUB et al. (2016) afirmam que uma cidade se torna realmente inteligente, quando além
da dimensão da tecnologia, as pessoas e a comunidade são destacadas igualmente. No Quadro
1 são apresentadas outras visões dessas dimensões (ALBINO, et al., 2015).
20

Quadro 1: Dimensões de cidades inteligentes

Dimensões Essenciais Fonte


Educação em TI (IT Education)
Infraestrutura de TI (IT Infrastructure)
(MAHIZHNAN, 1999)
Economia de TI (IT Economy)
Qualidade de vida (Quality of Life)
Economia Inteligente (Smart Economy)
Pessoas Inteligentes (Smart People)
Governança Inteligente (Smart Governance) (LOMBARDI, GIORDANO,
Mobilidade Inteligente (Smart Mobility) FAROUH, & YOUSEF, 2010)
Ambiente Inteligente (Smart Environment)
Moradia Inteligente (Smart Living)
Tecnologia (Technology)
Desenvolvimento Econômico (Economical Development)
Crescimento do Emprego (Empployment Growth) (EGER, 2009)
Melhoria da Qualidade de Vida (Quality of Life Improve-
ment)

O propósito de uma cidade inteligente é atender às necessidades de seus cidadãos, por


meio do aprimoramento da capacidade de gestão das áreas da cidade como, por exemplo: in-
fraestrutura, transportes, energia, água, saneamento, educação, saúde e segurança pública,
entre outros (PELLICER, et al., 2013). O amparo tecnológico fornecido pelas tecnologias da
informação e das comunicações (TIC) é visto como um habilitador para que os gestores pú-
blicos tenham uma visão objetiva sobre o funcionamento desses subsistemas, a fim de capaci-
tá-los a tomar decisões, que aprimoram o funcionamento da cidade (HENDY, et al., 2015).
No entanto, essa abordagem mostra-se insuficiente, uma vez que os problemas da cidade não
se limitam à falta de eficiência ou de infraestrutura. Os sistemas urbanos não são apenas téc-
nicos, mas também sociais. Os ganhos de eficiência são aferidos a partir de uma abordagem
técnica e social, experimentados entre as pessoas, organizações e sistemas tecnológicos. É um
erro, portanto, limitar os recursos de TIC à otimização, quando está provada a sua utilidade
para fins cognitivos, o que traz um novo conceito para os grandes centros urbanos, a cidade
cognitiva (PORTMANN & FINGER, 2016).
As cidades cognitivas (cognitive cities) se diferenciam das cidades inteligentes (smart
cities) no que tange à capacidade de aprender, criar memória e recuperar experiências anterio-
res. Trata-se de um paradigma baseado no conjunto formado pela tecnologia da informação,
pela inteligência artificial e pela cognição humana com o objetivo de aprimorar o processo de
tomada de decisões (ALI, et al., 2011). Através da computação cognitiva, essas cidades pode-
rão evoluir e reagir de forma tempestiva e precisa à ocorrência de eventos previstos ou inespe-
rados. A partir de fatos e padrões encontrados nos dados, as cidades aprenderão e funcionarão
21

de forma mais inteligente ao longo do tempo (HURWITZ, et al., 2015). Os líderes e morado-
res destas cidades entenderão suas dinâmicas e a partir de insights fornecidos pelos sistemas
cognitivos, serão capazes de gerar novos benefícios para os seus cidadãos (KELLY &
HAMM, 2013).

2.2 O SUS E A REDE DE ATENÇÃO A SAÚDE

O Sistema Único de Saúde (SUS) foi criado pela Constituição de 1988 e regulamenta-
do pela Lei Orgânica da Saúde (8.080/90), com o objetivo de prestar serviços de saúde para a
população brasileira. Os serviços são prestados pelos estados e municípios, enquanto o Go-
verno Federal realiza ações de planejamento, fiscalização e controle (BARBOSA, 2013). O
SUS possui três pilares fundamentais: (i) a universalidade do atendimento à saúde; (ii) a inte-
gralidade desta assistência e (iii) o controle social do processo através da descentralização
(STUMPF, et al., 1997). Esse processo, que foi regulamentado pelas Normas Operacionais
(NOB 01/91, NOB 01/92, NOB 01/93 e NOB 01/96), permitiu a obtenção de benefícios im-
portantes como o aumento da liberação de recursos da União, o fortalecimento das institui-
ções gestoras de saúde dos municípios e a expansão da rede de serviços municipais de saúde.
Em contrapartida, trouxe a luz problemas de gestão e da própria prestação de atendimentos
médicos (SOUZA, 2001).
A descentralização surgiu como a estratégia a ser seguida no processo de construção
do SUS. No entanto, as caraterísticas de cada município tornam-se um problema para os ges-
tores de saúde pública do País, pois existem grandes discrepâncias de infraestrutura, financi-
amento e capacidade técnica na maioria das cidades, em especial as de menor porte. Essa situ-
ação penaliza os municípios mais estruturados, que tem que atender à demanda de pacientes
vindos de outros locais, em busca de melhores condições de atendimento (PUPO, et al.,
2014). Um estudo realizado na 18ª Região de Saúde do Paraná, que possui uma população de
230.949 habitantes e conta com 21 (vinte e um) municípios, sendo 18 (dezoito) deles com
menos de 20.000 (vinte mil) habitantes, descobriu que a oferta de consultas é insuficiente para
9 das 14 especialidades médicas disponíveis (SILVA, et al., 2017).
Segundo o IBGE - Instituto Brasileiro de Geografia e Estatística 68,7% dos municí-
pios brasileiros possuem até 20.000 (vinte mil) habitantes. Ao se considerar municípios de até
cinquenta mil habitantes, esse percentual sobre para 88,2% (ver Tabela 3). Construir um sis-
tema integrado, que atenda à questão da autonomia de gestão municipal e às práticas regio-
nais, que permitam um atendimento de qualidade aos cidadãos torna-se um desafio. As redes
22

de atenção à saúde visam a consolidação de sistemas de saúde, de forma a atender aos 3 (três)
pilares fundamentais do SUS (LAVRAS, 2011).

Tabela 3: Distribuição de municípios por quantidade de habitantes

Quantidade Percentual
Quantidade de habitantes
de municípios por faixa
Até 5.000 1.237 22,2%
De 5.001 a 10.000 1.214 21,8%
De 10.001 a 20.000 1.377 24,7%
De 20.001 a 50.000 1.087 19,5%
De 50.001 a 100.000 353 6,3%
De 100.001 a 500.000 261 4,7%
Mais de 500.000 41 0,7%
Total de municípios brasilei-
5.570 100%
ros
Fonte: IBGE (2015)

A Portaria 4.279, de 30 de dezembro de 2010, do Ministério da Saúde, define as redes


de atenção à saúde como “arranjos organizativos de ações e serviços de saúde, de diferentes
densidades tecnológicas, que, integradas por meio de sistemas de apoio técnico, logístico e de
gestão, buscam garantir a integralidade do cuidado” (BRASIL, 2010). As redes são constituí-
das por três elementos: (i) a população e região de saúde; (ii) a estrutura operacional e (iii) o
modelo de atenção à saúde, que organiza o funcionamento da rede. Entende-se por região de
Saúde, o espaço geográfico contínuo, constituído por municípios limítrofes e suas populações,
que possuam as características culturais, econômicas e sociais assemelhadas, bem como redes
de comunicação e infraestrutura de transportes compartilhados, a fim de promover a integra-
ção dos assuntos e ações relacionados à saúde (BRASIL P. d., 2011). A estrutura operacional
é constituída pelos locais onde os serviços de saúde são oferecidos e pelos sistemas de apoio,
logísticos e de governança. Estes sistemas, conforme apresentado na Figura 2, devem promo-
ver a integração entre os pontos de atenção à saúde, estando entre eles, o prontuário clínico
dos pacientes (PUPO, et al., 2014), que é alvo de interesse deste estudo.
23

Figura 2: Representação de uma Rede de Assistência à Saúde

População
Modelo Sistema
de Logístico
Saúde

Unidade
Govern-
ança RAS Básica de
Saúde

Ponto de Sistema
Atenção de Apoio
Terciário Ponto de
Atenção
Secundário

Fonte: PUPO et al. (2014)

Na Figura 2, População compreende os habitantes de uma determinada área geográfi-


ca sob responsabilidade de uma RAS. Para atender a esta população, existe uma estrutura ope-
racional formada pelos pontos de atenção à saúde e pelas integrações de seus serviços. Exis-
tem sete componentes que fazem parte dessa estrutura:
A Unidade Básica de Saúde atua como ordenadora e coordenadora dos fluxo e contra-
fluxos do cuidado. É fundamental na constituição do sistema de saúde por ser o primei-
ro ponto de contato com os pacientes. Cabe a este componente desempenhar as ações de
saúde e realizar a ligação com os demais pontos de atenção, de forma a assegurar a
atenção contínua e integral à saúde dos usuários.
Pontos de atenção à Saúde Secundários e Terciários representam o apoio das RAS,
com ações especializadas em nível ambulatorial, hospitalar, apoio diagnóstico e terapêu-
tico;
24

Os Sistemas de Apoio agregam os serviços de saúde comuns a todos os pontos de aten-


ção. Compõem os sistemas de apoio: (i) sistemas de apoio diagnóstico e terapêutico; (ii)
sistema de assistência farmacêutica e (iii) sistemas de informações em saúde.
Sistemas Logísticos são soluções baseadas em Tecnologia da Informação, voltadas para
promover a comunicação entre os pontos de atenção à saúde e sistemas de apoio. Entre
os sistemas logísticos destacam-se: Cartão de Identificação e Usuários; prontuário clíni-
co; sistemas de acesso regulado à atenção à saúde e sistemas
Sistemas de Governança envolvem diferentes atores, estratégias e procedimentos para
gerir, de forma compartilhada entre os componentes citados acima.
O Modelo de Atenção à Saúde combina tecnologias utilizadas nas intervenções sobre
problemas e necessidades sociais, individuais e coletivas. É uma forma de organizar o
trabalho da rede. Considera questões como a garantia do acesso integral à saúde, ações
preventivas, curativas e reabilitadoras para a população.

2.3 PRONTUÁRIOS MÉDICOS

Os primeiros registros médicos conhecidos, foram criados durante a Idade Antiga,


tendo sido encontrados tais relatos em murais e em papiro. No século V a.C. Hipócrates de
Cós definiu a medicina científica e apresentou a necessidade de se documentar as informações
sobre os pacientes, com o objetivo de acompanhar a evolução das doenças e identificar possí-
veis causas. Já no século XVIII, a enfermeira Florence Nightingale, durante a guerra da Cri-
méia (1853-1856), defendia a importância dos registros, a fim de dar melhor andamento ao
tratamento dos pacientes e entender como o orçamento para o atendimento médico estava
sendo utilizado. Na Europa neste mesmo século, percebeu-se maior rigor nos registros médi-
cos, quando os hospitais deixaram de pertencer a Igreja e foram transferidos para os médicos
(PINTO, 2006).
O CFM define Prontuário do Paciente, através de sua resolução No. 1.638/2002, publi-
cada no Diário Oficial da União em 10 de agosto de 2002, como um documento único consti-
tuído por um conjunto de informações, sinais e imagens retiradas ou geradas a partir de fatos,
acontecimentos e situações sobre a saúde do paciente e a assistência a ele prestada, de caráter
legal, sigiloso e científico, utilizado para possibilitar a comunicação entre membros da equipe
multiprofissional e a continuidade da assistência prestada ao indivíduo. A mesma resolução
determina os seguintes itens como componentes obrigatórios do Prontuário Eletrônico, inde-
pendentemente de ser mantido em papel ou de ser eletrônico: (i) identificação do paciente; (ii)
25

anamnese, exame físico, exames complementares, resultados respectivos, hipóteses diagnósti-


cas, diagnóstico definitivo e tratamento efetuado; (iii) evolução diária do paciente com data e
hora, procedimentos e profissionais envolvidos (BRASIL C. F., 2012):
Os prontuários em papel ainda são os mais encontrados e diante das tecnologias atuais
não se mostram eficientes, pois estão sujeitos a questões como quebra de privacidade e extra-
vio. A dificuldade na recuperação de informações históricas não ajuda em novas condutas,
bem como atrapalha o compartilhamento de tais informações com outros envolvidos no aten-
dimento ao paciente. A estrutura do prontuário é extensa, mas o armazenamento de todos os
dados não é costumeiro. Existem informações que se tornam desnecessárias após a alta do
paciente, mas que podem ser de grande valia para a gestão, o ensino e a pesquisa. A informá-
tica para a saúde tem possibilitado uma crescente geração de informações sobre pacientes, que
associada ao acesso mais ágil e simples a estas tem despertado o interesse pela implantação do
Prontuário Eletrônico do Paciente – PEP (PATRICIO, et al., 2011).
Em 1997 o Institute of Medicine dos Estados Unidos definiu prontuário eletrônico do
paciente como “um registro eletrônico do paciente, que reside em um sistema especificamente
projeto para dar apoio aos usuários por meio da disponibilidade de dados completos e corre-
tos, lembretes, alertas aos médicos, sistemas de apoio à decisão, links para bases de conheci-
mento e outras fontes de referência” (INSTITUTE OF MEDICINE, 1997). Existem diversos
motivadores para a implantação de prontuários eletrônicos, como por exemplo: (i) aprimora-
mento da clareza das informações que se tornam mais legíveis, completas e padronizadas; (ii)
melhoria na troca de informações entre os profissionais das equipes de saúde; (iii) acesso ágil
às informações; (iv) aumento da eficiência das auditorias médicas; (v) geração de estatísticas
aos níveis local, regional e nacional de forma rápida e precisa. A disponibilização de uma
base de dados, que permita o registro de cada atendimento e condutas médicas prestadas a
cada paciente em todas as suas dimensões, de forma integrada representa uma importante fon-
te de informações para busca do conhecimento sobre os fatos relativos à saúde, bem como
uma oportunidade para as ações de monitoração e alertas proativas sobre o risco de situações
endêmicas para a população (STUMPF, et al., 1997).
No Brasil, as primeiras pesquisas sobre os prontuários eletrônicos dos pacientes surgi-
ram nos anos 90, no meio acadêmico. Após diversas propostas isoladas, o Ministério da Saúde
definiu em 2002, um conjunto mínimo de informações relacionadas aos pacientes e aos aten-
dimentos prestados aos mesmos. Posteriormente, o Conselho Federal de Medicina (CFM)
definiu as normas técnicas para o uso de aplicações informatizadas para registro e atualização
dos prontuários dos pacientes através da resolução Número 1821, publicada no Diário Oficial
26

da União em 11 de julho de 2007 (PATRICIO, et al., 2011). Em 2016, o Ministério da Saúde,


definiu o prontuário eletrônico como modelo de informação para o registro das ações de saúde
na atenção básica através da Resolução No. 7, de 24 de Novembro de 2016 (COMISSÃO DE
INTERGESTORES TRIPARTITE, 2016). Seguindo a resolução, o Ministério da Saúde anun-
ciou a disponibilização de um software gratuito denominado Prontuário Eletrônico do Cida-
dão (PEC) para informação de informações clínicas e administrativas no contexto da unidade
básica de saúde (BRASIL, 2017).
O processo de adoção de sistemas de prontuários eletrônicos básicos nos EUA inicia-
do a por volta de 2008. Naquele ano, a adoção era acima de 20% apenas em dois estados
(Connecticut e New Mexico). Três anos mais tarde, tal adoção era superior a 20% em trinta e
dois estados e acima de 40% em sete estados. Em 2014, a adoção hospitalar era superior a
60% em todos os estados, exceto Hawaii e West Virginia, e acima de 80% em dezessete esta-
dos. A Figura 3 ilustra a evolução do processo de adoção dos prontuários eletrônicos do paci-
ente nos EUA(CHARLES, et al., 2015).

Figura 3: Evolução da implantação de prontuários eletrônicos nos Estados Unidos

Fonte: (CHARLES, GABRIEL, & SEARCY, 2015)

2.4 SISTEMAS DE INFORMAÇÕES DE SAÚDE NO BRASIL

Em 1991, o Decreto 100 de 16/04/1991, criou o Departamento de Informática do Sis-


tema Único de Saúde – DATASUS, com a função de controlar e processar as contas do setor
de saúde. Essa atividade anteriormente era de competência de uma das diretorias da DATA-
PREV, até que em 1998 o órgão foi vinculado ao Ministério da Saúde (DATASUS, 2017). O
DATASUS disponibiliza diversos sistemas para a gestão da saúde no Brasil, distribuídos em
categorias como: ambulatoriais, epidemiológicos, financeiros, hospitalares, estruturantes,
27

eventos vitais, tabulação, sociais e regulação. As informações processadas nestes sistemas


fornecem os subsídios para o planejamento dos serviços de saúde no país (DANIEL, et al.,
2014). No entanto, alguns dos sistemas existentes não retratam a realidade do setor de saúde.
Falhas na entrada dos dados e falhas na própria codificação dos sistemas geram informações
imprecisas e, por consequência, comprometem a efetividade das ações necessárias para a me-
lhoria da prestação de serviços aos cidadãos. Outro fato relevante é que os sistemas utilizados
priorizam o tratamento de dados administrativos, com foco na gestão sem perceber os usuá-
rios dos serviços, o que poderia ocorrer com a adoção de formulários eletrônicos (SANTOS,
et al., 2014).
A área de saúde é uma grande criadora de dados relacionados à prestação dos serviços
médicos, bem como ao trabalho de gestão destes serviços. A gerência desta área precisa ser
guiada por decisões de cunho estratégico, que tem como ponto central o cuidado às pessoas
(CAVALCANTE & PINHEIRO, 2011). As informações sobre a saúde pública visam identifi-
car as situações existentes, de forma a auxiliar o processo de análise das questões, em busca
da identificação de alternativas de solução para os problemas. Essas informações devem con-
ter informações referentes não apenas aos quadros de saúde, mas também administrativas, que
subsidiem a tomada de decisão no setor (BRANCO, 1996). Um sistema de informações de
saúde integra dados, processa e reporta informações úteis para o aprimoramento da eficiência
e eficácia dos serviços prestados, em todos os níveis da administração de saúde (WHO, 2004).
Os primeiros sistemas de informações de saúde pública construídos no mundo, começam a se
beneficiar da computação cognitiva, em função da capacidade de análise de grandes volumes
de dados, bem como de fornecer suporte decisório com indicação de probabilidades, baseada
na qualidade das evidências (SEPÚLVEDA, 2014).

2.5 COMPUTAÇÃO E SISTEMAS COGNITIVOS

Cognição, do Latim cognitio, ônis – ação de conhecer - é um processo ou a faculdade


de adquirir conhecimento, ou um conjunto de unidades de saber da consciência, que se basei-
am em experiências sensoriais, representações, pensamentos e lembranças. Cognitivo por sua
vez refere-se ao processo mental de percepção, memória, juízo e/ou raciocínio (HOUAISS, et
al., 2014). A computação cognitiva refere-se ao desenvolvimento de computadores, que traba-
lham de forma análoga ao cérebro humano, capazes de interagir com os humanos em lingua-
gem natural, aprender a partir de experiências (dados) e fornecer melhores subsídios para o
28

processo de tomada de decisões (NOOR, 2015). Garcia e Neri (2015) mapearam diversas de-
finições sobre computação cognitiva, conforme apresentado no Quadro 2.

Quadro 2: Definições de Computação Cognitiva


Definição Referência
Uma disciplina que reúne neurobiologia, psicologia cognitiva e inteligência artifici- Valiant (1995)
al.
Uma coleção de tecnologias emergentes inspirada pelo processamento biológico da Brasil (2001)
informação no sistema nervoso, raciocínio humano, tomada de decisão e seleção
natural.
O desafio de aproximar a função análoga à mente, com pouca energia, pequeno Preiss (2005)
volume e desempenho em tempo real do cérebro humano.
Um campo emergente de investigação que se baseia em princípios das ciências Szymanski; Hise
comportamentais, cognitivas, informáticas e afins. (2000)
Um paradigma emergente de metodologias de computação e sistemas baseados em Wang (2007)
Informática cognitiva que implementa a inteligência computacional através de
inferências autônomas e percepções autônomas que imitam os mecanismos do
cérebro.
Um propósito de desenvolver um mecanismo coerente, unificado e universal das Modha (2011)
capacidades da mente.
Um paradigma de computação fundamentalmente novo para problemas do mundo Nahamoo (2014)
real, que explora grandes quantidades de informações, através de uso massivo de
máquinas paralelas, que interagem com humanos e outros sistemas cognitivos.

Os sistemas cognitivos computacionais visam emular o aprendizado humano e por isso


é dito que “aprendem” a partir dos dados, sejam eles estruturados ou não, residentes em ban-
cos de dados relacionais ou textos, imagens, áudios, vídeos e outros gerados por sensores,
dentro de um contexto específico, a fim de identificar padrões ou anomalias naquele conjunto
de dados (HURWITZ, et al., 2015). Até 2003 a humanidade havia criado 5 (cinco) exabytes
(1018 bytes) de dados. Dez anos depois essa quantidade passou a ser criada a cada dois dias e
estimava-se que tal volume em 2012 era de 2.72 zetabytes (1021 bytes) de dados
(SAGIROGLU & SINANC, 2013). Diante de tais características relacionadas a volume, velo-
cidade de geração de diferentes tipos de dados, é possível perceber o quão complexo se tornou
realizar análises através de técnicas tradicionais, de forma a garantir a veracidade das infor-
mações e gerar os benefícios esperados pelas organizações (KATAL, et al., 2013). No entan-
to, o grande volume de dados processado, ao invés da utilização de amostragens, trouxe um
preço, a imperfeição dos dados. O tratamento dos erros, que assegurava a qualidade dos da-
dos, passou a não ser mais essencial, nem possível. A leitura do todo, tornou-se mais eficiente
do que a leitura de uma amostra perfeita (MAYER & CUKIER, 2013).
Os modelos de aprendizado são essenciais para que um sistema cognitivo tenha a ca-
pacidade de aprender. Este modelo pode ser descritivo ou preditivo a depender do objetivo. O
primeiro é utilizado, quando se deseja encontrar padrões e tendências no conjunto de dados
29

fornecido, através de técnicas de sumarização, associação ou agrupamento. O segundo é utili-


zado, caso o objetivo seja criar um estimador, uma função criada a partir de dados classifica-
dos pertencentes a um tópico conhecido. A depender do conjunto de dados, esse estimador
pode ser um classificador, quando o conjunto for de valores nominais ou um regressor, caso o
conjunto seja infinito e de valores ordenados (FACELI, et al., 2015) .
Os algoritmos que permitem que os sistemas aprendam e executem ou recomendem
ações, são conhecidos como aprendizado de máquina (Learning Machine). O aprendizado de
máquina é parte da inteligência artificial e possui três categorias: (i) aprendizado supervisio-
nado; (ii) aprendizado não-supervisionado e (iii) aprendizado de reforço. No caso do aprendi-
zado supervisionado, o sistema recebe dados em pares (x, y) onde x, representa um dado de
entrada e y, o resultado esperado, após a análise do algoritmo é gerada uma função de inferên-
cia, que poderá ser aplicada sobre outros conjuntos de dados. O aprendizado não supervisio-
nado recebe apenas dados de entrada, uma vez que não existem resultados previamente espe-
rados. A categorização é realizada de forma a permitir que o algoritmo consiga perceber as
diferenças nos conjuntos de dados. A utilidade desse modelo é identificar uma função que
descreva estruturas desconhecidas de dados não classificados. Por fim, o aprendizado de re-
forço foi inspirado na psicologia do comportamento e trata sobre como os agentes de software
devem atuar, a fim de maximizar um cenário de recompensa (SOMVANSHI, et al., 2016).
Outra característica dos sistemas cognitivos é a capacidade de gerar hipóteses. Uma
hipótese é uma declaração passível de testes, baseada em dados, que pode explicar um fenô-
meno sobre um determinado assunto. Existem duas formas de se obter hipóteses (i) responder
a uma questão específica, que é uma abordagem mais comum quando se busca identificar
relações de causa e efeito; (ii) busca contínua por anomalias nos padrões de dados. Após a
geração das hipóteses é iniciado um processo de pontuação das hipóteses baseado nos dados
disponíveis no conjunto de dados ou dados de treinamento. Esse processo consiste em aplicar
a hipótese aos dados e buscar evidências, que a confirme ou a rejeite, utilizando-se métodos
estatísticos para determinar o grau de confiança de cada hipótese. Os sistemas cognitivos ofe-
recem mais de uma resposta possivelmente correta, são probabilísticos e não determinísticos
(HURWITZ, et al., 2015).
A maior parte do grande volume de dados disponíveis atualmente encontra-se no for-
mato de texto, disponibilizados em e-mails, artigos, relatórios, fóruns e publicações de pes-
quisa, entre outros. Os sistemas cognitivos representam uma nova categoria de sistemas com-
putadorizados, capazes de extrair conhecimento dos textos escritos em linguagem humana,
para isso utiliza-se de técnicas de processamento de linguagem natural, do inglês, Natural
30

Language Processing - NLP (BHATY & PRASAD, 2016). A NLP é um conjunto de técnicas
computacionais para análise e representação de textos escritos em linguagem humana, que
visa extrair seu significado, de forma análoga ao processo de entendimento de uma pessoa
(LIDDY, 2001). Um estudo recente elaborado pela IBM utilizou técnicas de NLP em um sis-
tema cognitivo para apresentar, de forma automatizada, a situação da doença de pacientes
hipertensos, a partir de dados estruturados e não-estruturados presentes em seus respectivos
prontuários médicos (ALEMZADEH, et al., 2016). O estudo considerou casos de hipertensão
para avaliar o sistema, uma vez que se trata de uma doença que atinge 29% da população
americana. Os dados de treinamento foram coletados de 414 prontuários clínicos destes paci-
entes. Posteriormente, os prontuários de 5.035 potenciais pacientes foram avaliados, estes
prontuários foram extraídos de 55.000 anotações clínicas, coletadas durante 7 anos. O expe-
rimento mostrou viabilidade para a aplicação prática, embora não tenha gerado melhorias no
desempenho do atendimento médico, o que foi considerado tema para trabalhos futuros pelos
pesquisadores.
Durante a execução dessa pesquisa, grandes fornecedores do mercado de tecnologia
como IBM, Microsoft e Amazon já defendiam a eficiência de suas soluções cognitivas. Por
exemplo, o Watson, da IBM, ficou famosO por vencer um jogo de perguntas e respostas con-
tra dois campeões do concurso em 2011. As cinco capacidades principais da solução incluem:
(i) interação com humanos em linguagem natural, a partir de preferências pessoais; (ii) carga
de conteúdo orientados à indústria, tornando possível escalar e elevar o conhecimento em
parceria com especialistas de domínio; (iii) permitir que produtos e serviços detectem, racio-
cinem e aprendam sobre seus usuários e sobre o mundo ao redor; (iv) utilizar dados para
aprimorar processos de negócios e previsões, aumentando a eficiência operacional e (v) apri-
morar a exploração e a descoberta de padrões únicos, oportunidades e hipóteses viáveis (IBM,
2018). A Microsoft oferece serviços cognitivos através da plataforma Azure, que disponibiliza
recursos para: (i) processamento de imagens; (ii) mapeamento de dados e informações com-
plexas; (iii) processamento de linguagem natural e (iv) conversão de aúdios para textos
(MICROSOFT, 2018). A Amazon oferece o Amazon Rekognition, serviço de reconhecimento
de imagens e o Polly, que é utilizado para conversão de áudio para textos (AMAZON, 2018).
31

3. METODOLOGIA

3.1 CLASSIFICAÇÃO

O levantamento bibliográfico realizado evidenciou que o uso da computação cognitiva


para o suporte ao processo de tomada de decisões, a partir dos diagnósticos encontrados nos
prontuários eletrônicos de pacientes em uma rede de atendimento à saúde ainda é um tema
inexplorado. Os objetivos definidos para esse estudo indicam a construção de um modelo
conceitual para a prestação de serviços de saúde na rede pública. Além disso, prevê a constru-
ção de um experimento, que comprove a capacidade de extração de padrões e sua utilidade no
suporte ao processo de tomada decisões de gestores da saúde pública. Sendo assim, devido a
natureza tecnológica desse estudo foi determinante a realização de uma pesquisa aplicada que
explicitasse o conhecimento sobre temas pouco discutidos (SAMPIERI, et al., 2006).
Foi realizado um experimento utilizando o IBM WATSON, com o objetivo de com-
provar como uma solução baseada em computação cognitiva deverá reagir ao identificar pa-
drões de diagnósticos implícitos nos prontuários eletrônicos da população. Por natureza, o
experimento será puro, ou seja, com ações realizadas intencionalmente de forma a alterar o
estado das variáveis independentes, com o objetivo de observar os efeitos ocorridos nas variá-
veis dependentes em uma situação controlada (SAMPIERI, et al., 2006). Além disso, foram
criadas novas tabelas que ajudaram na simulação do ambiente de uma cidade, contendo bair-
ros, bem como propostas de ações proativas ou reativas para os diagnósticos mapeados, de
acordo com o Código Internacional de Doenças (CID).

3.2 PLANEJAMENTO DA PESQUISA

O modelo proposto envolve as seguintes etapas, conforme mostrado no Quadro 3:


− Modelagem da Rede de Atenção à Saúde. Nesta fase, foi modelada uma rede de aten-
ção à saúde visando a integração entre as unidades prestadoras de serviços médicos.
Trata-se de um desenho que possibilita o compartilhamento de dados e informações em
prol dos habitantes de uma cidade hipotética.
32

Quadro 3: Etapas do percurso metodológico


Etapa Descrição
1. Modelagem da rede Modelagem de uma rede de atenção à saúde integrada, na qual é possível
de atenção à saúde compartilhar os prontuários eletrônicos dos pacientes durante o atendimento
médico.
2. Preparação da Obtenção da base de dados de prontuários eletrônicos de pacientes disponível
amostra para pesquisa no repositório EMRBots (http://www.emrbots.org).
Alterações na base de dados de forma a torná-la mais próxima da realidade de
uma cidade com 100.000 habitantes.
Mapeamento de ações adequadas para os diagnósticos emitidos para a
população.
3. Construção da Criação de uma área de trabalho através da plataforma Bluemix da IBM, a qual
ferramenta de possibilita o uso de serviços WATSON.
simulação Provisionamento das ferramentas disponíveis no WATSON.
Construção dos casos de uso de exemplo aplicados no ambiente de simulação.
4. Execução da Realizar a ação de treinamento da solução cognitiva com a carga de 60% dos
simulação dados da amostra.
Testar o nível de aprendizagem do modelo com a carga dos 20% remanescentes
da amostra, considerando que 20% foram descartados aleatoriamente.

5. Análise de resultados Apresentar os resultados.


Desenvolver o relatório final.
Desenvolver as considerações finais.
6. Opinião de Apresentar os objetivos, a metodologia, a prova de conceito, os resultados e a
Especialista conclusão para uma especialista em saúde pública

− Preparação dos dados. Nessa fase, foi realizada a preparação da base de dados de
prontuários eletrônicos de pacientes, inclusão de novas estruturas de dados de forma a
torná-la mais próxima da realidade de uma cidade com cerca de 100.000 pacientes. Adi-
cionalmente foram apresentados casos de uso que podem suportar o gestor público de
saúde, a partir dos diagnósticos proferidos para os pacientes de uma determinada popu-
lação.
− Provisionamento do Ambiente de Simulação. Nessa fase, foi criada uma área de tra-
balho no IBM Bluemix, para que os componentes necessários à criação da ferramenta
fossem disponibilizados. Nesta área foram adicionados os serviços de banco de dados
MYSQL e WATSON. Em seguida, foi realizado o mapeamento dos serviços do WAT-
SON, a fim de identificar a melhor forma de construir modelos de análise relacionados à
situação da saúde de uma determinada população. Após a definição dos serviços, foi re-
alizada a manipulação de dados através de script SQL de modo a ajustar a base de dados
ao caso em estudo.
− Execução da Simulação. Nessa fase, foi realizada a carga da amostra, a fim de treinar
os modelos com 60% dos dados da amostra e em seguida testá-los com os 20% da
amostra, outros 20% foram descartados aleatoriamente durante o processo de treina-
33

mento do modelo cognitivo. Ao final deste processo, a solução cognitiva apresentou as


respostas baseadas em probabilidades para as perguntas realizadas.
− Análise dos Resultado. Após a realização do experimento, as informações geradas du-
rante a simulação foram descritas e o relatório final preparado, seguido das considera-
ções finais sobre a simulação.
− Opinião de Especialista. Após a elaboração da análise de resultados e conclusão a pes-
quisa será apresentada para um especialista em saúde pública, a fim de obter sua opinião
especializada sobre as conclusões obtidas nesta pesquisa.
34

4. EXECUÇÃO DA PESQUISA

4.1 REDE INTEGRADA DE ATENÇÃO À SAUDE

Esta pesquisa propõe a existência de uma Rede Integrada de Atenção à Saúde - RIAS -
que disponha de uma base de dados única para armazenamento dos prontuários eletrônicos
dos pacientes. Desta forma, o acesso a tais prontuários deve ocorrer a partir de qualquer uni-
dade de atendimento (básica, secundária ou terciária). Desta forma, torna-se possível cumprir
um dos objetivos principais dos prontuários médicos: ser um documento único, fonte de co-
municação entre equipes multidisciplinares e que permita um assistência continuada ao paci-
ente.
A base única de prontuários é uma rica fonte de dados referentes à saúde de uma de-
terminada população. A partir desta base, os prestadores de serviços médicos teriam à sua
disposição todo o histórico médico do paciente, com suas consultas, exames, procedimentos,
receituários, informações valiosas sobre questões pessoais que possam interferir em um tra-
tamento, como alergias por exemplo. Outro benefício direto que poderia ser percebido é a
redução de custos, ao se evitar a repetição de exames de forma desnecessária. A indisponibili-
dade do recurso de prontuário eletrônico único pode gerar solicitação de exames já realizados
e dentro do período de validade. Os processos de análise de dados que gerem informações
quantitativas e qualitativas seria facilitado, pois não haveria necessidade de prazos de envios
das informações para posterior verificação, consolidação e disponibilização. Os dados já esta-
riam disponíveis em uma base de dados centralizada.
O objetivo deste trabalho foi o de apresentar soluções baseadas em computação cogni-
tiva, possíveis graças à disponibilidade de dados possibilitada pela integração das unidades e
pela base única de prontuários eletrônicos, como representado na Figura 4. No entanto, as
soluções tecnológicas envolvidas nesta integração, bem como as soluções de armazenamento
de dados, não serão detalhadas, pois tratam-se de soluções comuns à comunidade científica e
ao mercado de tecnologia da informação.
35

Figura 4: Integração dos prontuário eletrônicos entre as unidades de atendimento

Unidade
Básica de
Saúde

PProntuários
Eletrônicos

Ponto de Ponto de
Atenção Atenção
Terciário Secundário

4.2 FERRAMENTA DE SIMULAÇÃO

Muitas ferramentas de Business Intelligence (BI) aplicam abordagens descritivas, que


sumarizam e apresentam resultados do passado através de relatórios tradicionais. Outras fer-
ramentas utilizam análises preditivas ou prescritivas, incorporando técnicas mais avançadas
como a modelagem estatística para prever ocorrências futuras ou dados ausentes. A decisão
de utilizar a plataforma Watson foi tomada face à sua disponibilidade ao autor e por se tratar
de um sistema cognitivo com múltiplos casos de sucesso. A ferramenta disponível na plata-
forma Watson é o Watson Studio, que utiliza as capacidades cognitivas disponíveis, para ana-
lisar conjuntos de dados estruturados.
O primeiro passo foi provisionar o ambiente para a execução das análises das bases de
dados. O ambiente disponibilizado no IBM Bluemix (IBM, 2017) foi criado utilizando-se dos
serviços da plataforma Watson. Para esta simulação foram provisionados serviços de armaze-
namento de objetos, aprendizado de máquina e análise de dados. O provisionamento foi reali-
zado através da seleção dos componentes mencionados, a partir do painel principal do ambi-
ente. O objeto responsável pelo armazenamento de dados substituiu o banco de dados, uma
vez que foram usadas arquivos de dados CSV (comma separated value); o recurso de apren-
dizado de máquinas permite a criação dos modelos de aprendizado e a ferramenta de análise
36

realiza os cálculos de efetividade destes modelos. Os procedimentos realizados estão detalha-


dos no Apêndice I.
O uso dos serviços provisionados no Watson requer a criação de um projeto, que foi
criado utilizando-se a ferramenta Watson Studio. Uma vez preparados o projeto e os serviços
a ele vinculados, estes foram acionados de forma isolada ou em conjunto no contexto do pro-
jeto. Os procedimentos detalhados para a criação do projeto estão detalhados no Apêndice II.

4.3 BASE DE DADOS DE PRONTUÁRIOS ELETRÔNICOS

Nesta pesquisa, foi utilizada uma base de dados preparada por Kartoun (2015), deta-
lhada no Apêndice III, que possuia uma modelagem inicial contendo uma base de pacientes,
suas entradas em unidades de saúde, os diagnósticos finais destas entradas e um conjunto de
resultados de exames laboratoriais, que não foram utilizados neste trabalho. Foram acrescen-
tadas novas tabelas e dados com o objetivo de se obter validações sobre os dados existentes e
aprimorar a qualidade do resultado final. Essas mudanças foram documentadas em uma nova
versão do modelo de dados (Apêndice IV), que inclui as tabelas Internatio-
nal_Diagnoses_Codes_chapters, International_Diagnoses_Codes_Categories e Internatio-
nal_Diagnoses_Codes, referentes ao CID versão 10, disponível na internet e conhecido como
CID-10. Os dados das três tabelas foram consolidados em uma visão única através de um ob-
jeto view (vw_cids). Além disso, foram incluídas tabelas e dados referentes a distribuição etá-
ria (ages_ranges_expected_distribution), faixa etária (ages_ranges), bairros (neighborhoods)
e demografia dos bairros (demograph_neighborhoods).
Após a disponibilização dos dados, foi iniciada a fase de pré-processamento, para mi-
nimizar inconsistências e aprimorar a qualidade final dos dados. O processo foi iniciado pela
validação dos CIDs existentes na tabela original admissions_diagnoses, que foram compara-
dos aos dados da vw_cids. O resultado dessa comparação apresentou um percentual de 53%
de CIDs válidos. Para se buscar um conjunto de dados de maior volume, foi iniciado um pro-
cesso de ajuste dos dados, que consistia em substituir os CIDs inválidos por outros válidos.
O primeiro passo consistiu da criação de um programa em linguagem Java 1.8 que
acessou todos os CIDs da tabela admissions_diagnoses, em seguida buscou na visão vw_cids
um CID real, dentro da mesma categoria do CID em análise. Caso a categoria do CID também
não existisse, buscava-se um CID de uma categoria de código menor (-1) em relação à catego-
ria original. O programa de ajuste da base de dados está disponível no Apêndice V. Após a
execução do procedimento, 361.760 diagnósticos foram validados.
37

Em seguida, foi realizado o processo de ajustamento da distribuição dos pacientes por


gênero e faixa etária, através de atualizações na tabela Patients. Como referência, foi utilizada
a distribuição populacional de uma cidade brasileira, que possuía uma quantidade de habitan-
tes próxima a amostra existente, aproximadamente 134.000 residentes. Os dados demográfi-
cos de referência foram incluídos na tabela ages_ranges_expected_distribution. A distribui-
ção original está demonstrada no Tabela 4. O programa de ajuste acessa esta tabela e em se-
guida atualiza o gênero e a idade da tabela Patients. O procedimento atualizou dados de
99.999 pacientes e após sua conclusão a população passou a ter a mesma distribuição do Cen-
so de 2010 da cidade de referência. A distribuição ajustada é apresentada na Tabela 5.

Tabela 4 – Distribuição por faixa etária original da base de dados

Faixa Etária Homens Mulheres


0 a 4 Anos 0 0
5 a 9 Anos 0 0
10 a 14 Anos 0 0
15 a 19 Anos 0 0
20 a 24 Anos 0 0
25 a 29 Anos 695 820
30 a 34 Anos 2426 2654
35 a 39 Anos 2709 2914
40 a 44 Anos 3650 3848
45 a 49 Anos 4319 4699
50 a 54 Anos 5772 6182
55 a 59 Anos 5426 5761
60 a 64 Anos 4575 4874
65 a 69 Anos 4221 4733
70 a 74 Anos 3608 3869
75 a 79 Anos 3066 3450
80 a 84 Anos 2212 2365
85 a 89 Anos 2071 2319
90 a 94 Anos 1888 2059
95 a 99 Anos 1361 1453
100 anos ou mais 0 0
Totais 47.999 52.000
38

Tabela 5 – Distribuição por faixa etária da base de dados ajustada

Faixa Etária Homens Mulheres


0 a 4 Anos 3493 3409
5 a 9 Anos 3897 3789
10 a 14 Anos 4476 4418
15 a 19 Anos 4374 4444
20 a 24 Anos 4295 4639
25 a 29 Anos 4106 4423
30 a 34 Anos 3764 4133
35 a 39 Anos 3346 3765
40 a 44 Anos 3288 3482
45 a 49 Anos 2992 3231
50 a 54 Anos 2540 2757
55 a 59 Anos 1994 2353
60 a 64 Anos 1537 1960
65 a 69 Anos 1266 1651
70 a 74 Anos 1003 1337
75 a 79 Anos 740 1014
80 a 84 Anos 411 677
85 a 89 Anos 204 370
90 a 94 Anos 79 200
95 a 99 Anos 29 75
100 anos ou mais 8 30
Totais 47.842 52.157

A cidade de referência é formada por 40 bairros, de acordo com o Censo 2010 (IBGE,
2010), que apresenta os bairros e suas respectivas populações. A população do bairro “Ou-
tros”, que consolida bairros com populações menores, foi distribuída proporcionalmente aos
demais bairros. A inclusão de um bairro genérico poderia distorcer a apresentação dos resul-
tados dessa pesquisa. Por isso, o percentual de habitantes de cada bairro foi recalculado sem
incluir os habitantes deste bairro. Os novos percentuais foram aplicados aos 99.999 pacientes
existentes na tabela Patients e uma nova distribuição quantitativa foi obtida. A Tabela 6 apre-
senta estas operações.
39

Tabela 6 – Distribuição Populacional Entre os Bairros


Percentual Percentual Habitantes
Bairro Habitantes
Todos os Bairros sem “Outros” Ajustada
Bairro#01 1.845 1,37% 1,75% 1.753
Bairro#02 2.045 1,52% 1,94% 1.943
Bairro#03 9.418 6,99% 8,95% 8.949
Bairro#04 3.032 2,25% 2,88% 2.881
Bairro#05 6.501 4,82% 6.18% 6.177
Bairro#06 1.304 0,97% 1,24% 1.239
Bairro#07 3.183 2,36% 3,02% 3.025
Bairro#08 1.238 0,92% 1,18% 1.177
Bairro#09 3.973 2,95% 3,78% 3.775
Bairro#10 2.248 1,67% 2,14% 2.136
Bairro#11 1.003 0,74% 0,95% 953
Bairro#12 3.883 2,88% 3,69% 3.690
Bairro#13 27 0,02% 0,03% 26
Bairro#14 1.720 1,28% 1,63% 1.634
Bairro#15 2.205 1,64% 2,10% 2.095
Bairro#16 1.396 1,04% 1,33% 1.326
Bairro#17 1.404 1,04% 1,33% 1.334
Bairro#18 3.987 2,96% 3,79% 3.788
Bairro#19 6.605 4,90% 6,28% 6.276
Bairro#20 1.748 1,30% 1,66% 1.661
Bairro#21 5.781 4,29% 5,49% 5.493
Bairro#22 1.790 1,33% 1,70% 1.701
Bairro#23 6.379 4,73% 6,06% 6.061
Bairro#24 560 0,42% 0,53% 532
Bairro#25 1.283 0,95% 1,22% 1.219
Bairro#26 2.346 1,74% 2,23% 2.229
Bairro#27 194 0,14% 0,18% 184
Bairro#28 2.299 1,71% 2,18% 2.185
Bairro#29 1.273 0,94% 1,21% 1.210
Bairro#30 1.774 1,32% 1,69% 1.686
Bairro#31 6.344 4,71% 6,03% 6.028
Bairro#32 1.382 1,03% 1,31% 1.313
Bairro#33 1.584 1,18% 1,51% 1.505
Bairro#34 2.895 2,15% 2,75% 2.751
Bairro#35 3.424 2,54% 3,25% 3.254
Bairro#36 2.021 1,50% 1,92% 1.920
Bairro#37 1.486 1,10% 1,41% 1.412
Bairro#38 1.197 0,89% 1,14% 1.137
Bairro#39 2.461 1,83% 2,34% 2.338
Outros 29.506 21,90% - -
Totais 134.745 100% 100% 99.999

O último passo em relação aos pacientes foi distribuí-los entre os bairros da cidade, de
acordo com o sexo e a faixa etária desta população, com o objetivo de dar à base dados carac-
terísticas equivalentes às da cidade utilizada como referência e assim aprimorar os resultados
40

da pesquisa. Em uma planilha Excel foram carregados os bairros, suas respectivas populações,
as distribuições de faixa etária ajustadas nos passos anteriores. Foi realizada a multiplicação
da quantidade de habitantes de cada bairro pelo percentual de habitantes em cada faixa etária,
observando-se também o sexo do paciente. Os resultados destes cálculos (Tabela 7) foram
inseridos na tabela neighborhood_demograph do banco de dados da aplicação. Pequenos ajus-
tes manuais foram necessários por questões de arredondamento. Mais um programa Java foi
criado para acessar esses dados e atualizar a coluna neigh_id com os códigos dos bairros indi-
cados para os pacientes da tabela Patients. Após a conclusão do processo, as ações sobre esta
tabela foram concluídas, pois passou-se a ter uma distribuição demográfica significativa para
a execução da simulação. O programa utilizado para o a designação de bairros entre os paci-
entes está disponível no Apêndice VI.
A etapa final do ajuste da base de dados consistiu em representar alguns dados de saú-
de da cidade de referência. Através de uma pesquisa realizada no site do DATASUS
(www.datasus.gov.br), foi possível descobrir que a cidade de referência confirmou 610 casos
de tuberculose no período de 2006 a 2017. O caminho percorrido no site foi selecionar a op-
ção ACESSO À INFORMAÇÃO no menu principal, INFORMAÇÕES DE SAÚDE (TABNET), EPIDE-
MIOLÓGICAS E MORBIDADE. Em seguida foi selecionado o grupo de opções CASOS DE TUBER-
CULOSE – DESDE 2001 (SINAN), selecionada a opção TUBERCULOSE – DESDE 2001 e o Estado
da cidade de referência. Na tela de consulta, foram passados os parâmetros a seguir: (i) Linha:
Fx Etária 13; (ii) Coluna: Ano Diagnóstico; (iii) Conteúdo: Casos Confirmados; (iv) Períodos
Disponíveis: 2006 a 2017; (v) Município de Notificação: <Cidade de Referência>; (vi) Forma-
to: Texto pré-formatado.
41

Tabela 7 – Distribuição Demográfica entre os bairros, por idade e gênero dos habitantes
42

4.3.1 Geração dos arquivos de dados

O ambiente Watson Studio permite o acesso aos dados nas formas: (i) Dados armazena-
dos no DB2 (sistema de gerenciamento de bancos de dados da IBM); ou (ii) Dados armazenados
em arquivos .csv (comma separated value) sem formatações. Foi utilizada a segunda opção, por
não exigir a contratação de serviços privados, o que geraria um custo desnecessário, uma vez que
os dados seriam os mesmos independente da opção escolhida. A partir desta premissa, foi inicia-
do o processo de geração de arquivos de dados.

Arquivo dados1.csv

O resultado do comando abaixo foi o conjunto de dados de 359.480 registros, contendo o


gênero do paciente, sua faixa etária, o bairro de residência e o indicador de contágio, que deter-
minava quais ocorrências referiam-se a doenças contagiosas (positivo) ou não contagiosas (nega-
tivo).

Tee C:\Mestrado\Arquivos de Dados\dados1.txt


SELECT PatientGender, AgeRange, Nome Neighborhood, Contagious
FROM vw_dados;
Notee

Arquivo dados2.csv

O resultado do comando abaixo foi o conjunto de dados de 359.480 diagnósticos, incluin-


do a categoria da doença previsto no Código Internacional de Doenças. Neste conjunto de dados
também foram carregados: o gênero do paciente, sua faixa etária e o seu bairro de residência.

4.3.2 Tratamento dos dados

Cada arquivo gerado precisou passar por um processo de tratamento. Embora o formato
fosse de texto, o MySQL 5.6 utiliza separadores “|” entre as colunas para dar uma visão de tabela
de dados. Além disso, o comando de pesquisa utilizado foi incluído na primeira linha do arquivo,
bem como os dados de quantidade de linhas resultantes, o tempo de duração da pesquisa e o co-
mando de desabilitação do modo de arquivamento.
43

O primeiro passo do tratamento foi abrir o arquivo .txt, para eliminar as linhas desneces-
sárias existentes antes e depois dos dados. Além disso foram substituídas os valores “NÃO” e
“SIM” por “NEGATIVO” e “POSITIVO”, respectivamente. Em seguida, foi criada uma nova
visão dos dados, na forma de uma planilha, sem os marcadores “|”. Para isso foi necessário iden-
tificar a posição em cada linha do arquivo em que se encontravam estes marcadores, através da
função:

FIND(<string a ser pesquisada no texto>;


<célula que continha o texto>; <posição inicial>)

Haviam vários marcadores em cada linha, então a função FIND foi usada em células dife-
rentes, sendo que cada uma guardava a posição de um marcador, considerando as suas posições
iniciais em n+1, sendo n a posição do marcador anterior.
Uma vez identificadas as posições dos marcadores, foi possível identificar o tamanho de
cada pedaço da informação, considerando todo o espaço ocupado entre os marcadores, através da
fórmula:

<POSICÃO DO MARCADOR (n)> - <POSIÇÃO DO MARCADOR (n-1)>

Utilizando-se as funções TRIM e MID foi possível montar uma função para extrair o con-
teúdo de cada informação. A função MID tem por finalidade extrair uma cadeia de caracteres em
uma string recebendo como parâmetros a string completa, sua posição inicial e a quantidade de
caracteres a serem extraídos. A função TRIM tem a finalidade de excluir caracteres em branco no
início e no final de uma string. Desta forma, foi montada a função:

TRIM(MID(<String Original>; <Posição do Marcador n> +1 ;


<Tamanho da informação n> -1))

para cada informação desejada. Todos os dados isolados de seus marcadores foram copiados para
uma nova planilha e o arquivo salvo no formato CSV (MS-DOS). Este processo foi seguido para
todos os arquivos gerados para as simulações.
44

4.3.3 Carga dos arquivos no Watson Studio

Os arquivos de dados são os ativos fundamentais para treinamento e testes dos modelos
cognitivos. Após a geração e tratamento de cada arquivo foi necessário realizar seus uploads para
o projeto criado no Watson Studio. Na área Assets, o link New data asset foi acionado e uma área
para selecionar o arquivo de dados na máquina local foi aberta. A pasta onde foram gerados os
arquivos foi selecionado e cada arquivo passou por seu processo de upload. Após a conclusão dos
uploads os arquivos ficaram disponíveis como Assets de dados. Os detalhes deste procedimento
está disponível no Apêndice VII.

4.4 CASOS DE USO UTILIZADOS NA SIMULAÇÃO

Os casos de uso considerados no presente são os seguintes:


− Caso de Uso #1 – Descoberta da probabilidade de ocorrência de casos de doenças contagio-
sas entre os bairros da cidade,
− Caso de Uso #2 – Descobrir a probabilidade de ocorrência de doenças contagiosas em um
determinado bairro da cidade.
− Caso de Uso #3 –Descobrir a probabilidade de ocorrência de doenças contagiosas específi-
cas entre os bairros da cidade.
O detalhamento dos mesmos consta do Quadro 4.
45

Quadro 4 – Casos de uso considerados na pesquisa


Caso de uso Objetivo Oportunidade Dados Execução
1 Descobrir a Preparar as equipes Arquivo dados1.csv. Foi criado um Watson Machine Learning model para analisar os dados
probabilidade de envolvidas com as selecionados para este caso de uso, com o nome de Modelo-Probabilidade-
ocorrência de ações preventivas e Contagio-Bairros. Ao criar o modelo foram configurados a técnica de
doenças contagiosas reativas para os classificação binária e selecionado o algoritmo de classificação de regressão
(CIDs de A01 a desafios que deverão logística. A base de dados foi dividida em três partes a saber: 60% para
B99) entre os bairros ser enfrentados a treinamento; 20% para testes; 20% recusados aleatoriamente. Após a conclusão
da cidade. partir do momento do processo de treinamento o modelo foi salvo e passou pelo processo de
da análise. deployment, sendo registrado como Deployment-Modelo-Probabilidade-
Contagio-Bairros e tendo sido selecionado o tipo webservice, vide Apendice
VIII. Após isso o modelo foi utilizado para prever resultados futuros.
2 Descobrir a probabi- Preparar as equipes Arquivo dados1.csv. Foi criado um Watson Machine Learning model para analisar os dados selecio-
lidade de ocorrência envolvidas com as nados para este caso de uso, com o nome de Modelo-Probabilidade-Contagio-
de doenças contagi- ações preventivas e Bairros-2. Ao criar o modelo foram configurados a técnica de classificação
osas (CIDs de A01 a reativas para os binária e selecionado o algoritmo de classificação de regressão logística. A base
B99) em um bairro desafios que deverão de dados foi dividida em três partes a saber: 60% para treinamento; 20% para
da cidade ser enfrentados a testes; 20% recusados aleatoriamente. Após a conclusão do processo de treina-
partir do momento mento o modelo foi salvo e passou pelo processo de deployment, sendo regis-
da análise; trado como Deployment-Modelo-Probabilidade-Contagio-Bairros-2 e tendo
sido selecionado o tipo webservice, vide Apendice VIII. Após isso o modelo foi
utilizado para prever resultados futuros. O processo utilizado é o mesmo reali-
zado no Caso de Uso #1. Por isso apenas os passos diferentes foram apresenta-
dos.
3 Descobrir a probabi- Preparar as equipes Arquivo dados2.csv. Foi criado um Watson Machine Learning model para analisar os dados selecio-
lidade de um tipo de envolvidas com as nados para este caso de uso, com o nome de Modelo-Probabilidade-Doencas-
doença na população ações preventivas e Fx.Etarias. Ao criar o modelo foram configurados a técnica de classificação
de uma cidade reativas para os multiclasses e selecionado o algoritmo de classificação por Árvore de decisão.
desafios que deverão A base de dados foi dividida em três partes a saber: 60% para treinamento; 20%
ser enfrentados a para testes; 20% recusados aleatoriamente. Após a conclusão do processo de
partir do momento treinamento o modelo foi salvo e passou pelo processo de deployment, sendo
da análise; registrado como Deployment- Modelo-Probabilidade-Doencas-Fx.Etarias e
tendo sido selecionado o tipo webservice, vide Apêndice VIII. Após isso o
modelo foi utilizado para prever resultados futuros. O processo utilizado é o
mesmo realizado no Caso de Uso #1. Por isso apenas os passos diferentes fo-
ram apresentados.
46

Resultados Obtidos

Nos três casos de uso utilizados os modelos apresentaram uma performance classificada
como pobre, de acordo com os indicadores Area Under ROC Curve, Area Under PR Curve,
Weighted True Positive, Weighted False Positive e Weighted Precision, apresentados pela ferra-
menta. O autor assumiu se tratar de uma consequência da utilização de uma base de dados fictí-
cia. Apesar disso, os modelos foram salvos e disponibilizados para uso. Para testar cada modelo,
foi necessário realizar os seguintes passos: acessar a página inicial do projeto, clicar no nome do
modelo, clicar na área deployments, clicar no nome do deployment realizado e por fim clicar em
test. Os resultados de cada modelo são apresentados a seguir.
No Caso de Uso #1, o modelo apresentou os indicadores Area Under ROC Curve e Area
Under PR Curve iguais a 0,50123 e 0,91164, respectivamente. O modelo recebeu a string ‘PO-
SITIVO’ no parâmetro ‘CONTAGIOUS’ e gerou as previsões apresentadas na Figura 5 indicando
que 50,78% dos casos de doenças contagiosas, provavelmente ocorrerão/ocorreriam nos bairros:
Bairro#03, Bairro#19, Bairro#31, Bairro#05, Bairro#23, Bairro#21, Bairro#18, Bairro#12 e Bair-
ro#09, por ordem descendente de probabilidade. Foram considerados trinta e nove bairros na mo-
delagem dos dados, diante da concentração de casos prováveis nos nove bairros apresentados, os
responsáveis pela mitigação desses casos teriam a oportunidade de planejar ações de maior inten-
sidade nestes locais, concentrando os esforços e investimentos, ampliando a possibilidade de me-
lhores resultados na contenção de contágios.
47

Figura 5: Tela de parâmetros para previsão de valores do modelo.

Fonte: gerada pelo Watson a partir de dados da pesquisa

Para o Caso de Uso #2, o modelo apresentou uma performance classificada como pobre
pela ferramenta com os indicadores Area Under ROC Curve e Area Under PR Curve iguais a
0,50056 e 0,04134, respectivamente. O modelo recebeu a string ‘Bairro#12’ no parâmetro
‘NEIGHBORHOOD’ e gerou a probabilidade de 3,76% de casos de doenças contagiosas neste
bairro (vide imagem n Bairro#12). A pesquisa foi realizada também com a string “Bairro#19”,
indicando o a probabilidade de 3,85%. No caso do Bairro#12, houve uma estimativa próxima a
que foi obtida no Caso de Uso #1 (3,75%). No entanto, no caso do Bairro#19 a diferença foi de
uma probabilidade de -2,72% (absoluto). Em função dessa discrepância foi realizada uma terceira
comparação com o Bairro#09, que recebeu a probabilidade de 3,67%, ou seja -0,03% em relação
ao caso de uso anterior. O Bairro#19 foi o que mais recebeu diagnósticos de doenças contagiosas
durante a preparação da base. A possível explicação para tal discrepância, pode ser o fato de ter
ocorrido a geração de um novo modelo, com um novo processo de descarte de dados, em uma
base fictícia.
Para o Caso de Uso #3, o modelo apresentou uma performance classificada pela ferramen-
ta como pobre, desta vez com os indicadores Weighted True Positive, Weighted False Positive e
Weighted Precision iguais a 0,08584, 0,08800 e 0,02867, respectivamente. O modelo recebeu o
parâmetro I11 – Doença Cardíaca Hipertensiva no parâmetro ‘CIDCAT’, que indica a categoria
da doença, indicando as faixa etárias em que há maior probabilidade de ocorrências deste tipo de
48

doença, por ordem descendente de probabilidade. Em um cenário como o que foi apresentado na
Figura 9, os gestores públicos da saúde poderiam iniciar campanhas sobre ações de conscientiza-
ção que mitiguem as chances de ocorrência de doenças hipertensivas na população.

Figura 6: Resultado da previsão para o Bairro#12

Fonte: gerada pelo Watson a partir de dados da pesquisa

Figura 7: Resultado da previsão para o Bairro#19

Fonte: gerada pelo Watson a partir de dados da pesquisa


49

Figura 8: Resultado da previsão para o Bairro#09

Fonte: gerada pelo Watson a partir de dados da pesquisa

Figura 9: Resultado da previsão de doença hipertensiva por faixa etária.

Fonte: gerada pelo Watson a partir de dados da pesquisa


50

5. CONCLUSÃO

O problema de pesquisa foi abordado com a proposição de um modelo de suporte à deci-


são em saúde pública, a partir de uma ferramenta de Computação Cognitiva e de uma base de
dados centralizada para gestão dos Prontuários Eletrônicos do Paciente. Foi realizada uma prova
de conceito do modelo proposto, com a produção de probabilidades de ocorrências de eventos em
saúde, que podem ser insumos para a tomada de decisão em gestão de saúde pública. Neste senti-
do, considera-se que o objetivo geral foi alcançado.
Durante a execução deste trabalho foi observado, através das referências relacionadas ao
tema, diversos aspectos relevantes sobre questão da prestação de serviços de saúde. Destacam-se
a importância da integração das RAIS e a necessidade de adoção dos prontuários eletrônicos co-
mo ferramenta de suporte, que permite o atendimento continuado aos pacientes. Além disso, a
disponibilidade desse recurso nas RAIS, permitiria uma visão clara das ocorrências de uma de-
terminada população, servindo de base para a definição de ações práticas, estudos científicos e
acadêmicos, preservando a confidencialidade das informações.
A computação cognitiva possui a capacidade de analisar grandes volumes de dados, atra-
vés de modelos de aprendizado, que imitam a atuação do cérebro humano, sendo esta a proposta
de uso da ferramenta WATSON da IBM, utilizada na prova de conceito. Trata-se de uma ferra-
menta importante para a identificação de padrões e respectivas probabilidades de ocorrencia, dos
quais seus usuários podem extrair insights, que por sua vez podem se tornar entradas relevantes
para processos decisórios de ações preventivas ou reativas em diversas áreas de atuação. Uma
capacidade que não está disponível em ferramentas tradicionais e que está além da capacidade do
cérebro humano, face ao volume de dados envolvidos. Identificar os nove bairros, de um total de
trinta e nove, que concentram mais de 50% da probabilidade de casos contagiosos, como ocorreu
no caso #1 pode ser um dado importante ao se elaborar uma campanha de prevenção ou ao se
alocar recursos entre as regiões da cidade.
Alguns trabalhos afirmam o grande potencial da computação cognitiva na área de saúde.
Martono et al., (2017), Ahmed, et al., (2017) e Padula, et al., (2015) realizaram estudos para pre-
ver diagnósticos antecipadamente, através da computação cognitiva. A maioria dos trabalhos no
entanto, versa sobre o suporte ao diagnóstico, conforme pode ser verificado durante o levanta-
mento bibliográfico. No entanto, foi percebida a ausência de pesquisas relacionadas ao uso desta
51

tecnologia para o suporte a decisão de gestores de saúde, que partem de análises tradicionais, ou
seja, que analisam o comportamento dos fatos passados, sem dispor de uma perspectiva futura.
Tendo em vista este problema, foi discutido neste trabalho como a computação cognitiva pode
disponibilizar aos gestores públicos informações probabilísticas obtidas a partir dos prontuários
dos pacientes, de forma a tornar possível conhecer as prováveis demandas e planejar suas respos-
tas antecipadamente, de forma a aprimorar os serviços de saúde e a qualidade de vida dos cida-
dãos.
Após a conclusão do levantamento bibliográfico, foi sugerida a arquitetura de uma base
de dados de prontuários eletrônicos centralizada que seria mantida e atualizada pelas unidades de
atendimento (básicas, secundárias e terciárias). Esse trabalho propõe a base de dados como uma
premissa fundamental para a realização destas análises. Desta forma, a identificação de probabi-
lidades de casos de saúde futuros ocorreria de forma ágil e integrada, além de ser essencial para o
atendimento continuado do paciente. Partindo desta premissa, foi realizada uma prova de concei-
to utilizando uma ferramenta cognitiva, com três casos de usos, que analisou os dados de diag-
nósticos e extraiu as probabilidades implícitas nesses dados.
Os resultados obtidos, mesmo diante das limitações dos dados existentes, mostraram que a
computação cognitiva possui um potencial de uso para o planejamento de ações relacionadas à
saúde pública, em especial por sua capacidade de analisar todos os dados de uma população e
gerar hipóteses probabilísticas relativas aos dados. Durante as simulações, foi possível identificar
os bairros com maior probabilidade de casos de doenças contagiosas, as faixas etárias com maior
exposição a doenças monitoradas e a combinação desses dois parâmetros. Essas informações
permitiriam um planejamento de ações mais eficiente, com maior intensidade, investimentos,
repasse de verbas, alocação de recursos, oferta de vacinas e medicamentos nos locais de maior
necessidade, bem com a realização de campanhas segmentadas para público adequado.

5.1 OPINIÃO DE ESPECIALISTA

Esta pesquisa e seus resutados foram apresentados a uma especialista em saúde pública
com 27 anos de experiência na área, ex-funcionária do Ministério da Saúde, órgão onde trabalhou
por 19 anos e que atualmente trabalha no CONASS. O CONASS é um órgão representante dos
gestores públicos de saúde, com presença na Comissão Intergestores Tripartite, que atua na cria-
52

ção e implementação de políticas públicas e presta apoio técnico aos secretários estaduais em
atividades de capacitação e parcerias.
A especialista começou sua análise afirmando que a informação é essencial para a gestão.
A partir dessa afirmação, ela entende que o modelo proposto seria uma ferramenta útil para o
processo de tomada de decisões dos gestores públicos de saúde, uma vez que ao identificar a in-
cidência de doenças, permitiria a criação de planos com ações específicas para uma determinada
população. Além das ações em resposta aos eventos já ocorridos, a identificação da probabilidade
de ocorrência de novos casos por bairros, sexo ou faixa etária, permitiria atuar de forma preventi-
va através de campanhas educativas ou de vacinação para estes segmentos, por exemplo.
Uma característica importante, segundo a especialista, refere-se ao uso de dados popula-
cionais, ao invés de amostras, como ocorrem nos sistemas de business intelligence tradicionais.
Estes podem carregar tendências, baseadas nas crenças dos analistas de dados responsáveis pela
preparação das amostras.
Na opinião da especialista as informações obtidas durante a prova de conceito seriam re-
levantes para um processo decisório na área de saúde pública. Entende também que a premissa da
base de prontuários eletrônicos de pacientes centralizada é fundamental para o correto entendi-
mento da situação de saúde de uma determinada população. Finalmente, que confirma que mes-
mo com uma base de dados fictícia o uso da computação cognitiva tem um grande potencial na
área de gestão de saúde pública, corroborando, desta forma, com as conclusões obtidas nesta pes-
quisa.

5.2 LIMITAÇÕES DA PESQUISA

A grande limitação deste trabalho foi a utilização de uma base de dados fictícia. Apesar
dos esforços de busca, a base obtida na internet mostrou-se genérica e pouco consistente, o que
dificultou a exploração dos resultados das simulações, apesar dos esforços dispendidos na reme-
diação dos problemas observados. Possivelmente, em uma base real, os casos de uso poderiam ter
melhor performance e permitiria avaliar correlações entre doenças, condições sanitárias, indica-
dores de educação e renda.
53

Um segundo ponto relevante, refere-se ao fato do autor não possuir conhecimentos na


área de medicina, o que poderia ter proporcionado o enriquecimento da base, apesar das inserções
realizadas com esta finalidade.

5.3 TRABALHOS FUTUROS

Os prontuários eletrônicos representam uma ferramenta de grande utilidade, como foi


descrito em diversos artigos pesquisados. A confidencialidade é um fator decisivo para a adoção
desta ferramenta. O uso do Blockchain para transações de saúde ainda é um campo a ser explora-
do.
Pesquisas com bases de dados consistentes de saúde, incrementadas com informações so-
bre disponibilidade de saneamento básico, grau de escolaridade, indicadores de renda e ações a
questões de saúde implementadas e seus resultados, podem trazer grandes oportunidades para
gestores públicos no estabelecimento de metas e no planejamento de ações que aprimorem os
resultados dos indicadores de saúde.
54

REFERÊNCIAS

ALBINO, V., BERARDI, U., & DANGELICO, R. M. (2015). Smart Cities: Definitions,
Dimensions, Performance, and Initiatives. Journal of Urban Technology, 22:1, pp. 3-21.

ALEMZADEH, H., & DEVARAKONDA, M. (2017). An NLP-based cognitive system for


disease status identification in electronic health records. Biomedical & Health Informatics (BHI),
2017 IEEE EMBS International Conference on. Orlando, FL: IEEE.

ALEMZADEH, H., DEVARAKONDA, M., & IBM RESEARCH. (2016). A NPL-based


Cognitive System for Disease Status Identification in Eletronic Health Record. TBD. IEEE.

ALI, M., ARNOLD, F., MANSOURI, M., & FINGER, M. (03 de 2011). Cognitive cities and
intelligent urban governance. Network Industries Quartely.

AMAZON. (31 de 05 de 2018). Services. Fonte: Amazon:


https://aws.amazon.com/pt/free/?sc_channel=PS&sc_campaign=acquisition_BR&sc_publisher=g
oogle&sc_medium=br_cloud_computing_b&sc_content=aws_core_bmm&sc_detail=%2Bamazo
n%20%2Bservi%C3%A7os&sc_category=cloud_computing&sc_segment=189431392236&sc_
matchtype=b&s

ANTHOPOULOS, L. G., & TSOUKALAS, I. A. (21 de October de 2008). The Implementation


Model of a Digital City. The Case Study of the Digital City of Trikala, Greece. Journal of E-
Government, pp. 91-109.

ANTHOPOULOS, L., & FITSILIS, P. (2010). From Digital to Ubiquitous Cities: Defining a
Common Architecture for Urban Development. 2010 Sixth International Conference on
Intelligent Environments (pp. 301 - 306). IEEE Conference Publications.

ARROUB, A., ZAHI, B., SABIR, E., & SADIK, M. (2016). A Literature Review on Smart
Cities: Paradigms, Opportunities and Open Problems. Wireless Networks and Mobile
Communications (WINCOM), 2016 International Conference. Fez, Morocco: IEEE Cplore.

BAKICI, T., ALMIRALL, E., & WAREHAM, J. (Springer de 2012). A Smart City Initiative:
The Case of Barcelona. Journal of Knowledge 4(2), pp. 135-148.

BARBOSA, E. C. (12 de 2013). 25 Anos do Sistema Único de Saúde: Conquistas e Desafios.


Revista de Gestão em Sistemas de Saúde, pp. 85-102.

BARRIONUEVO, J. M., BERRONE, P., & RICART, J. E. (2012). Smart Cities, Sustainable
Progress. IESE Insight, 14, pp. 50-57.

BHATY, R., & PRASAD, P. (2016). Open Domain Question Answering System using Cognitive
Computing. 6th International Conference of Cloud System and Bug Data Engineering
(Confluence) (pp. 34 - 39). Noida, India: IEEE.
55

BOULTON, A., BRUNN, S. D., & DEVRIENDT, L. (2011). 18 cyberinfrastructures and


'smart'world cities: physical, human and soft infrastructures. books.google.com.

BRANCO, m. a. (Abr-jun de 1996). Sistemas de Informação em saúde no nível local. Caderno de


Saúde Publica, pp. 267-270.

BRASIL. (30 de 12 de 2010). Portaria No 4.279, de 30 de Dezembro de 2010. Fonte: Ministério


da Saúde do Brasil:
http://conselho.saude.gov.br/ultimas_noticias/2011/img/07_jan_portaria4279_301210.pdf

BRASIL, C. F. (10 de Julho de 2012). Resolução no. 1638. Brasília, DF, Brasil.

BRASIL, M. d. (2012). Número consultas segundo Unidade da Federação. Fonte: Datasus:


http://tabnet.datasus.gov.br/cgi/tabcgi.exe?idb2012/f01.def

BRASIL, M. d. (19 de Janeiro de 2017). O que é Prontuário Eletrônico do Cidadão. Fonte:


Portal da Saúde: http://dab.saude.gov.br/portaldab/noticias.php?conteudo=_&cod=2300

BRASIL, P. d. (28 de Junho de 2011). Decreto No. 7.508. Brasília, DF, Brasil.

CAIAFFA, W. T., FERREIRA, F. R., FERREIRA, A. D., OLIVEIRA, C. D., CAMARGOS, V.


P., & PROIETTI, F. A. (11 de 07 de 2008). Saúde urbana: "a cidade é uma estranha senhora, que
hoje sorri e amanhã te devora". Ciência e Saúde Coletiva, pp. 1785 - 1796.

CASTELLS, M. (2011). he rise of the network society: The information age: Economy, society
and cultures vol 1. John Wiley & Sons.

CAVALCANTE, R. B., & PINHEIRO, M. M. (12 de 2011). Politica Nacional de informação e


Informática em Saúde - Avanços e Limites Atuais. Perspectivas em Gestão e Conhecimento, pp.
91 - 104.

CFM. (2002). RESOLUÇÃO CFM Nº 1.638, DE 10 DE JULHO DE 2002. Conselho Federal de


Medicina.

CHARLES, D., GABRIEL, M., & SEARCY, T. (2015). Adoption of Eletronic Health Record
Systems among U.S. Non-Federal Acute Care Hospitals: 2008. Washington DC: The Office of
Natiotanal Coordinator for Health Information Technology.

CHEN, Y., ARGENTINIS, E., & WEBER, G. (2016). IBM Watson: How Cognitive Computing
Can Be Applied to Big Data Challenges in Life Sciences Research. Clinical Therapeutics,
Volume 38, number 4.

COE, A., PAQUET, G., & JEFFREY, R. (2001). E-governance and smart communities: a social
learning challenge. Social science computer review 19(1), pp. 80-93.

COMISSÃO DE INTERGESTORES TRIPARTITE. (28 de Novembro de 2016). Resolução No.


7, 108. Brasília, DF, Brasil: Ministério da Saúde.
56

CUNHA, F. J., & Silva, H. P. (01 de 04 de 2006). O Prontuário Eletrônico como Unidade de
Transferência e Criação do Conhecimento em Saúde. Revista Eletrônica de Sistemas de
Informação.

DANIEL, V. m., PEREIRA, G. V., & MACADAR, M. A. (01 de 06 de 2014). Perspectiva


Institucional dos Sistemas de Informações em Saúde em Dois Estados Brasileiros. Fonte:
ANPAD: http://www.scielo.br/pdf/rac/v18n5/1982-7849-rac-18-5-0650.pdf

DATASUS. (20 de 06 de 2017). O DATASUS - Início. Fonte: DATASUS:


http://datasus.saude.gov.br/datasus

DUTTON, W. H., KRAEMER, K. L., & BLUMIER, J. G. (1987). Wired Cities: Shaping the
future of communications. Indianapolis, IN: Macmillan Publishing Co.

EGER, J. M. (2009). Smart growth, smart cities, and the crisis at the pump a worldwide
phenomenon. The Journal of E-Government Policy and Regulation 32(1), pp. 47-53.

EMANI, C. K., CULLOT, N., & NICOLLE, C. (2015). Understandable Big Data - A Review.
Computer Science Review 17, pp. 70 - 81.

FACELI, K., LORENA, A. C., GAMA, J., & CARVALHO, A. C. (2015). Inteligência Artificial
- Uma Abordagem de Aprendizado de Máquina. Rio de Janeiro: LTC - Livros Técnicos e
Científicos Editora Ltda.

FISHER, P. (1996). Telehealth: its role in the longitudinal patient record and ontinuity of patient
care. IV Fórum Nacional de Ciência e Tecnologia em Saúde. Campos do Jordão - SP.

FLORIDA, R. (2002). The Rise of the Creative Class and How It's transforming Work, Leisure,
Community and Everyday Life. New York: Basic Books.

GANDOMI, A., & HAIDER, M. (2015). Beyond the Hype: Big data concepts, methods and
analytics. International Journal of Information Management (35), pp. 137 - 144.

GARCIA, J. O., & NERI, E. L. (2015). Cognitive Computing: A Brief Survey and Open
Research Challenges. 3rd International Conference on Applied Computing and Information
Technology/2nd International Conference on Computational Science and Intelligence (pp. 328-
333). IEEE.

GIRARDI, R. (2014). Engenharia de Software baseada em Agentes. Congresso Brasileiro de


Computação, (pp. 913-937). Itajaí, SC.

GOLDSMITH, S., & CRAWFORD, S. (2014). The Responsive City. San Francisco, CA: Jossey-
Bass.

GONÇALVES, J. P., BATISTA, L. R., CARVALHO, L. M., OLIVEIRA, M. P., MOREIRA, K.


S., & LEITE, M. T. (janeiro-Março de 2013). Prontuário Eletrônico: uma ferramenta que pode
contribuir para a integração das Redes de Atenção à Saude. Saúde em Debate, pp. 43-50.
57

GRAY, D. E. (2012). Pesquisa no Mundo Real. Porto Alegre: Artmed Editora S.A.

HARALANOVA, M., & MENABDE, N. (2005). positive and negative public health effects of
urbanisation. European Journal of Public Health vol 15, pp. 552-553.

HARISSON, C., & DONNELLY, I. A. (2011). A theory of smart cities. Proceedings of the 55th
Annual Meeting of the ISSS-2011. Hull, UK.

HARISSON, C., ECKMAN, B., HAMILTON, R., HARTSWICK, P., KALAGGNARAM, J.,
PARASZCZAK, J., & Williams, P. (2010). Foundations for Smarter Cities. IBM Journal of
Research and Decelopment - Volume 54 Issue 4, pp. 195 - 199.

HARRISON , C., & Donnelly, I. A. (2011). A Theory of Smart Cities. 55th Annual Meeting of
the ISSS. Hull - UK.

HENDY, M. E., MINIAOUI, S., & FAKHRY, H. (2015). Towards Strategic Information &
Communication Technology (ICT) Framework for Smart City. Computer Science and
Engineering (APWC on CSE), 2015 2nd Asia-Pacific World Congress. Nadi, Fuji: IEEE Xplore.

HOUAISS, A., VILLAR, M. d., & FRANCO, F. M. (2004). Dicionário Houaiss da Língua
Portuguesa. Rio de Janeiro: Instituto Antônio Houaiss de Lexicografia.

HURWITZ, J., KAUFMAN, M., & BOWLES, A. (2015). Cognitive Computing and Big Data
Analytics. John Wiley & Sons.

IBGE. (04 de Fevereiro de 2010). Sinopse do Censo Demográfico de 2010. Fonte: IBGE:
http://www.censo2010.ibge.gov.br/sinopse/index.php?dados=8

IBGE. (2015). Pesquisa de Informações Básicas Municipais. Riode Janeiro - RJ: IBGE.

IBM. (31 de 05 de 2018). watson. Fonte: www.ibm.com: https://www.ibm.com/watson/

INSTITUTE OF MEDICINE. (1997). The computer-based patient record: an essencial


technology for heath care. Washington, DC, United States.

IQBAL, S., Altaf, W., Aslam, M., Mahmood, W., & Khan, M. U. (25 de 01 de 2016).
Application of intelligent agents in healt-care: review. Springer Business Media Dordrecht.

ISHIDA, T. (2002). Digital City of Kyoto. Communications of the ACM v45 n7, pp. 76-81.

ISO. (2005). Health informatics — Electronic health record — Definition, scope and context.
International Standard Organization.

KARTOUN, U. (2015). 100.000 Patient database. Fonte: www.EMRbots.org:


http://www.emrbots.org

KATAL, A., WAZID, M., & GOUDAR, R. H. (2013). Big data: Issues, challenges, tools and
Good practices. Sixth International Conference on Contemporary Computing (IC3) (pp. 404 -
409). Noida, India: IEEE.
58

KELLY, J. E., & HAMM, S. (2013). Smart Machines. New York: Columbia University Press.

LANDRY, C. (2012). The creative city: A toolkit for urban innovators. London, EN: Earthscan.

LAVRAS, C. (2011). Atenção Primária à Saúde e a Organização de Redes Regionais de


Atendimento à Saúde no Brasil. Saúde Social v 20 n.4, pp. 867 - 874.

LIDDY, E. D. (2001). Natural Language Processing. Syracuse - USA: ACM Digital Library.

LOMBARDI, P., GIORDANO, S., FAROUH, H., & YOUSEF, W. (13 de October de 2010).
Modelling the smart city performance. Journal Innovation: The European Journal of Social
Science Research, pp. 137-149.

MAHIZHNAN, A. (1999). Smart Cities - The Singapore Case. pp. 13-18.

MATOS, R. (2012). Migração e Urbanização no Brasil. Revista Geografias v 8(1), pp. 7-23.

MAYER, V., & CUKIER, S. K. (2013). Big Data - Como Extrair Volume, Velocidade,
Veracidade e Valor da Avalanche de Informação Cotidiana. Rio de Janeiro: Editora Campus.

MENDES, E. V. (05 de 2010). As Redes de Atenção a Saúde. Ciência e Saúde, pp. 2297 - 2305.

MICROSOFT. (31 de 05 de 2018). Azure. Fonte: www.microsoft.com:


https://azure.microsoft.com/pt-br/services/cognitive-services/

Ministério da Saúde do Brasil. (30 de Dezembro de 2010). Portaria 4.279. Brasília, DF , Brasil.

MOLLURA, D. J., Carrino, J. A., Matuszak, D. L., Mnatsakanyan, Z. R., Eng, J., Cutchis, P., . . .
Lombardo, J. S. (2008). Bridging Radiology and Public Health: The Emerging Field of
Radiologic Public Health Informatics . Journal of the American College of Radiology Vol.5(3),
pp. 174 - 181.

MOOR, A. K. (2015). Potential of Cognitive Computing and Cognitive Systems. IT Professional


Magazine vol 17 fasc 4 , pp. 12 - 18.

NAM, T., & PARDO, T. A. (2011). Conceptualizing Smart City with Dimensions of
Technology, People, and Instituitions. The Proceedings of the 12th Annual International
Conference on Digital Government Research Conference (pp. 282 - 291). New York: ACM.

NISHIWAKI, K., KANAMORI, K., & OHWADA, H. (2017). Finding a disease-related gene
from microarray data using random forest. Cognitive Informatics & Cognitive Computing
(ICCI*CC), 2016 IEEE 15th International Conference on. Palo Alto - CA: IEEE.

NOOR, A. K. (May de 2015). Potential of Cognitive Computing and Cognitive Systems. Open
Engineering `, pp. 75-88.

ONU. (2014). World Urbanization Prospects: The 2014 Revision, Highlights


(ST/ESA/SER.A/352). New York: United Nations.
59

PADULA, W., MELTZER, D. O., MAKIC, M. B., EPSTEIN, Z., GEMMELL, J., & MSHRA,
M. (2015). USING MACHING LEARNING TO POPULATE A MARKOV MODEL BY
MINING BIG DATA DIRECTLY FROM A HOSPITAL EHR. 37th Annual Meeting of the
Society for Medical Decision Making. St. Louis, MO: CAPES.

PAIM, J., TRAVASSOS, C., ALMEIDA, C., BAHIA, L., & MACINKO, J. (9 de Maio de 2011).
O sistema de saúde brasileiro: história, avanços e desafios. Fonte: The Lancet:
http://bvsms.saude.gov.br/bvs/artigos/artigo_saude_brasil_1.pdf

PARRA, D., & SANTOS, J. A. (2000). Metodologia Científica. São Paulo: Editora Futura.

PATRICIO, C. M., MAIA, M. M., MACHIAVELLI, J. L., & NOVAES, M. d. (08 de 2011). O
prontuário eletrônico do paciente no sistema de saúde brasileiro: Uma realidade para os médicos.
Scientia Médica, pp. 121-131.

PELLICER, S., SANTA, G., BLEDA, A. L., MAESTRE, R., JARA, A. J., & SKARMENTA, A.
G. (2013). A Global Perspective: A Survey. Seventh International Conference on Innovative
Mobile and Internet Services in Ubiquitous Computing. IEEE.

PINTO, V. B. (2006). Prontuário Eletrônico do Paciente: Documento Técnico de Informação e


Comunicação do Domínio da Saúde. Fonte: Repositório Institucional UFC:
http://www.repositorio.ufc.br/handle/riufc/10074

PORTMANN, E., & FINGER, M. (2016). Towards Cognitives Cities. Springer International
Publicshing.

PRAKASHAR, n., & Sarkar, A. (2015). Development of an intelligent system which assists in
decision making based upon previous decisions. Computing and Communication (IEMCON),
2015 International Conference and Workshop on. Vancouver - CA: IEEE.

PUPO, G. D., DIEHL, E. E., SOARES, L., FARIAS, M. R., & SANTOS, R. I. (2014). Rede de
Atenção à Saúde. Florianópolis, Santa Catarina, Brasil.

RAGHUPATHI, W., & RAGHUPATHI, V. (2014). Big data analytics in healthcare: promise and
potencial. Health Information Science and System.

RAYMOND, I. P., DERMIKAN , L. H., & AZAD, A. K. (30 de Nov de 2016). Smart health: Big
data enabled health paradigm within smart cities. Expert System and Application, pp. 370 - 383.

ROZENFELD, S. (2000). Fundamentos das Vigilância Sanitária. Rio de Janeiro: FIOCRUZ.

SAGIROGLU, S., & SINANC, D. (2013). Big data: A review. International Conference on
Collaboration Technologies and Systems (CTSP) (pp. 42-47). San Diego: IEEE.

SAMPIERI, R. H., COLLADO, C. F., & LUCIO, P. B. (2006). Metodologia da Pesquisa - 3a


edição. São Paulo: McGraw Hill.
60

SANTOS, S. R., FERREIRA, J. d., CRUZ, E. M., LEITE, E. M., & PESSOA, J. d. (Out-Dez de
2014). Sistema de Informações em Saúde: gestão e assistência no Sistema Único de Saúde.
Cogitare Enferm. , pp. 833-840.

SEPÚLVEDA, M. J. (Novembro de 2014). Public Health Informatics and the Public Health
Workforce in an Era of Change. American Journal of Preventive medicine, pp. 386-387.

SEVERINO, A. J. (2007). Metodologia do Trabalho Científico. São Paulo: Cortez Editora.

SILVA, C. R., CARVALHO, B. G., JÚNIOR, L. C., & NUNES, E. d. (2017). Dificuldade de
acesso a serviços de média complexidade em municípios de pequeno porte:um estudo de caso.
Ciência e Saúde Coletiva, pp. 1109 - 1120.

SOMVANSHI, M., TAMBADE, S., CHAVAN, P., & SHINDE, S. V. (2016). A Review of
Machine Learning Techniques using Decision Tree and Support Vector Machine. 3rd
International Conference on Computing for Sustainable Global Development (INDIACom). New
Delhi, India: IEEE.

SOUZA, R. R. (2001). A regionalização no contexto atual das políticas de saúde. Ciência &
Saúde Coletiva, 451-455.

STUMPF, M. K., FISHER, P. D., FREITAS, H. M., & BECKER, J. L. (1997). Um Modelo de
Integração de informações para o Apoio à Decisão na Gestão da Assistência à Saúde. Série
Documentos para Estudos.

TOWNSEND, A. M. (2013). Smart Cities - Big data, civic hackers and the quest of a new utopia.
New York: W.W. Norton & Company.

UNFPA. (2007). State of world population - Unleashing the Potential of Urban Growth. New
York: United Nations Population Fund.

VASCONCELOS, L. C., FELIX, G. D., & FERREIRA, F. H. (2007). Aspectos gerais sobre
região e o processo de urbanização Brasileira. Espacio y Desarrollo.

VILLELA, E. F. (2014). Comunicação e Saúde. São Paulo, SP , Brasil.

WHO, W. O. (2004). Developing health management information systems - a practical guide for
developing countries. Regional Ofiice for the wetesrn pacific: WHO.

YANG , S., WEI, R., & GUO, J. (01 de Mar de 2017). Semantic Inference on Clinical
Documents: Combining Machine Learning Algorithms With an Inference Engine for Effective
Clinical Diagnosis and Treatment. IEEE Access Volume 5, pp. 3529 - 3546.
61

APÊNDICE I: PROVISIONAMENTO DO AMBIENTE

Passo 1: Acessar o ambiente IBM Cloud.

Passo 2: Acessar o Catálogo de Categorias


62

Passo 3: Selecionar a Plataforma Watson

Passo 4: Selecionar o serviço de Aprendizagem de Máquina


63

Passo 5 – Informei o nome do Serviço e pressionei criar

Tela de confirmação da criação do serviço


64

Passo 6: Retornar ao catálogo e Selecionar a categoria Armazenamento

Passo 7: Selecionar Armazenamento de Objeto


65

Passo 8 – Informei o nome do serviço e pressionei criar.

Tela de confirmação da criação da área de armazenamento


66

Passo 9 – Retornar ao Catálogo e selecionei Data & Analytics

Passo 10 – Selecionar Apache Spark


67

Passo 11 – Informei o nome e mandei criar o serviço

Tela de Confirmação do serviços Apache Spark


68

Passo 12 – Verificar se todos os serviços estão provisionados no painel do IBM Cloud


69

APÊNDICE II: CRIAÇÃO DO PROJETO

PASSO 1 – No Painel do IBM Cloud, selecionei o serviço de aprendizagem de máquina

PASSO 2 – Acessei o Watson Studio


70

Tela do Watson Studio

PASSO 3 – Cliquei em New Project


71

PASSO 4 – Informei o nome e a descrição do projeto e cliquei em criar

Tela do projeto criado


72

PASSO 5 – Cliquei em Settings para associei os serviços provisionados no IBM Cloud,:

PASSO 6 – Associar o serviço SPARK ao projeto, na parte inferior da mesma tela


73

PASSO 7 – Cliquei em Add Service e selecionei a opção Spark

PASSO 8 – Associei o serviço existente AS-Prontuarios-Medicos e cliquei em Select


74

TELA DE SERVIÇOS ASSOCIADOS AO PROJETO

PASSO 9 - Associar o serviço de Aprendizado de Máquina ao projeto, na parte inferior da mesma


tela
75

PASSO 10 – Cliquei em Add Service e selecionei a opção Machine Learning

PASSO 11 – Associei o serviço existente AS-Prontuarios-Medicos e cliquei em Select


76

TELA DE SERVIÇOS ASSOCIADOS AO PROJETO

PASSO 12 – Criei um token, essencial para realizar o acesso ao conjunto de dados. Cliquei em
New Token.
77

PASSO 13 – Informei o nome e o perfil de acesso do Token e cliquei em Create.

TELA DE SERVIÇOS E TOKEN ASSOCIADOS AO PROJETO


78

APÊNDICE III: AMOSTRA DE DADOS

O prontuário do paciente em papel ou eletrônico possui entre suas principais característi-


cas o sigilo (CFM, 2002). Por causa disso, foi bastante difícil encontrar uma base de dados real,
ainda que contivesse a identificação descaracterizada do paciente, para utilizar como amostra do
experimento. No entanto, será utilizada uma base de dados artificial de pacientes, explicitamente
autorizada para utilização e modificação em trabalhos acadêmicos. A figura 3, apresenta o mode-
lo de dados desta base, que contém 100.000 pacientes, 361.760 admissões, 361.760 diagnósticos
e mais de 107 milhões de exames de laboratórios, sendo que estes últimos não serão considerados
na pesquisa (Kartoun, 2015).

Figura 3: Modelo de Dados


79

Dicionário de dados

Nas Tabelas de 4 a 7 são descritos os dados que serão analisados nesta pesquisa.

Tabela 4: Tabela Patients

Campo da Tabela Tipo Tamanho Definição


PatientID Alfanumérico 36 Identificador único de um paciente
PatientGender Alfanumérico 6 Identificador do gênero do paciente
PatientDateOfBirth Data e Hora - Data de nascimento do paciente
PatientRace Alfanumérico 16 Raça do paciente
PatientMaritalStatus Alfanumérico 10 Estado civil do paciente
PatientLanguage Alfanumérico 10 Idioma do paciente
PatientPopulationPercentageBelowPoverty Numérico 4,2 Percentual da população abaixo da
linha da pobreza

Tabela 5: Tabela Admissions

Campo da Tabela Tipo Tamanho Definição


PatientID Alfanumérico 36 Identificador único de um paciente
AdmissionID Alfanumérico 2 Identificação de um atendimento ao
paciente
AdmissionStartDate Data e Hora - Data e hora do início do
atendimento
AdmissionEndDate Data e Hora - Data e hora do término do
atendimento

Tabela 6: Tabela Admissions_Diagnoses

Campo da Tabela Tipo Tamanho Definição


PatientID Alfanumérico 36 Identificador único de um paciente
AdmissionID Alfanumérico 2 Identificação de um atendimento ao
paciente
PrimaryDiagnosisCode Alfanumérico 10 Código Internacional de Doenças
(versão 10) para o diagnóstico
principal
PrimaryDiagnosisDescription Alfanumérico 500 Descrição baseado no Código
Internacional de Doenças para o
Diagnóstico principal
80

Tabela 7: Tabela Labs_Core_Populated

Campo da Tabela Tipo Tamanho Definição


PatientID Alfanumérico 36 Identificador único de um paciente
AdmissionID Alfanumérico 2 Identificação de um atendimento ao
paciente
LabName AlfaNumérico 45 Descrição do exame laboratorial
LabValue Numérico 7,2 Valor apurado no exame laboratorial
LabUnits AlfaNumérico 5 Unidade de medida do exame
LabDateTime Data e Hora - Data de realização do exame
81

APÊNDICE IV: AMOSTRA DE DADOS AJUSTADO


82

APÊNDICE V: AJUSTE DOS CIDs DA BASE DE DADOS

package br.com.mestrado;

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;
import java.text.DateFormat;
import java.text.SimpleDateFormat;
import java.util.Date;

public class PreProcessamento {

public static void main(String[] args) {


try {
System.out.println("Procedimento iniciado em "+getDateTime());
Connection conn = getConexao();
System.out.println("Conectado ao Banco de Dados.");
System.out.println("Iniciando montagem do conjunto de CIDs inválidos...");
ResultSet rs = getCidsInvalidos(conn);
System.out.println("Conjunto de CIDs inválidos preparado.");
System.out.println("Iniciando troca de CIDs...");
executaTrocaCids(rs);
System.out.println("CIDs trocados.");
System.out.println("Fechando conexao com o banco de dados...");
fechaConexao(conn);
System.out.println("Procedimento concluído em "+getDateTime());

} catch (ClassNotFoundException e) {
System.out.println("Exceção no módulo principal");
e.printStackTrace();
}

public static Connection getConexao() throws ClassNotFoundException {


Connection conn;
try {
Class.forName("com.mysql.jdbc.Driver");
conn = DriverManager.getConnection("jdbc:mysql://localhost:3306/ehr100k?useSSL=false", "ro-
ot", "1234");
if (conn != null) {
83

return conn;
}

} catch(SQLException e) {
System.out.println("Ocorreu um erro de conexão");
} catch (ClassNotFoundException e) {
System.out.println("Classe do driver jdbc não encontrada");
e.printStackTrace();
}
return null;
}

public static ResultSet getCidsInvalidos(Connection conn) {

String sql = "select distinct(ad.PrimaryDiagnoseCode) cid ";


sql = sql + "from admissions_diagnoses ad ";
sql = sql + "where ad.PrimaryDiagnoseCode not in ( ";
sql = sql + " select vw.PrimaryDiagnoseCode ";
sql = sql + " from vw_cids vw) ";
sql = sql + "order by cid";

try {
PreparedStatement ps = conn.prepareStatement(sql);
ResultSet rs = ps.executeQuery();
if (rs == null) {
System.out.println("Conjunto nulo");
}
return rs;
} catch (Exception e) {
System.out.println("Falha na preparação da declaração");
}
return null;
}

public static void executaTrocaCids(ResultSet rs) {

String novoCid;

int qtdeLinhasOper = 0;
int qtdeLinhasTotal = 0;

try {
while (rs.next()) {

qtdeLinhasOper = 0;
novoCid="";
String cidInvalido = rs.getString("cid");
novoCid = trocaCid(cidInvalido);
84

qtdeLinhasOper = (atualizaCidDB(cidInvalido, novoCid));


if (qtdeLinhasOper > 0) {
qtdeLinhasTotal = qtdeLinhasTotal + qtdeLinhasOper;
System.out.println("Cid Inválido:"+cidInvalido+" substituído por Cid Válido:"+novoCid+" Total
de registros:"+qtdeLinhasOper);
} else {
System.out.println("Cid Inválido:"+cidInvalido+" não foi substituído");
}
}
System.out.println("Total de linhas processadas = "+qtdeLinhasTotal);
} catch (Exception e) {
System.out.println("Exception em executaTrocaCids");
e.printStackTrace();
}

public static String trocaCid(String cidInvalido) {

String novoCid=""; // Novo Cid


String initialCat=""; // Inicial da Categoria
String numCat=""; // Numero da Categoria (formato String)
String numSubCat=""; // Numero da Sub-Categoria (formato String)

int numCatN=0; // Numero da Categoria (formato numérico)


int numSubCatN=0; // Numero da subCategoria (formato numérico)

boolean valido = false;

// categoria
initialCat = cidInvalido.substring(0, 1);
numCat = cidInvalido.substring(1, 3);

try {
numCatN = Integer.parseInt(numCat);
} catch(Exception e) {
numCatN = 10;
}

// sub-categoria
try {
numSubCat = cidInvalido.substring(4);
numSubCatN = Integer.parseInt(numSubCat);
} catch(Exception e) {
numSubCatN = 10;
}
85

while (!valido) {

if (numSubCatN >= 0) {
numSubCatN--;
}

if (numSubCatN == -1) {
numCatN--;
if (numCatN == 0) {
char initial = initialCat.charAt(0);
initial--;
initialCat = String.valueOf(initial);
numCatN=99;
}
numSubCatN = 99;
}

novoCid = montaNovoCid(initialCat, numCatN, numSubCatN);

if (existeCid(novoCid)) {
valido = true;
}

return novoCid;
}

public static String montaNovoCid(String initialCat, int numCatN, int numSubCatN) {


String novoCid ="";

String cat="";
String numCat="";
String numSubCat="";

cat = initialCat;
numCat = zerosAFrente(Integer.toString(numCatN),2);
numSubCat = Integer.toString(numSubCatN);
novoCid = cat + numCat + "." + numSubCat;

return novoCid;
}

public static String zerosAFrente(String numero, int tamanho) {

int x = numero.length(); // identifica o tamanho do número já existente


86

tamanho = tamanho - x; // corrige a quantidade de números faltantes


String zeros=""; // inicializa a variavel zeros que receberá os zeros a frente para depois
concatenar com o número

for(int i=0; i< tamanho; i++) {


zeros = zeros + "0"; // gera a quantidade de "zeros a frente" para se atingir o tamanho do
código desejado
}

numero = zeros + numero; // concatena os zeros com o número passado

return numero; // retorna o número


}

public static boolean existeCid(String pCid) {

boolean existe = false;


String sql = "select count(*) quantidade from vw_cids where PrimaryDiagnoseCode = '"+pCid+"'";

Statement stmt = null;


ResultSet rs = null;

int quantidade = -1;

try {
Connection conn2 = getConexao();
stmt = conn2.createStatement();
rs = stmt.executeQuery(sql);
rs.next();
quantidade = rs.getInt(1);
if (quantidade > 0) {
existe = true;
}
rs.close();
stmt.close();
conn2.close();
} catch (SQLException | ClassNotFoundException e) {
System.out.println("Falha ao Abrir conexão");
System.out.println(e.getCause());
}

return existe;
}

public static int atualizaCidDB(String cidInvalido, String cidValido) {


87

int qtdeLinhas = 0;

Statement stmt = null;

String sql = "update admissions_diagnoses set PrimaryDiagnoseCode = '"+cidValido+"' ";


sql = sql + "where PrimaryDiagnoseCode = '"+cidInvalido+"'";

try {
Connection conn2 = getConexao();
stmt = conn2.createStatement();
stmt.executeUpdate(sql);
qtdeLinhas = stmt.getUpdateCount();

} catch (SQLException | ClassNotFoundException e) {


e.printStackTrace();
}

return qtdeLinhas;

public static void fechaConexao(Connection conn) {


try {
conn.close();
System.out.println("Conexão Encerrada");
} catch (Exception e) {
System.out.println("Falha ao fechar conexão");
}
}

private static String getDateTime() {


DateFormat dateFormat = new SimpleDateFormat("dd/MM/yyyy HH:mm:ss");
Date date = new Date();
return dateFormat.format(date);
}
}
88

APÊNDICE VI: AJUSTE DEMOGRÁFICO – DISTRIBUIÇÃO PARA BAIRROS

package br.com.mestrado;

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;
import java.text.DateFormat;
import java.text.SimpleDateFormat;
import java.util.Date;

public class AjusteDemografico {

public static void main(String[] args) {


try {
System.out.println("Procedimento iniciado em "+getDateTime());
Connection conn = getConexao();
System.out.println("Conectado ao Banco de Dados.");

System.out.println("Carregando parâmetros demográficos...");


ResultSet rs1 = getParametrosDemograficos(conn);

System.out.println("iniciando o ajuste demográfico");


executaAjusteDemográfico(rs1);
System.out.println("Ajustes concluídos!");

System.out.println("Fechando conexao com o banco de dados...");


fechaConexao(conn);
System.out.println("Procedimento concluído em "+getDateTime());

} catch (ClassNotFoundException e) {
System.out.println("Exceção no módulo principal");
e.printStackTrace();
}

public static Connection getConexao() throws ClassNotFoundException {


Connection conn;
try {
Class.forName("com.mysql.jdbc.Driver");
89

conn = DriverManager.getConnection("jdbc:mysql://localhost:3306/ehr100k?useSSL=false", "ro-


ot", "1234");
if (conn != null) {
return conn;
}

} catch(SQLException e) {
System.out.println("Ocorreu um erro de conexão");
} catch (ClassNotFoundException e) {
System.out.println("Classe do driver jdbc não encontrada");
e.printStackTrace();
}
return null;
}

public static ResultSet getParametrosDemograficos(Connection conn) {

String sql = "select PatientGender, neighborhoodId, ageRangeId, quantidade ";


sql = sql + "from demograph_neighborhoods ";
sql = sql + "order by PatientGender, neighborhoodId, ageRangeId ";

try {
PreparedStatement ps = conn.prepareStatement(sql);
ResultSet rs = ps.executeQuery();
if (rs == null) {
System.out.println("Conjunto nulo");
}

return rs;
} catch (Exception e) {
System.out.println("Falha na preparação da declaração");
System.out.println(e.getMessage());
}
return null;
}

public static ResultSet getPatients(Connection conn, String p_gender, int ageRangeId) {

String sql = "select patientGender, ageRangeId, patientId ";


sql = sql + " from vw_patients ";
sql = sql + " where patientGender = '"+p_gender+"' ";
sql = sql + " and ageRangeId = "+ageRangeId;
sql = sql + " and neigh_id is null ";
sql = sql + " order by patientGender, ageRangeId";
90

try {
PreparedStatement ps = conn.prepareStatement(sql);
ResultSet rs = ps.executeQuery();

if (rs == null) {
System.out.println("Conjunto nulo");
}
return rs;
} catch (Exception e) {
System.out.println("Falha na preparação da declaração");
}
return null;
}

public static void executaAjusteDemográfico(ResultSet rsParametros) {

ResultSet rsPatients;
// Variáveis de parametros
String p_genero = "";
int p_rangeId = 0;
int p_neighbor = 0;
int p_quant_esperada = 0;

//variáveis de pacientes
String pac_id="";

// variáveis auxiliares
int v_qtdeProcessada = 0;

try {
while (rsParametros.next()) {

p_genero = rsParametros.getString("PatientGender");
p_rangeId = rsParametros.getInt("ageRangeId");
p_neighbor = rsParametros.getInt("neighborhoodId");
p_quant_esperada = rsParametros.getInt("quantidade");

System.out.println("p_genero="+p_genero);
System.out.println("neighborhood="+p_neighbor);
System.out.println("p_rangeId="+p_rangeId);
System.out.println("quantidade esperada="+p_quant_esperada);

Connection conn2 = getConexao();


rsPatients = getPatients(conn2, p_genero, p_rangeId);
91

v_qtdeProcessada = 0;
while (v_qtdeProcessada < p_quant_esperada) {

rsPatients.next();

pac_id = rsPatients.getString("patientID");

setNeighborhood(pac_id, p_neighbor);

v_qtdeProcessada++;

conn2.close();
System.out.println("processados="+v_qtdeProcessada);

}
} catch (Exception e) {
System.out.println("Exception em executa Ajuste");
System.out.println(e.getMessage());
e.printStackTrace();
}

public static void setNeighborhood(String pac_id, int p_neighbor) {

Statement stmt = null;

String sql = " update patients ";


sql = sql + " set neigh_id = "+p_neighbor;
sql = sql + " where PatientId = '"+pac_id+"'";

try {
Connection conn3 = getConexao();
stmt = conn3.createStatement();
stmt.executeUpdate(sql);
conn3.close();
} catch (SQLException | ClassNotFoundException e) {
System.out.println(sql);
e.printStackTrace();
}

}
92

public static void fechaConexao(Connection conn) {


try {
conn.close();
System.out.println("Conexão Encerrada");
} catch (Exception e) {
System.out.println("Falha ao fechar conexão");
}
}

private static String getDateTime() {


DateFormat dateFormat = new SimpleDateFormat("dd/MM/yyyy HH:mm:ss");
Date date = new Date();
return dateFormat.format(date);
}
}
93

APÊNDICE VII: PROCESSO DE CARGA DE ARQUIVO DE DADOS PARA O PROJE-


TO NO WATSON

1. Tela inicial do projeto

2. Ao clicar em browse foi aberto uma tela para seleção dos arquivos:
94

3. Após selecionar o arquivo, o processo de upload foi iniciado

4. Após a conclusão do processo, o arquivo de dados foi disponibilizado com Data asset
95

APÊNDICE VIII: CRIAÇÃO DE MODELOS COGNITIVOS

Caso de Uso #1

1. A partir da tela principal do projeto (após carga do arquivo dados1.csv)

2. Tela para criação do novo modelo

Potrebbero piacerti anche