Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CIn.ufpe.br
INTRODUÇÃO E MOTIVAÇÃO
4.400.000.000.000.000.000.000
Zetta Exa Peta Tera Giga Mega Kilo Byte
CIn.ufpe.br
INTRODUÇÃO E MOTIVAÇÃO
CIn.ufpe.br
INTRODUÇÃO E MOTIVAÇÃO
• Identificação da variante,
CIn.ufpe.br
INTRODUÇÃO E MOTIVAÇÃO
Variante + Doença
CIn.ufpe.br
PROBLEMA
CIn.ufpe.br
PROBLEMA
CIn.ufpe.br
PERGUNTA DE PESQUISA
CIn.ufpe.br
METODOLOGIA
CIn.ufpe.br
METODOLOGIA - QIP
Quality Improvement Paradigm
1.Caracterizar
o ambiente
6. Empacotar 2. Definir
a experiência objetivos
5. Analisar 3. Escolher
resultados processo
4. Executar
CIn.ufpe.br
TRABALHOS RELACIONADOS
CIn.ufpe.br
TRABALHOS RELACIONADOS
Representação
Modelos
Evolução
Implementação
Visualização
Automatização
CIn.ufpe.br
TRABALHOS RELACIONADOS
Representação
Esquema
Global
Meta-modelo
CIn.ufpe.br
TRABALHOS RELACIONADOS
Modelos
Relacional
NoSQL
CIn.ufpe.br
METODOLOGIA - QIP
Quality Improvement Paradigm
1.Caracterizar
o ambiente
✔
6. Empacotar 2. Definir
a experiência objetivos
5. Analisar 3. Escolher
resultados processo
4. Executar
CIn.ufpe.br
OBJETIVO
CIn.ufpe.br
OBJETIVO
Analisar o conjunto de dados envolvido no processo de
anotação de variantes e definir uma representação
formal para estes dados, permitindo o desenvolvimento
automatizado de ferramentas e utilitários de bancos de
dados.
CIn.ufpe.br
OBJETIVOS ESPECÍFICOS
CIn.ufpe.br
METODOLOGIA - QIP
Quality Improvement Paradigm
1.Caracterizar
o ambiente
✔
6. Empacotar
a experiência
2. Definir
objetivos
✔
5. Analisar 3. Escolher
resultados processo
4. Executar
CIn.ufpe.br
UM PROCESSO PARA ENGENHARIA DE
DOMÍNIO BASEADA EM MODELOS
COM FOCO NA QUALIDADE
CIn.ufpe.br
PROCESSO
CIn.ufpe.br
PROCESSO: Critérios de Qualidade
Critérios Propriedades
Qualidade Empírica Compreensibilidade e Simplicidade
Qualidade Sintática Corretude e Integridade
Qualidade Semântica Completude, Validade, Integridade, Integração, Reuso
e Minimalisação
Qualidade Pragmática Compreensibilidade
Qualidade Organizacional Flexibilidade, Integração e Implementabilidade
Identificar Métricas
CIn.ufpe.br
PROCESSO : Avaliação :
Indicador de Qualidade
• Análise Fatorial
– Redução de dados: correlação variáveis observadas à Fatores
CIn.ufpe.br
METODOLOGIA – QIP
✔
1.Caracterizar
o ambiente
6. Empacotar 2. Definir
a experiência objetivos ✔
5. Analisar 3. Escolher
resultados processo ✔
4. Executar
CIn.ufpe.br
PROCESSO
CIn.ufpe.br
ANÁLISE : ESQUEMAS
• Documentos semi-estruturados
– Valor
• Atômico, outro atributo, listas
CIn.ufpe.br
ANÁLISE : ESQUEMAS
• ESTRUTURA DE ÁRVORE
– Um nó raiz possui nós filhos para cada entidade que possuem nós filhos
para cada atributo.
– Nós para valores atômicos ou valores de referências não possuem nós
filhos (se tornam nós folhas).
– Nós para outros atributos ou entidades embutidas tem um nó filho para
cada atributo e/ou entidade.
– Nós para arrays tem nós filhos para cada elemento do array.
– As arestas partindo de um nó entidade possuem os nomes dos atributos
e os nós subsequentes possuem os seus valores.
– As arestas partindo de um nó Versão possuem os atributos
identificadores das entidades.
CIn.ufpe.br
ANÁLISE : ESQUEMAS
CIn.ufpe.br
ANÁLISE : ESQUEMAS
CIn.ufpe.br
ANÁLISE : ESQUEMAS
CIn.ufpe.br
ANÁLISE : ESQUEMAS VERSIONADOS
• Esquema da Fonte
– com a união dos esquemas de todas as suas versões; e
• Esquema da Entidade
– com a junção de todos os atributos presentes nas entidades de mesmo
tipo
CIn.ufpe.br
PROCESSO
Analysis
✔
CIn.ufpe.br
PROJETO : GenDB
CIn.ufpe.br
PROJETO : GenDB
• Técnicas de MDE
– Engenharia de Domínio, Meta-modelagem
CIn.ufpe.br
PROJETO : GenDB
CIn.ufpe.br
PROJETO : GenML
CIn.ufpe.br
GeML – Princípios
• Claridade Semiótica,
– correspondência de 1:1 entre os construtores semânticos e os símbolos gráficos
• Discriminação Perceptiva,
– diferentes símbolos devem ser claramente distinguidos um do outro
• Transparência Semântica,
– representações visuais em que sua aparência sugira o significado
• Gerenciamento da Complexidade,
– mecanismos explícitos para lidar com a complexidade
• Integração Cognitiva,
– mecanismos explícitos para suportar a integração de informação entre os diferentes diagramas
• Expressividade Visual
– uma gama completa de variáveis e capacidades visuais devem ser utilizadas
• Codificação Dupla
– elementos de texto podem complementar os elementos gráficos
• Economia Gráfica
– o número de diferentes símbolos gráficos devem ser cognitivamente gerenciáveis
CIn.ufpe.br
PROJETO : GenML
• 8 princípios de Moody - Notação Visual
– Ex: Claridade Semiótica, integração cognitiva, expressividade visual
• Visualização e criação de modelos
– Diagramas de esquemas
• Diagramas em duas técnicas visuais
– Contêineres e Árvore
• Validação de Diagramas
– Diagramas em conformidade com o meta-modelo
CIn.ufpe.br
PROJETO: GeML – Ferramenta
Diagrama da Fonte::Contêiner
CIn.ufpe.br
PROJETO : GeML – Ferramenta
Diagrama da Entidade::Contêiner
CIn.ufpe.br
PROJETO : GeML – Ferramenta
Diagrama da Fonte::Árvore
CIn.ufpe.br
PROJETO : ARQUITETURA
ARQUITETURA DA PLATAFORMA
DO DOMÍNIO
CIn.ufpe.br
PROJETO : ARQUITETURA
Lambda
CIn.ufpe.br
PROJETO : ARQUITETURA
CIn.ufpe.br
PROJETO : ARQUITETURA
CIn.ufpe.br
PROJETO : ARQUITETURA
CIn.ufpe.br
PROJETO : ARQUITETURA
Meta Layer
CIn.ufpe.br
PROJETO : ARQUITETURA
CIn.ufpe.br
Processo
Analysis
✔ Design
✔
CIn.ufpe.br
IMPLEMENTAÇÃO
IMPLEMENTAÇÃO DE REFERÊNCIA
DA PLATAFORMA
META LAYER
CIn.ufpe.br
IMPLEMENTAÇÃO : META LAYER
CIn.ufpe.br
IMPLEMENTAÇÃO – META LAYER
• Descoberta dos esquemas
– Engenharia Reversa
– Identificação de Entidades, Atributos e Tipos de dados
– XML à grafo rotulado
• Recursivamente percorrido
• Esquemas são transformados (𝑇2𝑀) para um modelo
– modelo.gendb em conformidade com o meta-modelo
– Xtext gramática e Xtend geração de modelos
• Modelos são visualizados na Ferramenta de Modelagem
– Diagramas GenML
• Transformação (𝑀2𝑇) para criação de bases de dados
– Código JavaScript - Mapeador ODM e Base MongoDB
CIn.ufpe.br
Processo
Analysis
✔ Design
✔ ✔
Implementation
CIn.ufpe.br
METODOLOGIA – QIP
✔
1.Caracterizar
o ambiente
6. Empacotar 2. Definir
a experiência objetivos ✔
5. Analisar 3. Escolher
resultados processo ✔
4. Executar✔
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
• Estudo de Caso
– Prova de Conceito
• Validação da plataforma do domínio
– Avaliação da Qualidade do GenDB
• Questionário com Especialistas
– Avaliação de Uso da GenML
• Observação Participante com Desenvolvedores
• Experimento Controlado
– Demostrar a execução e exercitar o algoritmo de inferência
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
ESTUDO DE CASO :: Prova de Conceito
• Avaliação da Plataforma
– Verificar os possíveis impactos e justificar sua adoção
– Desenvolvimento das principais camadas e da ferramenta ClinGen
• Permite REanálises
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
ESTUDO DE CASO::QUESTIONÁRIO
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicadores de Qualidade
Análise Fatorial
• Verificar a adequabilidade da base de dados;
– Força da correlação (>0,3) e comunalidade (>0,4)
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicadores de Qualidade:: Análise Fatorial
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicadores de Qualidade
Análise Fatorial
• O índice de cada fator (escore) é salvo como uma variável (𝐼𝑄(
𝐹𝑘𝑛)) que apresenta um valor para cada caso observado
• Normaliza os dados para uma escala padrão
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicador de Qualidade Empírica
>0.3 >0.4
eigenvalue >1
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicador de Qualidade Semântica
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicador de Qualidade Semântica
• QS – Conhecimento do Domínio
– referente ao conhecimento específico do domínio
– Completude, Validade, Integração e Minimalisação
• QS – Aplicabilidade
– referente a aplicabilidade do meta-modelo
– Reuso e Integridade
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicador de QS – Conhecimento do Domínio
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicador de QS – Aplicabilidade
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicador de Qualidade Organizacional
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicador de Qualidade Pragmática
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Indicadores de Qualidade
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Observação Participante
• 𝑇𝑀 - Tempo de Modelagem
• 𝐶𝑂 - Consultas ao Observador
• 𝑃𝑈 - Problemas de Usabilidade
• 𝐸𝐶 - Erros de Compreensão
• 𝐷𝑁𝑉 - Diagrama Não Validado
• 𝐸𝐴 - Erros de Aplicação
• 𝐸𝐹 - Erros da Ferramenta
• 𝐷𝐼 - Diagramas Incompletos
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Observação Participante
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Observação Participante
• 𝑇𝑀 - Tempo de Modelagem
• 𝐶𝑂 - Consultas ao Observador
• 𝑃𝑈 - Problemas de Usabilidade
• 𝐸𝐶 - Erros de Compreensão
• Validação da ferramenta evita
– 𝐷𝑁𝑉 - Diagrama Não Validado
– 𝐸𝐴 - Erros de Aplicação
– 𝐸𝐹 - Erros da Ferramenta
• Nenhum usuário deixou de completar a tarefa
– 𝐷𝐼 - Diagramas Incompletos
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Experimento Controlado
• Variáveis Observadas
– 𝑉1 - Tempo de CPU;
– 𝑉2 - Consumo de memória, medido em MB (Mega Bytes); e
– 𝑉3 - Tempo de execução do algoritmo (Wall Clock Time)
• Variáveis Independentes
– Arquivos diversos
• 15MB (1.491 instâncias), 30MB (3.122 instâncias), 60MB (6.284 instâncias),
120MB (12.572 instâncias), 180MB (18.519 instâncias)
• Ambiente
– Processador Intel Core i7 4-core e 16GB de memória RAM
• Tratamento
– Ruby
– Java
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Experimento Controlado
CIn.ufpe.br
AVALIAÇÃO E RESULTADOS
Experimento Controlado
CIn.ufpe.br
METODOLOGIA – QIP
✔
1.Caracterizar
o ambiente
6. Empacotar 2. Definir
a experiência objetivos ✔
✔
5. Analisar 3. Escolher
resultados processo ✔
4. Executar✔
CIn.ufpe.br
CONSIDERAÇÕES FINAIS E
TRABALHOS FUTUROS
CIn.ufpe.br
CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS
ATENDIMENTO AOS OBJETIVOS
CIn.ufpe.br
CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS
VANTAGENS DE USAR MDE
• Independência de plataforma
CIn.ufpe.br
CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS
CONTRIBUIÇÕES
CIn.ufpe.br
CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS
TRABALHOS FUTUROS
• Automatização do workflow
CIn.ufpe.br
CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS
PUBLICAÇÕES
CIn.ufpe.br
CONSIDERAÇÕES FINAIS E TRABALHOS FUTUROS
PUBLICAÇÕES PLANEJADAS
CIn.ufpe.br
METODOLOGIA – QIP
✔
1.Caracterizar
o ambiente
✔
6. Empacotar 2. Definir
a experiência objetivos ✔
✔
5. Analisar 3. Escolher
resultados processo ✔
4. Executar✔
CIn.ufpe.br
UM META-MODELO PARA REPRESENTAÇÃO
DE DADOS BIOLÓGICOS MOLECULARES E
SUPORTE AO PROCESSO DE ANOTAÇÃO DE
VARIANTES GENÉTICAS
CIn.ufpe.br