Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Salvador
2015
Salvador
2015
RESUMO
ABSTRACT
The human vision is an intuitive system for us, however it is of highly complex
computational implementation. What we see is interpreted based on extensive
previous experience, if we cut ourselves with a knife the visual stimulus of seeing any
other knife will imply in much more than the visual recording of that event, we will
know(based on our own experience or observation) that that object represents
danger, that it's a weapon (a concept that is also created by absorption of knowledge
or personal experience), that its blade is the part that cuts, among various other
information that our life experience provides. For this reason the adaptation process
of our visual system into computational data (and consequently decisions and
analysis) is extremely complex, it is not enough to register what we see, the most
important part is to interpret that information in a way that the absorbed data is useful
to the user. The area that studies the adaptation of the visual system in
computational data is computer vision, its applicability is extensive; it can be used to
control the movements of a robot, to control the quality of a product in a factory,
systems for autonomous cars, medical image analysis, and many other fields of
study. This monograph presents a proposal of a low cost digital blackboard. Much
research has been made in this monograph in the areas of computer vision, machine
learning and image processing, for the purpose of creating a system that is capable
of, from a common webcam, simulate a digital blackboard and offer a low cost
alternative for it. The library OpenCV is the basis for the development of the
application to this monograph, this library offers tools for image processing and
computer vision. During the creation of this document, a practical and usable
software was developed, using the knowledge presented here; it reinforces the
viability of this project.
Keywords: Computer vision, OpenCV, machine learning, image processing
SUMRIO
1 INTRODUO...........................................................................................................5
1.1 Problema de pesquisa.........................................................................................7
1.2 Objetivo geral.......................................................................................................7
1.3 Objetivo especficos.............................................................................................7
2 FUNDAMENTAO TERICA..................................................................................9
2.1 Viso computacional............................................................................................9
2.1.1 OpenCV.......................................................................................................10
2.2 Aprendizado de mquina...................................................................................10
2.2.1 Aprendizagem supervisionada....................................................................12
2.2.2 Aprendizagem no supervisionada.............................................................12
2.3 Processamento de imagens digitais..................................................................13
2.3.1 Imagem........................................................................................................13
2.3.2 Imagem digital.............................................................................................14
2.3.3 Suavizao..................................................................................................14
3 CONCLUSO...........................................................................................................15
REFERNCIAS...........................................................................................................16
1 INTRODUO
Pode-se supor que a viso humana uma habilidade trivial e de fcil adaptao
ao mundo computacional, afinal, mesmo uma criana em seus primeiros anos de
vida sabe diferenciar um brinquedo prximo de um distante, ou distinguir um objeto
especfico em um ambiente cheio de distraes. Esta suposio no verdadeira.
Segundo (BRADSKI & KAEHLER, 2014) o crebro humano divide o sinal da viso
em diversos canais que o fornecem diferentes tipos de informaes, o crebro
possui um sistema de ateno que, de forma atrelada a atividade exercida, identifica
partes importantes a serem examinadas em uma imagem, enquanto suprime outras
reas de menor importncia. H um feedback massivo no fluxo de informaes
visuais que ainda pouco entendido, existem diversos estmulos associativos nos
sensores de controle do corpo que permitem que experincias prvias sejam
utilizadas como aprimorao na capacidade do indivduo de interpretar o que v e
sente em experincias futuras. Por exemplo, caso uma pessoa se machuque em
uma superfcie spera, da prxima vez que atravs de estmulos visuais reconhecer
aquela mesma superfcie, ir identifica-la como spera e naturalmente ter mais
cuidado ao entrar em contato. Este imenso histrico de informaes sobre o mundo
em que vivemos e como ele funciona, estabelecido durante toda a vida atravs de
experincias pessoais, torna a viso humana muito mais complexa do que
simplesmente exibir um contedo grfico e interpretar formas e cores, o desafio da
viso computacional tornar computadores capazes de fazer esta interpretao do
que veem e transformar estes dados em decises ou informaes teis ao usurio,
como interpretar seus movimentos, descrever o ambiente que est sendo gravado.
Este nvel de informao pode ser extremamente til nas mais variadas reas,
desde anlises mdicas at a criao de robs inteligentes, ou at mesmo na
criao de uma lousa virtual.
A lousa digital um dispositivo de interface humana, ou seja, um dispositivo que
permite que seres humanos forneam entradas e recebam sadas de dispositivos
computacionais. Ela permite que o usurio interaja com um computador por uma
grande tela touchscreen, como se estivesse usando um quadro negro, porm, com
todas as capacidades de um computador. Portanto, alm de exibir o contedo
acadmico padro, pode-se utilizar jogos, vdeos, imagens ou qualquer outro
livros
na
rea
de
viso
computacional,
captura
de
movimentos,
possvel criar um software que simule uma lousa digital, que gere com certa
preciso a experincia de uma lousa digital, porm com custo significativamente
inferior?
10
2 FUNDAMENTAO TERICA
Neste captulo feito um estudo bibliogrfico, utilizando um conjunto de pesquisas,
estudos e livros na rea de viso computacional e suas ramificaes, procurando
relacionar o conhecimento de diversos autores e pesquisadores com o tema desta
monografia.
11
2.1.1 OpenCV
12
13
14
2.3.1 Imagem
15
Uma imagem digital uma imagem f(x,y) que foi simplificada tanto em
coordenadas espaciais como em luminosidade. representada por um array 2D de
nmeros inteiros, ou uma srie dos mesmos, onde cada array representa uma
banda de cor. A luminosidade digitalizada chamada de nvel de cinza (Greyscale).
Cada elemento do array chamado de pxel ou pel, derivado do termo Picture
element (Elemento da imagem, em traduo livre).
Geralmente, o tamanho de tal array algumas centenas de pixels por algumas
centenas de pixels, e h diversas dzias de diferentes nveis da escala de cinza.
Uma imagem digital parece com
F(x,y) =
f(1,1)
f(1,2) ...
f(1,N)
f(2,1)
f(2,2)
f(2,N)
...
...
...
f(N,N)
2.3.3 Suavizao
16
3 CONCLUSO
Nesta monografia foram utilizadas tcnicas de viso computacional, aprendizado
de mquina, captura de movimento e processamento de imagens para desenvolver
um prottipo que demonste a viabilidade do desenvolvimento de um software que
sirva de alternativa lousa digital, com a restrio de que esta alternativa deve ser
de baixo custo, para atender um grupo da populao significativo que poderia
desfrutar do enriquecimento que tal ferramenta traz ao ambiente acadmico.
Com esta monografia, todos os objetivos do projeto foram alcanados, o prottipo
acessvel a partir de computadores simples, sem um custo computacional
extraordinario, e o custo de utilizao de uma webcam para captura dos
movimentos do usurio. Devido ao escopo de prottipo, alguns problemas foram
observados, como a isolao de objetos base, que podem ser usados como alvo
para a captura de movimentos, as variaes de luz em uma sala podem fazer com
que um objeto azul tenha aparncia branca por certos perodos, o que causa uma
interrupo na utilizao do software. Porm, o software consideravelmente leve,
os problemas encontrados em seu desenvolvimento so triviais e de fcil
remediao. Pude perceber tambm o espao para crescimento que este prottipo
tem, funcionalidades nicas como a deteco de objetos em tempo real, faces,
caractersticas, entre outras funcionalidades que uma lousa digital no seriam
capazes de prover. Porm, necessita-se de mais estudo na rea para saber a real
aplicabilidade destas funcionalidades no mbito acadmico.
17
REFERNCIAS
GONZALEZ, R. E. W. R. C. Digital image processing. 2. ed. Prentice hall, 2008.
190p.
HARRINGTON, P. Machine Learning in Action. Manning, 2012. 384p.
KAEHLER, G. B. &. A. Learning OpenCV. O'REILLY, 2008. 577p.
KIRK, M. Thoughtful machine learning. O'REILLY, 2014. 235p.
KULKARNI, P. Reinforcement and Systemic Machine Learning for Decision
Making. 1. ed. Wiley, 2012. 298p.
LIVINGSTONE, M. Vision and Art: The Biology of Seeing. Abrams, 2008. 208p.
MARR, D. C. Vision. 1. ed. MIT, 1982. 432p.
PALMER, S. E. Vision science: Photons to phenomenology. 1. Ed. The MIT
Press, 1999. 832p.
PETROU, M. P. C. Image processing: The fundamentals. Wiley, 2010. 815p.
WEISSHEIMER, S. F. O. &. J. Tarefas de aprendizagem de ingls mediadas pela
Lousa Digital Interativa: Efeitos motivacionais em tarefas de resoluo de
problemas e socializao de informaes pessoais. 2014. 158f. Dissertao
(Mestrado em Aprendizagem de lnguas estrangeiras) - Universidade Federal do Rio
Grande do Norte (UFRN), Londrina, 2014.
WHITE, D. C. &. J. M. Machine learning for hackers. 1. Ed. O'REILLY, 2012. 322p.