Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/311608417
CITATIONS READS
0 1,000
1 author:
Suhendro Irianto
Darmajaya Informatics and Business Institute
12 PUBLICATIONS 3 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Suhendro Irianto on 14 December 2016.
SUHENDRO Y. IRIANTO
Staf Pengajar Fakulas Ilmu Komputer
Dan Program Pasca Sarjana
Institut Informatika dan Bisnis Darmajaya
ii
iii
DAFTAR ISI
KATA PENGANTAR iv
BAB 1. REPRESENTASI CITRA DIGITAL 1
1.1 Terbentuknya Citra Digital
1.2 Sampling dan Kuantisasi Citra 2D
1.3 Distorsi dan Blurring
1.4 Representasi Spatial Citra Digital
iv
3.8.2 Dilasi
3.8.3 Erosi
3.8.4 Opening
3.9 Struktur Element
3.10 Filtering Pass Filtering
3.11 Analis Bentuk
3.11.1 Including boxes
3.11.2 Fourier descriptors
3.11.3 Line approximation
3.12 Pendekatan Robust Estimation
3.13 Representasi Matrik Dari Bentuk
v
7.2.3 Fitur bentuk
7.3 Matching Image Query
7.3.1 Matching berbasis fitur warna
7.3.2 Matching berbasis fitur tekstur
7.3.3 Matching berbasis fitur bentuk
7.4 CBIR Dalam Compressed Domain
7.5 Teknik Fitur DCT Untuk CBIR
BAB 8 CBIR – MATCHING WAJAH
8.1 Face Recognition
8.2 Deteksi Wajah dan Ekstrksi Fitur Wajah
8.3 Pencarian Citra Wajah (Face Image Retrieval)
8.4 Metode Compressed Domain
8.5 Pengenalan Dengan Posisi Dan Frame Citra
Wajah Wajah
8.6 Pengenalan Dengan Posisi Dan Frame Citra
Wajah Wajah
8.7 Pengenalan dengan posisi dan frame citra wajah
Wajah
8.8 Algoritma Modul Query Wajah Dan Matching
vi
KATA PENGANTAR
1
BAB - 1
REPRESENTASI CITRA DIGITAL
Sejauh ini terdapat dua jenis citra yaitu citra kontinu dan citra
diskrit. Citra kontinu dihasilkan dari sistem optik yang menerima
sinyal analog, misalnya mata manusia dan kamera analog.
Citra diskrit dihasilkan melalui proses digitalisasi terhadap citra
kontinu. Beberapa sistem optik dilengkapi dengan fungsi
digitalisasi sehingga ia mampu menghasilkan citra diskrit,
misalnya kamera digital dan scanner.
0<i(x,y)<∞, illmuniation
0<r(x,y)<1, reflectance
2
Gambar 1.1.Pembentukan suatu citra digital
A b
Gambar 1.2. a). Citra kontinu diproyeksikan suatu sensor
matrik, b). hasil dari citra sampling dan kuantisasi
3
ii. Kemudian nilai-nilai dalam citra kontinyu f(x,y) didekati
dengan nilai-nilai diskrit dalam array N x M; biasanya N
= 2n & M = 2m
iii. Setiap elemen array kemudian dikonversi menjadi
picture element (piksel)
Untuk membuat citra digital, kita perlu mengkonversi terus
menerus ke dalam bentuk digital lihat gambar 1.2. dan 1.3.
Gambar 1.3 (a) menunjukkan gambar terus menerus, f(x,y)
dimana ditunjukan konversi citra analog ke bentuk digital.
Untuk mengubahnya menjadi bentuk digital, kita harus men
sampling fungsi baik dalam koordinat maupun
dalam amplitudo. Suatu citra dapat merupakan fungsi continue
baik dengan x dan y maupun dengan koordinat
dan juga dalam amplitude. Digitisasi nilai koordinat disebut
sebagai sampling sedangkan digitisasi nilai amplitude disebut
sebgai kuantisasi. Hasil sampling dan kuantisasi adalah suatu
matrik bilangan.
Nilai koordinal awal adalah (x,y) = (0,0). Nilai-nilai koordinat
selanjutnya pada baris pertama adalah (x,y) = (0,1), notasi
(0,1) digunakan untuk menunjukan pentingnya sample ke dua
sepanjang baris ke dua. Jumlah bit yang diperlukan untuk
menyimpan citra yang telah digitalisasi adalah:
4
b=MxN
Dimana M dan N adalah jumlah baris dan kolom, sedangkan
jumlah gray level adalah pangkat dua dari bilangan integer:
L = 2k , dimana k =1,2,…24
Citra seperti ini biasa disebut sebagai citra k bit.
5
Gambar 1.4. Pengaruh kuantisasi nada citra interpretasi, a) 4 levels.
(b) 16 levels. (c) 256 levels.
`
Sementara itu tahapan proses kuantisasi adalah sebagai
berikut:
i. digitalisasi amplitudo
ii. Jumlah gray level yang diperbolehkan
untuk tiap elemen array = G = 2q
berjarak sama pada rentang [0,L]
Kuatisasi adalah Konversi dari amplitudo tak terhingga yang
tepat untuk suatu bilangan biner.
6
1.3 Distorsi dan Blurring
Efek blur adalah distorsi gambar yang umum terjadi di bidang
fotografi. Gambar yang blur (kabur) bisa muncul karena
berbagai alasan, seperti lensa kamera yang tidak fokus,
intensitas cahaya yang sangat ekstrim, ketidak sempurnaan
fisik lensa yang mengakibatkan deviasi optis, dan gerakan
relatif objek terhadap lensa kamera. Gerakan relatif objek
terhadap lensa, misalnya, diketahui menyebabkan pergeseran
posisi rincian objek pada gambar sehingga tampilan tekstur
dan tepian dari objek pada gambar menjadi tidak jelas. Efek
motion blur bisa juga terjadi secara tidak sengaja sebagai
akibat proses pengambilan gambar digital yang tidak sempurna
(misalnya karena adanya pergerakan sekecil apapun).
7
A b c
Gambar 1.6. Beberapa contoh artifak distorsi blur pada gambar: (a)
Efek blur yang menimbulkan sensasi gerakan cepat; (b) Efek blur
yang tidak diinginkan pada seluruh area gambar; (c) Efek motion blur
lokal pada sebagian area gambar.
8
Citra yang diperoleh melalui sensor modern sering terganggu
dengan oleh berbagai sumber kebisingan . Dengan
kebisingan kita lihat variasi stokastik sebagai lawan distorsi
deterministik seperti bayangan atau kurangnya fokus. Secara
khusus kita akan menganggap penggunaan perangkat modern,
charge-coupled digital (CCD) kamera dimana foton
menghasilkan elektron yang biasa disebut sebagai foto
elektron.
9
Berarti penyimpanan untuk citra digital yg disampling dengan N
x M piksel dan dikuantisasi menjadi 2m level derajat
keabuannya membutuhkan memori N x M x m. Contoh, citra
yang berukuran 512 x 512 dengan 256 derajat keabuan
membutuhkan memori sebesar 512 x 512 x 8 bit = 2048.000
bit. Resolusi gambar ditentukan oleh N dan m. Makin tinggi
nilainya maka citra yg dihasilkan makin bagus
kualitasnya(mendekati citra kontinu).
10
BAB - II
PENGOLAHAN CITRA DIGITAL
11
.
Gambar 2.1: Digitasi dari citra kontinu. Piksel pada koordina [m = 10, n = 3]
memiliki nilai integer kecerahan 110.
12
misalnya mata pada manusia, kamera, scanner, dan
sebagainya, sehingga bayangan objek yang disebut citra
tersebut terekam. Citra sebagai keluaran dari suatu sistem
perekaman data dapat bersifat:
optik berupa foto
analog berupa sinyal video seperti citra pada monitor
televisi
digital yang dapat langsung disimpan pada suatu pita
magnetik.
13
citra digital yang diberikan. Sampling dapat juga didefinisikan
sebagai pengurangan signal kontinu menjadi signal diskrit.
Citra digital dapat juga didefinisikan sebagai fungsi dua dimensi
f(x,y) dimana x dan y adalah koordinat dan aplitudo gelombang
dimana f adalah merupakan suatu intensitas Gray (Gy) level
dalam citra pada titik. Citra digital terdiri dari sejumlah elemen ,
dimana setiap elemen disebut sebagi elemen citra atau pels
atau piksel.
14
digunakan. Setiap piksel berisi nilai yang mewakili informasi
apa yang ada dalam piksel. Citra (image) juga dapat
didefinisikan sebagai fungsi dua dimensi f(x,y) di mana x dan y
adalah koordinat spasial dan amplitudo f pada setiap pasang
(x,y) disebut intensitas (gray level) citra pada titik tersebut.
Jika x dan y berhingga (finite) dan diskrit (tdk kontinyu) maka
disebut citra digital. Citra digital terdiri dari sejumlah elemen
berhingga yang masing-masing mempunyai lokasi dan nilai,
Elemen-elemen x dan y disebut elemen citra atau pels atau
piksel.
15
Jumlah tingkat keabuan yang berbeda biasanya merupakan
pangkat dari 2, yaitu L = 2β dimana β adalah jumlah bit dalam
representasi biner dari tingkat kecerahan. Ketika β> 1,maka
citra yang dimaksud adalah citra gray-level, ketika β = 1 maka
citra biner. Dalam sebuah citra biner hanya ada dua tingkat
abu-abu yang ada, yaitu hitam dan putih atau "0" dan "1".
16
Gambar 2.4. Komponen Luminance, Hue, Saturation
Radiance adalah jumlah energi yang memancar dari sumber
cahaya (dalam satuan watt). Luminance adalah jumlah energi
yang diterima oleh observer dari sumber cahaya (dalam satuan
lumens, lm). contoh: sinar inframerah memiliki radiansi yang
besar tapi nyaris tidak dapat dilihat oleh mata manusia.
Brightness adalah deskriptor yang subjektif, mirip dengan
pengertian intensitas pada akromatik, adalah satu faktor
penentu dalam menggambarkan warna.
17
analisis citra, misalkan identifikasi objek dan ekstraksi warna.
Terdapat tiga kuantisasi untuk mencitrakan warna, yaitu:
Hue ditentukan oleh dominan panjang gelombang.
Warna yang dapat dilihat oleh mata memiliki panjang
gelombang antara 400 nm (violet) - 700 nm (red) pada
spektrum electromagnetic seperti pada Gambar 2.5.
Saturation ditentukan oleh tingkat kemurnian, dan
tergantung pada jumlah sinar putih yang tercampur
dengan hue. Suatu warna hue murni adalah secara
penuh tersaturasi, yaitu tidak ada sinar putih yang
tercampur. Hue dan saturation digabungkan
menentukan chromaticity suatu warna. Intensitas
ditentukan oleh jumlah sinar yang diserap. Semakin
banyak sinar yang diserap semakin banyak tinggi
intensitas warnanya.
Chromatic tidak memiliki warna, tetapi mempuyai
atribut intensitas. Tingkat keabuan (Greylevel)
merupakan ukuran intensitas energi, sehingga
merupakan suatu kuantitas fisik. Sementara itu
brightness atau luminance ditentukan oleh persepsi
warna penglihatan mata manusia. Apabila diberikan
sinar biru dan hijau dengan intensitas yang sama, sinar
18
biru diterima lebih gelap dibandingkan sinar hijau.
Sehingga dapat dikatakan bahwa persepsi intensitas
manusia adalah non-linear, misalkan perubahan
intensitas yang dinormalisasi dari 0.1 ke 0.11 dan 0.5
ke 0.55 akan diterima dengan perubahan tingkat
kecerahan (brightness) yang sama.
19
Gambar 2.6: Spektrum elektromagnetik. Spektrum yang dapat
dilihat (visible) ditunjukan dengan citra yang di-zoom
20
Pada kenyataan citra digital kebanyakan tidak monokrom,
tetapi citra berwarna. Sebagai contoh citra spesimen jaringan
yang mempunyai banyak warna digunakan untuk
mengidentifikasi struktur atau melokalisasi aktivitas kimia yang
terjadi.Untuk bahan anorganik, penggunaan terpolarisasi
cahaya atau permukaan oksidasi menghasilkan citra warna
untuk mencitrakan struktur.
21
Baris pertama Y = (0.299, 0.587, 0.144) (R,G,B) juga dapat
digunakan untuk mengubah RGB menjadi Black and White.
Sedangkan konversi dari YIQ ke RGB yang merupakan
transformasi matriks inverse yang mengubah dari YIQ ke RGB
digunakan rumus sebagai berikut:
22
Komponen YUV mirip dengan komponen matriks transformasi
dari RGB ke YUV dapat ditulis sbb:
23
Diagram CIE menyediakan alat untuk mendefinisi warna.
Pendekatan yang dilakukan adalah diwujudkan dalam sistem
HSV (hue, saturasi, dan nilai), HSI (hue, saturasi, dan
intensitas) dan HLS (Hue, Ligth, dan saturasi). Hal Ini terkait
erat satu sama lain dan dengan konsep warna, naungan, dan
nada. Dalam sistem ini, hue adalah warna seperti yang
dijelaskan oleh panjang gelombang, misalnya perbedaan antar
daerah dan kuning. Saturation adalah jumlah warna yang hadir,
misalnya perbedaan antara merah dan pink. Sumbu ketiga
(disebut ligth, intensitas, atau nilai) adalah jumlah cahaya,
perbedaan antara merah dan terang gelap, atau antara abu-
abu gelap dan abu-abu terang.
24
perhitungan untuk mengkonversi RGB-encode citra untuk HSI
dan kembali. Untuk melakukan konversi dari RGB ke HIS
dengan dikerjakan dengan tahapan sebagai berikut:
25
sepanjang diagonal kubus, tapi tidak ada geometri ruang HSI
tepat sesuai dengan bentuk kubus RGB. Ini berarti dalam
untuk menampilkan warna dalam ruang baik nilai saturasi
sedikit terdistorsi dalam proses konversi.
26
memungkinkan menampilkan video pada layar komputer, atau
untuk keperluan percetakan, namun, tergantung pada rentang
dinamis data. Lebih lanjut pengurangan citra warna 256 warna
dengan menggunakan tabel lookup di mana warna 256
terbaik dicocokkan dengan isi citra umumnya yang digunakan
untuk citra digital. Hal ini akan mengurangi ukuran file. 256 byte
untuk menentukan nilai R, G,dan B. Hanya satu byte per
piksel diperlukan untuk memilih palet warna. Teknik yang
paling umum untuk memilih palet yang optimum adalah
Heckbert atau algoritma median, yang digunakan untuk
membagi ruang warna didasarkan pada nilai-nilai RGB yang
sebenarnya dari piksel pada citra asli. Berbagai jenis
pemisahan warna yang tersedia. Perhitungan komponen RGB
(atau CMY sebagai nilai pelengkap) yang umum digunakan
dalam desktop publishing, tapi tidak sering berguna untuk
analisa citra, yang juga dapat memisahkan warna citra menjadi
komponen hue, saturasi, dan intensitas.
27
koordinat kromatisitas hijau oleh y. Nilai tristimulus linear dalam
I dan dengan demikian informasi intensitas mutlak telah hilang
dalam perhitungan kromatisitas {koordinat x, y}. Semua
distribusi warna, I, yang tampak memiliki warna yang sama
akan memiliki kromatisitas koordinat yang sama pula.
28
yang lainnya diserap. Sehingga sumber sinar perlu
diperhitungkan begitu pula sifat alami sistem visual manusia
ketika menangkap suatu warna. Sebagai contoh, suatu objek
yang memantulkan sinar merah dan hijau akan tampak
berwarna hijau apabila benda tersebut disinari oleh sinar hijau
(tanpa adanya sinar merah). Demikian juga sebaliknya, objek
akan tampak berwarna merah apabila tidak terdapat sinar
hijau. Apabila benda tersebut disinari oleh sinar putih, maka
objek tersebut berwarna kuning (merupakan gabungan warna
hijau + merah).
29
yang terkait dengan nama warna yang diberikan dapat
bervariasi pada rentang yang cukup.
30
dasar tersebut. Bagaimanapun juga apabila salah satu dari
ketiga komponen warna dasar tersebut ditambahkan ke warna
yang tidak dapat dicocokkan tadi, maka warna yang tidak dapat
dicocokkan tersebut dapat dicocokkan dengan campuran dari
dua warna dasar lain. Hal ini menunjukkan bahwa warna dapat
memiliki nilai bobot negatif dari ketiga komponen warna dasar
tersebut. Pada tahun 1931, Commission Internationale de
l‘Eclairage (CIE) mendefinisikan tiga standar komponen warna
utama : X, Y dan Z. Yang dapat ditambahkan untuk
membentuk semua kemungkinan warna. Warna utama Y dipilih
sedemikian rupa sehingga fungsi kecocokan warnanya secara
tepat mencocokkan fungsi luminous efisiensi mata manusia
berdasarkan penjumlahan ketiga warna seperti pada gambar
2.9 . Diagram Chromaticity menunjukkan semua warna yang
dapat dilihat oleh manusia. Sumbu x dan y merupakan nilai
normalisasi warna utama X dan Y untuk suatu warna, dan z =
1−x−y menyatakan jumlah Z utama yang diperlukan.
Chromaticity bergantung pada panjang gelombang dan
dominan saturation, dan tidak bergantung pada energi luminan.
Warna dengan nilai chromaticity yang sama tetapi dengan
luminan berbeda akan terpetakan pada titik yang sama di
daerah tersebut.
31
Gambar 2.7. Diagram CIE Chromaticity menunjukkan semua visible
colours. x dan y adalah jumlah normalisasi kemunculan primer X and
Y, z = 1 -x - y menentukan jumlah primer Z yang dibutuhkan.
32
Warna spektrum utama berada pada bagian kurva batas
daerah,dan suatu sinar putih standar memiliki warna yang
didefinisikan berada dekat (tetapi tidak) di titik dengan persamaan
energi x = y = z = 1/3. Komplementer warna , yaitu warna yang
ditambahkan ke warna putih, berada di titik akhir suatu garis yang
melewati titik tersebut. Sebagai ilustrasi pada gambar 2.7, semua
warna yang berada di dalam segitiga dapat dibentuk dari campuran
warna yang berada pada verteks (garis) segitiga. Dari ilustrasi
grafik tersebut, semua warna visible tidak dapat diperoleh dari
campuran warna utama R, G dan B (atau dari tiga visible warna
lainnya), karena bentuk diagramnya bukan segitiga.
34
Original image Intensity Sclicing Grey level transform
35
460 nanometer. Panjang gelombang warna yang masih bisa
ditangkap mata manusia berkisar antara 380-780 nanometer.
Dalam peralatan optis, warna bisa pula berarti interpretasi otak
terhadap campuran tiga warna utama cahaya: R(red=merah),
G(green=hijau), B(blue=biru) yang digabungkan dalam komposisi
tertentu. Misalnya pencampuran 100% merah, 0% hijau, dan 100%
biru akan menghasilkan interpretasi warna magenta.
36
adalah suatu model warna yang terdiri dari merah, hijau, dan biru,
yang jika digabungkan akan membentuk suatu susunan warna yang
luas. Setiap warna dasar, misalnya merah, dapat diberi rentang-
nilai. Untuk monitor komputer, nilai rentangnya paling kecil = 0 dan
paling besar = 255. Pilihan skala 256 ini didasarkan pada cara
mengungkap 8 digit bilangan biner yang digunakan oleh mesin
komputer. Dengan cara ini, akan diperoleh warna campuran
sebanyak 256 x 256 x 256 = 1677726 jenis warna. Satu jenis
warna, dapat dibayangkan sebagai sebuah vektor di ruang 3
dimensi yang biasanya dipakai dalam matematika, koordinatnya
dinyatakan dalam bentuk tiga bilangan, yaitu komponen-x,
komponen-y dan komponen-z. Misalkan sebuah vektor dituliskan
sebagai r = (x,y,z). Untuk warna, komponen-komponen tersebut
digantikan oleh komponen R(red), G(green), B(blue). Jadi, sebuah
jenis warna dapat dituliskan sebagai berikut: warna = RGB(30, 75,
255). Putih = RGB (255,255,255), sedangkan untuk hitam=
RGB(0,0,0).
37
komponen warna utama. Contoh citra dengan individu komponen
warna dapat dilihat pada gambar 2.9.
Citra RGB Komp. Green Komp. Red Komp. Blue Citra abu-abu
38
2.8.2 Model CMY dan gamut
Model CMY (Cyan, Magenta dan Yellow) adalah suatu model
substractive yang berhubungan dengan penyerapan warna. Suatu
permukaan yang dicat warna cyan kemudian diiluminasi sinar putih,
maka tidak ada sinar merah yang dipantulkan, dan similar untuk
warna magenta dengan hijau, dan kuning dengan biru. Relasi model
CMY adalah sebagai berikut:
39
Gambar 2.11 Model warna HIS
Konversi nilai antar model RGB dan HSI adalah sebagai berikut:
I = (R+G+B)/3
dimana kuantitas R, G, dan B adalah jumlah komponen warna
merah,hijau, biru dan dinormilisasi ke [0,1]. Intensitas adalah nilai
rata-rata komponen merah, hijau dan biru. Nilai saturation
ditentukan sebagai:
min(R,G, B0) 3
S 1- 1- min (R,G, B)
I (R G B)
Komponen luminance (Y) berisi semua informasi yang diperlukan
untuk televisi hitam dan putih, dan menerjemahkan persepsi kita
tentang brithgness warna tertentu. Dalam persepsi kita warna hijau
lebih enak dipandang dari pada warna merah, sedangkan warna
merah lebih enak dipandang dari pada warna biru, hal ini
disebabkan karena nilai masing-masing warna adalah 0.587, 0.299
40
dan 0.114 pada baris pertama dari konversi matrik di atas. Bobot
nilai harus digunakan untuk mengkonversi citra menjadi citra abu-
abu (grayscale image) dengan mempertahankan kecerahan.
Untuk memanipulasi model HSI maka harus dikerjakan bebarapa
tahapan:
Pertama konvesi RGB kedalam HSI
Proses manpulasi dikerjakan untuk HSI
Akhirnya konversi kembali citra dari HSI kedalam RGB
41
Selanjutnya untuk mengubah kembali dari HIS ke RGB dapa
diilustrasikan pada gambar 2.14.
42
selama nya terjadi secara random atau tidak disengaja, tetapi
dapat dibuat secara sengaja sehingga noise tidak selalu jelek atau
tidak bermanfaat contohnya pada Stochastic Resonance.
43
2.9.1 Impulse noise
Pada noise tipe ini setiap piksel dalam suatu citra digital mempunyai
probalitas p/2 (0<p<1) untuk terganggu dengan titik putih (white
dot) atau titik hitam ( black dot)
255 dengan probalitas p/2 - - - - piksel - piksel noise
Y 0 dengan probabilit as p/2 - - - - - piksel - piksel noise
X(i, j) dengan probalitas 1 - p - - - - - piksel - piksel tanpa noise
Dimana 1≤i≤H, 1≤j≤W
Dalam beberapa aplikasi piksel noise tidak hanya hitam dan putih
yang dapat membuat penghilangan impulse noise menjadi lebih
sulit. Berikut adalah teknik untuk menghilangkan noise (denoise)
Citra yang
Algoritma sudah
filtering dibersihkan
noise-nya (X)
44
2.9.2 Additive white gaussian noise
Setiap piksel di dalam suatu citra digital biasanya diganggu dengan
adanya noise yang disebut dengan additive white Gaussian Noise
yang mempunyai zero mean dan variance 2.
Y(i, j) X (i, j) N (i, j)
),1 i H, 1 j W
2
N(i, j) ~ N (O,
45
Sementara teknologi modern telah memungkinkan untuk
mengurangi tingkat kebisingan yang terkait dengan perangkat
elektro-optik untuk hampir berbagai tingkat diabaikan, salah satu
sumber kebisingan tidak dapat dihilangkan dan dengan demikian
bentuk kasus pembatas ketika semua sumber kebisingan lainnya
adalah "dihilangkan".
46
BAB – 3
ANALISA CITRA DIGITAL
47
Metode deteksi tepi-tepi yang paling sering digunakan adalah
metode Canny. Metode Canny berbeda dari metode deteksi tepi
yang lain karena menggunakan dua ambang batas yang
berbeda (untuk mendeteksi tepi yang jelas dan tepi yang tidak jelas.
Berikut penerapan dari detector metedo Canny dengan
dibandingkan dengan metode sobel dengan menggunakan
Matlab:
Membacs citra coin dan menampilkanya.
I = imread('coins.png');
imshow(I)
48
Sobel Canny
Gambar 3.2. Hasil edge detection dengan metode sobel dan canny
49
a b
c d
Gambar 3.3. (a):operator roberts‘ (b): operator prewitt 3x3 prewitt , (c):
operator sobel , (d) Operator Prewitt 4x4
50
2. Konversi citra ke dalam citra biner.
Perintah bwtraceboundary dan bwboundaries hanya bisa
dihunakan pada citra biner.
BW = im2bw(I);
imshow(BW)
51
imshow(I)
hold on;
plot(boundary(:,2),boundary(:,1),'g','LineWidth',3);
52
7. Plot batas semua coins pada citra grayscale yang
merupakan citra awal (original) dengan menggunakan
fungsi bwboundaries.
for k=1:10
b = boundaries{k};
plot(b(:,2),b(:,1),'g','LineWidth',3);
end
3.3 Segmentasi
Segmentasi merupakan proses mempartisi citra menjadi beberapa
daerah atau objek . Segmentasi citra pada umumnya berdasar pada
sifat discontinuity atau similarity dari intensitas piksel
Pendekatan discontinuity: mempartisi citra bila terdapat
perubahan intensitas secara tiba-tiba (edge based).
Pendekatan similarity: mempartisi citra menjadi daerah-
daerah yang memiliki kesamaan sifat tertentu (region
based)
Contoh: thresholding, region growing, region splitting and merging.
Citra digital merupakan atau berisi piksel-piksel atau citra digital = {
piksels }, segmentasi merupakan
partisi atau membagi citra kedalam beberapa bagian yang lebih
kecil (segmen). Segmentasi dilakukan dengan menggabung piksel-
piksel yang mirip atau similar ( piksel i and j ), Sij = Sji ≥ 0. Tujuan
53
segmentasi adalah menggabungkan piksel yang mirip dengan nilai
dari nilai Sij yang besar, harus pada segmen yang sama, sedangkan
piksel yang tidak mirip pada segmen yang berbeda-beda.
Segmentasi dapat juga dianggap sebagai proses pembagian citra
ke dalam kelompok-kelompok yang berarti yang saling berkaitan.
54
Dapat mudah dipahami bahwa segmetasi berbasis throsholding
dengan memeriksa histogram pada citra dengan low noise objek
dan background, seperti pada gambar berikut:
55
Dalam melakukan pengenalan sebuah objek di antara banyak objek
dalam citra, komputer harus melakukan proses segmentasi terlebih
dahulu. Segmentasi adalah memisahkan citra menjadi bagian-
bagian yang diharapkan merupakan objek-objek tersendiri atau
membagi suatu citra menjadi wilayah-wilayah yang homogen
berdasarkan kriteria keserupaan tertentu antara derajat keabuan
suatu piksel dengan derajat keabuan piksel-piksel tetangganya.
Berdasarkan cara kerjanya, terdapat dua jenis teknik segmentasi
citra, yaitu :
1. Segmentasi berdasarkan intensitas warna (derajat
keabuan). Berasumsi bahwa objek-objek yang akan
dipisahkan cenderung memiliki intensitas warna yang
berbeda-beda dan masing-masing objek memiliki warna
yang hampir seragam. Salah satu teknik segmentasi
berdasarkan intensitas warna adalah mean clustering. Pada
mean clustering dilakukan pembagian citra dengan
membagi histogram citra. Kelemahan segmentasi
berdasarkan intensitas warna (derajat keabuan) antara lain
adalah harus tahu dengan tepat berapa jumlah objek yang
ada pada citra serta citra hasil kurang bagus jika pada citra
terdapat beberapa objek dengan warna pada masing-
56
masing objeknya bervariasi atau pada setiap objek memiliki
warna yang sama.
57
adalah sekumpulan wilayah yang melingkupi citra tersebut, atau
sekumpulan kontur yang diekstrak dari citra (pada deteksi tepi).
Contoh segmentasi dapat dilihat dalam gambar 3.1. Tiap piksel
dalam suatu wilayah mempunyai kesamaan karakteristik atau
propeti yang dapat dihitung (image properties), seperti : warna
(color), intensitas (intensity),dan tekstur (texture).
58
Sekumpulan wilayah { R1,R2 ,R3..., Rn } merupakan suatu
segmentasi citra R ke dalam n wilayah jika :
i
i. i2
Ri R
ii. Ri Rk , i k
59
Ide aplikasi pencarian citra yang dibangun terinspirasi oleh
kelebihan Lucene yang mampu menerima segala jenis data untuk
diindekskan terlebih dahulu. Untuk itu dalam aplikasi pencarian
citra, harus dibuat dahulu suatu cara untuk mengubah citra dengan
merepresentasikan citra ke dalam bilangan vektor. Kemudian
membandingkan vektor citra dengan data yang telah diindeks, lalu
dihitung perbandingannya. Proses selanjutnya adalah mencari
relevansi dari query citra dengan indeks yang ada. Hasil yang
didapat berupa jarak vektor citra yang menunjukkan kesamaan
dengan data yang sebelumnya diindeks terlebih dahulu. Semakin
kecil jarak yang didapat dari proses perbandingan maka tingkat
kesamaan semakin tinggi dengan query yang diberikan. Aplikasi
pencarian citra ini dapat dimanfaatkan dalam pengidentifikasian
arsip digital image, pencocokan warna, pencarian duplikasi image,
bidang disain grafis dan lain-lain. Pencarian citra merupakan
permasalahan yang menarik untuk dicari alternatif penyelesaiannya.
Berikut ini adalah penelitian yang sebelumnya dilakukan tentang
pencarian dan pencocokan citra.
Pencarian citra dengan teknik multiresolusi dengan
memanfaatkan ciri tepi suatu citra,teknik ini dikenal dengan QVE
(Query by Visual Example).
60
Pencarian citra dengan memanfaatkan warna, tekstur dan
bentuk citra yang dikenal dengan metode QBIC (Query By
Image Content). Metode ini telah dimanfaatkan oleh IBM untuk
membangun perangkat lunak pencarian citra yang bersifat
komersial. Dalam perangkat lunak tersebut user dapat membuat
query berdasarkan pada berbagai variasi perbedaan atribut
visual seperti komposisi warna dan ciri bentuk.
61
sebuah metrika citra multiresolusi. Metrika ini memberikan
sebuah nilai yang menyatakan tingkat kemiripan antara citra
query dengan citra database. Citra database yang memberikan
nilai paling kecil berarti citra tersebut paling mirip dengan citra
query.
62
Pencarian citra berbasis DCT ,citra database ataupun citra
query bersumber dari scaner berupa sidik jari Hasil dari
penelitian ini menemukan bahwa pencarian citra sidik jari
menggunakan alihragam DCT sangat baik hasilnya jika di query
menggunakan citra blur dan citra query asli. Tingkat
kesuksesan pencarian citra sangat dipengaruhi oleh batasan
treshold score yang digunakan. Semakin besar treshold score
yang digunakan maka tingkat kesuksesan yang dihasilkan akan
semakin tinggi.
63
3.6 Median Filter
Sesuai dengan namanya, median filter merupakan suatu metode
yang menitik beratkan pada nilai median atau nilai tengah dari
jumlah total nilai keseluruhan piksel yang ada di sekelilingnya.
Dimisalkan terdapat data A=1, B=5, C=2,D=9, dan E=7, maka
median filter akan mencari nilai tengah dari semua data yang telah
diurutkan terlebih dahulu dari yang paling kecil hingga pada data
yang paling besar dan kemudian diambil nilai tengahnya (1, 2, 5, 7,
9). Median dari deret tersebut adalah 5. Pemrosesan median filter
ini dilakukan dengan cara mencari nilai tengah dari nilai piksel
tetangga yang mempengaruhi piksel tengah. Teknik ini bekerja
dengan cara mengisi nilai dari setiap piksel dengan nilai median
tetangganya. Proses pemilihan median ini diawali dengan terlebih
dahulu mengurutkan nilai-nilai piksel tetangga, baru kemudian
dipilih nilai tengahnya.
64
tidak terlalu mengurangi kualitas suara aslinya. Kasus mengurangi
noise terhadap file citra sebelumnya pernah diteliti juga dengan
metode average filter. Selain menggunakan metode average filter,
kasus ini juga pernah diteliti dengan metode Diffusion Filter. Dari
penelitian tersebut dapat dilihat hasil yang diuji melalui citra awal
dan citra akhir setelah proses. Dari hasil penelitian, didapat bahwa
average filter dan diffusion filter memberikan hasil yang cukup baik
dalam mereduksi noise tetapi dengan hasil citra yang cukup blur
atau kabur, sehingga hasil yang didapat tampak sedikit berbeda
dengan citra aslinya. Dalam hal ini mengurangi noise denagan
teknik salt pepper terhadap file citra sebelumnya juga pernah diuji.
Pengujian dilakukan dengan tingkat noise 10% sampai 90%. Dari
pengujian didapat semakin tinggi tingkat noise yang terdapat pada
sebuah citra, semakin rendah pula tingkat keberhasilannya dan
kualitas citra yang didapat. Dalam penelitian yang lain, median filter
pernah diuji tingkat keberhasilan deteksi dan tingkat keberhasilan
dalam mereduksi noise. Dari pengujian didapat tingkat rata-rata
keberhasilan median filter adalah 97,7%.
65
kita melakukan operasi terhadap suatu jendela ketetanggaan
pada citra.
Kemudian kita menerapkan (mengkonvolusikan) suatu mask
terhadap jendela tersebut. Mask sering juga disebut filter.
Contoh:
3.8 Morfologi
Matematika morfologi merepresentasikan citra objek dua dimensi
sebagai suatu himpunan matematika dalam ruang Euclidean
dimana dapat berupa ruang kontinyu R atau ruang diskrit Z.Dulu
sebuah citra dipandang sebagai suatu fungsi intensitas terhadap
posisi (x,y), sedangkan dengan pendekatan morfologi, suatu citra
dipandang sebagai himpunan. Sebuah objek citra A dapat
66
direpresentasikan dalam bentuk himpunan dari posisi-posisi (x,y)
yang bernilai 1 atau 0 dimana nilai-nilai tersebut menunjukkan
tingkat gray scale setiap posisi. Nilai 1 untuk gray level warna putih
dan nilai 0 untuk gray level warna hitam. Prinsip dasar dari
matematika morfologi adalah penggunaan structuring element yaitu
bentuk dasar dari suatu objek yang digunakan untuk menganalisis
struktur geometri dari objek lain yang lebih besar dan kompleks.
Tujuannya adalah untuk memperoleh informasi mengenai bentuk
dari suatu citra dengan mengatur bentuk dan ukuran suatu
structuring element. Dalam morfologi ada beberapa operasi yang
dapat dilakukan, yaitu : translasi, dilasi, erosi, dan opening.
3.8.1 Translasi
Translasi artinya sebuah citra dideser pada arah (x,y) dimana (x,y)
adalah koordinat matriks. Operasi Operasi translasi dinyatakan
sebagai.
3.8.2. Dilasi
Operasi Dilasi dilakukan untuk memperbesar ukuran segmen objek
dengan menambah lapisan di sekeliling objek sehingga citra hasil
67
dilasi cenderung menebal [9]. Operasi dilasi akan melakukan proses
pengisian pada citra asal yang memiliki ukuran lebih kecil
dibandingkan structuring element (strel). Dilasi A oleh B dinotasikan
dengan A ⊕ B dan didefinisikan sebagai:
3.8.3 Erosi
Operasi erosi adalah kebalikan dari operasi dilasi. Pada operasi ini,
ukuran objek diperkecil dengan mengikis sekeliling objek sehingga
citra hasil cenderung diperkecil menipis. Operasi erosi akan
melakukan pengurangan pada citra asal yang lebih kecil dibanding
elemen penstruktur (strel). Erosi A oleh B dinotasikan
AΘBdidefinisikan sebagai :
3.8.4 Opening
Proses opening pada sebuah citra A oleh strel B dinotasikan
dengan A ° B dan idefinisikan sebagai proses erosi yang dilanjutkan
dengan proses dilasi dimana kedua proses tersebut dilakukan
secara berulang untuk semua titik (x,y).
68
3.9. Structuring Element
Structuring element dapat diibaratkan dengan mask pada
pemrosesan citra biasa (bukan secara morfologi). Structuring
element juga memiliki titik poros (disebut juga titik origin/ titik
asal/titik acuan). Di bawah ini adalah contoh structuring element
dengan titik poros di (0,0) ditunjukkan dengan huruf ―O‖ Gambar
3.2.
0 1 0
O = 1 1 1
0 1 0
a b
Gambar 3.8. Structuring element, titik O adalah titik pusat , sedang b
adalah representasi biner
69
structuring element juga mempengaruhi citra hasil operasi
morfologi.
70
Filter Median ini menggantikan setiap nilai piksel dengan
rata-rata negara tetangga, yaitu nilai tersebut bahwa 50%
dari nilai di lingkungan berada di atas, dan 50% di bawah.
Ini bisa sulit dan mahal untuk diimplementasikan karena
kebutuhan untuk menyortir dari nilai-nilai. Namun, metode
ini secara umum sangat baik pada mempertahankan tepi.
Dalam Model filter median setiap nilai piksel digantikan oleh
tetangga yang paling umum. Ini adalah sangat berguna filter
untuk prosedur klasifikasi di mana setiap piksel sesuai
dengan obyek yang harus ditempatkan dalam kelas, dalam
penginderaan jauh, misalnya, setiap kelas bisa menjadi
beberapa jenis medan, jenis tanaman, air, dan lain-lain.
Filter atas semua invariant ruang dalam operasi yang sama
diterapkan untuk masing-masing lokasi piksel. Sebuah invariant
non-space filtering, dengan menggunakan filter di atas, dapat
diperoleh dengan mengubah jenis filter atau bobot yang digunakan
untuk piksel untuk bagian yang berbeda dari citra. filter non-linear
juga ada yang tidak invarian ruang; upaya ini untuk mencari tepi
pada citra bising sebelum menerapkan smoothing, tugas yang sulit
yang terbaik, untuk mengurangi kabur karena perataan tepi.
71
Analisa bentuk adalah identifikasi suatu objek dengan berdasarkan
bentuk objek yang bersangkutan. Proses ini biasanya dikerjakan
untuk setelah proses prosedure segmentation. Analisa bentuk
dapat didefiniskan sebagai analisa bentuk berdasarkan diskripsi
bentuk. Terdpat beberapa deskripsi bentuk diantaranaya: Including
boxes , Fourier descriptors, Guzman polygons, Freeman chain
coding, Moment descriptors
72
Img=imread(‘objek.png’);
Img=double(:,:,1);
%create labeling
Result = bwlabel(img,8);
73
Gambar 3.12. Komputasi diskriminasi parameter
74
Karakteristik kurva darin sudut (s) yang didefinisikab oleh vektor
tangential pada setiap titik point
Dan vector tangential vector pada titik A.
2 .s 2 .s
(t)
L L
75
Shape recognition dapat didefinsikan sebagai (piksel) didapat
setelah pengolahan citra dikerjakan salah satu tujuannya adalah
unutuk menemukan bentuk awal yang dapat mendeskripsikan titik
terbaik dari point yanh diekstrak. Ada dua metode perkiraan garis
untuk shape recognition yaitu metode Least square yang
diturunkan dari jarak minimum exact approach dan robust
estimation approaches. Pendekatan pasti atau exact approach
menganggap setiap titik di-ekstract dianggap mempunya pengaruh
yang sama pada diskripsi garis. Contoh dari Exact approach
adalah:
d1 yi (a 0 a1 x1)
N
2 2
i 1
76
Selanjutnya metode ini dilajutkan dengan perhitungan titik-titik yang
didapat dari (xi,yi) dengan menggunakan persamaan berikut:
1
A (X t X) Xt Y
Dimana 1 x
1 Y = [y1,y2,y3,….,yN ]t A= [a0,a1]t
X ... ....
1 x
N
77
iv. Setelah itu secara terpisah diurutkan dan nilai
satu disimpan sebagai nilai median dan yang
lai nsebagai parameter-parameter untuk
mempergrakan garis linier.
v. Metode ini dapat digunkan untuk
memperkirakan sebanyak 50 % titik yang
tidak tepat.
Shape (bentuk) adalah salah satu atribut yang penting untuk
mengenali sebuah objek. Pengenalan bentuk menjadi faktor yang
penting dalam pengenalan suatu objek. Sebuah representasi yang
baik akan dapat menggambarkan karakteristik intrinsik dari sebuah
shape secara eksplisit. Sebuah representasi shape yang bagus
harus dapat menggambarkan sebuah objek secara akurat sehingga
akan memudahkan menemukan bentuk asli sebuah objek setelah
objek tersebut telah direkonstruksi. Pada dasarnya bentuk sebuah
objek dapat direpresentasikan dalam bentuk karakteristik internal
dan eksternal. Pendekatan shape secara struktural merupakan
salah cara representasi shape yang umum digunakan pada metode
representasi shape pada morfologi.
78
pada objek tersebut terhubung. Secara taksonomi, ada beberapa
teknik dalam representasi shape yaitu dalam bentuk contours,
region, dan transforms. Contour-based sama dengan boundary-
based yaitu merepresentasikan shape berdasar boundary-nya.
Regionbased berdasar area dari suatu objek, sedangkan teknik
transform merepresentasikan shape dalam bentuk koefisien
transform, biasa menggunakan transformasi Fourier maupun
wavelet .
79
Gambar 3.13 (a) Contoh Shape , (b) Matrik Shape
80
dibagi menjadi m busur yang sama dengan sudut dθ = 360 / m
derajat.
Sedangkan untuk menentukan nilai-nilai elemen pada shape matrix
dijelaskan pada algoritma di bawah ini:
Buat matrik M dengan ordo m x n
For i = 0 to (n-1)
For j= 0 to (m-1)
If titik dengan koordnar polar
(i.L/(n-1), j(360/m)
Berada di dalam shape
Then M(i,j) := 1
Otherwise M(i,j) :=0
81
BAB - 4
JENIS-JENIS CITRA DIGITAL
82
Citra indexed dikenal pula sebagai citra pseudocolor .
Citra ini merupakan array klas logika single , uint8, uint16
atau double yang nilai-nilai pikselnya di-indeks dalam peta
warna. Peta warna merupakan suatu array klas double m x 3
. Untukk array single atau double kisaran nilai integer dari
[1, p]. Sedangkan untuk array uint8, atau uint16 mempunyai
kisaran nilai [0, p-1]..
83
intentisitasnya. Untu untuk array single atau double ,
mempunyai kisaran nilai [0, 1]. Untuk uint 8, mempunyai
kisaran nilai dari [0,255]. Untuk uint 16, kisaran nilai adalah
dari [0, 65535]. Untuk int16, kisaran nilau dari [-32768,
32767].
84
Gambar 4.4. Contoh citra berwarna (RGB)
85
Pada saat kita mengkonversi jenis citra satu ke yang lain, sering
menghasilkan citra yang sedikit berbeda dengan citra asli.
Terdapat beberapa fungsi atau commad untuk konversi citra dlam
MatLab diantaranya: gray2ind, im2bw, ind2gray, rgb2gray, rgb2ind,
and mat2gray.
4.2.1 rgb2gray
Fungsi ini digunakan untuk mengubah citra berwarna (RGB)
menjadi citra gray scale. Rgb2gray digunakan untuk
menghilangkan komponen Hue dan Saturation dan tetap
menyimpan komponen Luminance. Contoh penggunakan command
ini adalah :
I = imread('monas.jpg');........... membaca citra yang bernama
monas.jpg
J = rgb2gray(I); ....................... Mengguba citra berwarna
monas ke citra grayscale
figure, imshow(I), figure, imshow(J); ........menampilkan citra
asli dan citra hasil
4.2.2 im2bw
Mengubah citra berwarna ke citra binary image. im2bw
menghasilak citra biner dari citra indek atau citra RGB , command
ini mengubah citra input ke dalam format garyscale (jika belum
berupa citra ntensitas) dan menggunakan thresholding untuk
86
mengubah citra grayscale ke citra biner. Output citra biner BW
mempunyainilai 1 (putih) dan 0 (hitam) untuk semua piksel. Contoh
penggunaan command ini dapat ditulis dibawah ini.
load pohon ............................memanggil citra yang bernama
pohon
BW = im2bw(X,map,0.4); ..... mengubah citra intensitas menjadi
citra hitam putih
imshow(X,map), figure, imshow(BW)....menampilkan citra asal
dan citra hasil
87
dianggap smadengan to 64.
[X,map] = gray2ind(BW,n) mengkonversi citar
biner BW menjadi citara indexed X. Sementara
n adalah ukuran dari colormap, gray(n). Jika n
diabaikan maka defaultnya sama dengan 2.
88
[X,map] = rgb2ind(RGB,n) mengubah citra RGB
kedalam citra indexed X dengan menggunakan
metode minimum variance quantization. map
terdiri paling banyak n warna. n harus kurang atau
sama dengan 65536.
89
menjadi citra intensitas I. matrix I yang didapat
berisi nilai-nilai dengan kisaran 0.0 (hitam)
sampai 1.0 (putih atau intentas penuh). amin dan
amax nilai nilai-nilai didalam A yang sesuai
dengan 0.0 dan 1.0 in I.
90
BAB - 5
5.1 Tekstur
Fitur tekstur merupakan suatu karakteristik atau sifat yang dimiliki
oleh citra , tekstur juga dianggap sebagai sifat kontekstual
sehingga untuk mendifinisikanya mencakup nilai-nilai gray level
dengan nilai piksel tetangganya. Ukuran atau size dari piksel
tertangga tergantung pada tipe teksturnya, sehingga tekstur dapat
dideinisikan sebagai:
Teksture merupakan distribusi spatial dari nilai gray level,
sehingga merupakan histogram 2D atau dua matriks yang
dapat dianalisa dengan teksture analysis tool.
91
Tekstur dalam suatu citra dapat sebagai perbedaan dua
level resolusi suatu citra
92
akurat tapi algoritma cuup efisien. Perhitungan ini dapat
digunakan untuk klasifikasi citra dan segmentasi citra.
93
Dimana Fmagdir adalah histograms yang telah dinormalisasiakn
dari gradient magnitudes and gradient directions .
94
Dari C dapat dihitung N , Normalisasi co-occurrence matrix, dimana
setiap nilai dibagi dengan jumah semua nilai.
Fitur Co-occurrence
Energy N d2 (i, j )
i j
Contras (i j ) 2 N d (i, j )
i j
N d (i, j )
Homogenety
i j 1 i j
Correlatio n
i j
(i i )( j j ) N d (i, j )
i j
Dimana μiμj adalah mean dan σiσj adalah standar deviasi dari
baris dan kolom. Energy digunakan untuk menghitung homogenitas
dari matrik yang telah dinormalisasi. Fitur tekstur merupakan dapat
juga ditentukan dengan menggunakan filyter Gabor. Dari
penelitian-penelitian yang sudah dilakukan fitur ini sangan handal
95
dalam menentukan informasi suatu citra bila digabungkan dengan
fitur warna.
a B
Gambar 5.2. (a) Citra camera, (b) citra hasil pendeteksian seluruh tepi
5.3 Warna
Seperti yang telah dijelaskan dalam bab 2, warna merupakan fitur
yang sangat sering digunakan dalam analisa citra digital. Ekstraksi
warna dari citra berwarna merupakan proses pengekstrakan satu
atau beberapa daerah yang saling berhubungan (memiliki kriteria
96
keseragaman/ homogenitas) dari suatu citra, yang diperoleh
berdasakan fitur pada komponen spektral. Komponen-komponen ini
didefinisikan dalam model ruang warna. Selanjutnya proses ini
dapat ditingkatkan berdasarkan pengetahuan tambahan mengenai
obyek yang ada dalam citra, seperti geometrik atau properti optikal
lainnya. Dalam analisa citra otomatis, warna merupakan deskriptor
yang sangat berguna, yakni untuk menyederhanakan proses
identifikasi dan ekstraksi obyek. Misalnya jika kita ingin mempartisi
citra berdasarkan warnanya, maka kita dapat melakukannya pada
setiap lapisan warna (baik pada HLS atau RGB).
Fitur bentuk dari suatu citra digital dapat ditentukan oleh tepi atau
besaran momentnya. Besaran moment pada fitur ini banayak
97
digunakan oleh banyak peneliti dengan memanfaatkan nialai
transformasi fourier citra. Proses yang dapat diguanakan untuk
menentukan fitur bentuk diantaranya edge detection atau deteksi
tepi, thresholding, segmentasi dan perhitung moment (sepertti
mean, median dan stnadard deviasi dari setiap lokal citra)
98
BAB - 6
JPEG DAN JPEG2000
6.1 JPEG
Joint Photographic Experts Group (JPEG) merupakan skema
kompresi file bitmap. Awalnya, file yang menyimpan hasil foto digital
memiliki ukuran yang besar sehingga tidak praktis. Dengan format
baru ini, hasil foto yang semula besar dapat dimampatkan menjadi
kecil.
99
Dalam lossy cokmpression Coding citra digital dikerjakan dengan
beberapa langkah , yaitu:
i. dibagi-bagi dalam sub-citra atau blok 8 x 8 dan diproses
dari kiri ke kanan , atas ke bawah
ii. Level shifting, yaitu setiap sub-citra atau blok dikurangi
dengan 2n-1 dimana 2n adalah jumlah gray scale yang
digunakan
iii. Hitung koefisien DCT untuk setiap sub-citra
iv. Kuantisasi setiap DCT
a. Bagi dengan matrik normal
b. Hasilnya dibulatkan dengan rumus berikut:
T (u, v)
T (u, v) DCT{ f ( x, y ), T (u, v) round
Z (u, v)
100
b. Koefisien AC : Merupakan nilai yang bukan nol dari
koefisien AC dan jumlah keoefisien yang bernilai
nol yang mendahukui nilai bukan nol AC yang
dihitung. EOB dan 16 kode yang bernilai nol yang
mengikuti mempunyai kode-kode sub-citra (=blok)
101
DCT Kuantisasi
ZIG-ZAG
CODING
102
DICT Level shift back
103
DCT dikerjakan dengan membagi citra dalam blok-blok 8x8, dimana
x dan y adalah ideks suatu citra sementara u dan v menunjukan
indeks dari koefisien DCT. Sebelum DCT dikerjakan koefisien di-
scale dengan menggunakan titik tengah dari range yang sudah ada.
1
1Cu 72 7 ( 2 x 1)u (2 y 1)v
F (u , v) Cu Cv f ( x, y ) cos cos
Untuk u = 0, makax Cu
4
0 y 0= 1 sebalik Cu=0 jika u ≠ 0. Sedangkan
16 16
64
operasi untuk setiap koefisien DCT dapat dihitung dengan:
1
Cv
2
104
karena kehilangan informasi sulit diketahui pada saat
normalisasi.
Kuantisasi
105
Modified Huffman Coding
Format file JPEG adalah yang paling canggih yang tercatat di awal.
Ini mencapai rasio kompresi yang sangat baik bagi sebagian besar
jenis citra, biasanya 30:1 pada saat true color. Teknik kompresi
106
yang digunakan oleh JPEG dimulai dengan warna subsampling
psychovisual dan kuantisasi. DCT kompresi ini kemudian diterapkan
ke satu 8 x 8 blok pada waktu dan komponen frekuensi tidak
penting domain dieliminasi. Akhirnya sisa komponen dikodekan
secara optimal menggunakan Huffman coding. Sayangnya metode
kompresi beroperasi perlahan dan juga sangat sulit untuk
dilaksanakan. Namun, chip VLSI yang tersedia yang dapat
melakukan coding JPEG sangat cepat di hardware. Kelompok
JPEG kerja juga telah menempatkan encoding dan decoding
perangkat lunak dalam domain publik.
107
palet warna (8 bit per piksel) dan efisiensi data true color (24 bit per
piksel).
Huffman Coding
108
saja pola-pola ini sedikit harus dirancang sehingga panjang mereka
dapat diidentifikasi ketika bit tream diekstrak.
Untuk menyederhanaan kita akan mengcitrakan Huffman Coding
untuk citra 1024 768 x terdiri dari hanya 8 tingkat intensitas. Jika
setiap piksel disimpan sebagai integer 3-bit maka citra terkompresi
akan menempati Kbits 2304 (288 Kbytes). Misalkan intensitas piksel
didistribusikan seperti terlihat pada tabel berikut. Frekuensi
dinyatakan sebagai persentase dari jumlah total untuk kemudahan
(misalnya 40% dari semua piksel memiliki intensitas dari 2).
Tabel 6.2 . Hufman coding
Intensitas Frekwensi (%) Kode Baku Kode Piksel Hufman
0 0 000 -
1 10 001 011
2 40 010 1
3 6 011 01010
4 10 100 0100
5 4 101 01011
6 30 110 00
7 0 111 -
Dua kolom terakhir dari tabel di atas menunjukkan kode biner 3-bit
dari nilai piksel asli dan variabel panjang kode Huffman yang akan
menggantikan mereka dalam bit stream dikemas. Intensitas yang
paling sering dikompresi dari 3 bit untuk 1 bit sedangkan yang
paling sering diperluas untuk 5 bit (nilai-nilai yang tidak pernah
109
terjadi diabaikan). Kita bisa bekerja di luar rata-rata jumlah bit yang
diperlukan untuk mewakili setiap piksel dari frekuensi berhubungan
dengan setiap panjang kode Huffman. 40% dari piksel yang
disimpan dalam 1 bit, 30% dalam 2 bit, 10% dalam 3 bit, 10% pada
4 bit dan 10% dalam 5 bit. Hal ini memberikan rata-rata 2,2 bit /
piksel yang setara dengan penurunan 27% atau 77 Kbytes untuk
seluruh citra. (Perhatikan bahwa sejumlah kecil memori juga
diperlukan untuk mencatat tugas kode Huffman.) Huffman Coding
bekerja lebih baik untuk citra yang mengandung tingkat intensitas
lebih.
LZW coding bekerja dengan mencari urutan umum dari nilai dalam
data. Sebuah tabel nilai setiap piksel. Ketika urutan baru ditemukan
110
itu diberi nilai kode dan ditambahkan ke tabel. Ketika sebuah urutan
yang dikenal ditemui lagi maka hanya nilai kode yang perlu
dikelurakan. Pendekatan ini bekerja baik pada kebanyakan citra.
Arithmetic coding
Arithmetic coding adalah teknik kompresi lossless yang paling
efisien. Seperti Huffman Coding, arimetic coding juga menggunalan
metode statistik berdasarkan frekuensi yang masing-masing dengan
nilai piksel yang ada . Namun, proses encoding cukup berbeda
dengan Huffman. Aricmetic decoding dikerjakan dengan mengganti
setiap nilai piksel dengan pola bit tertentu, seluruh citra dikodekan
sebagai angka multi-presisi tunggal. Berturut-turut nilai piksel
digabungkan deret hitung dengan cara yang dapat memerlukan
waktu kurang dari satu bit untuk mewakili nilai-nilai yang paling
sering muncul. Hal ini memungkinkan untuk mencapai rasio
kompresi hingga 100:1. Sayangnya pengkodean aritmatika sangat
sulit untuk dilaksanakan. Metode ini telah dipatenkan oleh IBM ,
sehingga penggunaannya juga harus ada izin dari IBM.
6.6 Lossless Compression
Kompresi Lossless merupakan metoda kompresi data yang
memungkinkan data asli dapat disusun kembali dari data hasil
kompresi maka rasio kompresi pun tidak dapat terlalu besar untuk
memastikan semua data dapat dikembalikan ke bentuk semula.
111
Metode Lossless menghasilkan data yang identik dengan data
aslinya.Kompresi lossless utamanya digunakan untuk pengarsi
pan, dan penyuntingan. Untuk keperluan pengarsipan seperti
catatan bank, artikel text, dll.
Lossless data kompresi adalah kelas dari algoritma data kompresi
yang memungkinkan data yang asli dapat disusun kembali dari data
kompresi, sedangkan Lossy kompresi adalah suatu metode untuk
mengkompresi data dan men-dekompresi-nya. Losless
compression digunakan untuk mengkompresi data untuk diterima
ditujuan dalam kondisi asli. Sedangkan lossy compression
menghasilkan file kompresi yang lebih kecil dibandingkan dengan
metode lossless yang ada. Lossless compression digunakan jika
akurasi data sangat penting, sedangkan lossy
compression biasanya membuang bagian-bagian data yang
sebenarnya tidak begitu berguna dan tidak dirasakan oleh kita
sehingga masih beranggapan bahwa data tersebut masih bisa
digunakan walaupun sudah di kompresi.
Lossless compression biasanya data yang telah dikompresi
ukurannya sama atau lebih besar, sedangkan lossy compression
biasanya data yang telah dikompresi berukuran lebih kecil dari
ukuran asli, namun masih tetap memenuhi syarat untuk digunakan.
112
Rasio kompresi pada lossless didapat cenderung rendah
sedangkan rasio kompresi pada lossy didapat bisa sangat tinggi.
113
JPEG 2000 diperlukan untuk mengurangi kekurangan atau
kelemahan yang ada pada JPEG, JPEG 2000 diperlukan mengatasi
antara lain:
Kompresi Low bit-rate dibawah 0.25 bpp dimana JPEG
tidak menyediakan
Kompresi Lossless and lossy compression dalam satu
codestream.
Kompresi citra yang berukuran lebih dari 64 x 64 tetap
menggunkan tiling.
114
Skema encoder-decoder
Tiling
115
• Citra kemudian dibagi menjadi bagian-bagian yang
berbentuk epp (tidak overlap) dalam blok-blok atau tile
akan dipadatkan sendiri-sendiri.
2. DC-level shifting:
Codec mengharapakan input data mempunyai kisaran
dinamis antara (0 -- 255 -> -128 -- 128)
Jika nilai input sample merupakan bilangan unsigned, maka
nilai nominal dinamis disesuaikan dengan mengurangi
dengan nilai (2P-1 , dimana P adalah komponen presisi).
Semua operasi , termasuk komponen mixing, wavelet
transform, quantization and entropy coding dikerjakan
secara terpisah pada setiap tile yang ada di dalam citra.
Proses tiling mempengaruhi kualitas citra
116
Pengaruh Tiling terhadap Kualitas citra
Tiling Tidak di-Tiling Tiling dengan Tile dengan
ukuran ukuran
128 x 128 64 x 64
0.125 24,75 23,42 20,07
0,25 26,49 25,69 23,95
0,5 28,27 27,29 26,80
Komponen-komponen transformasi:
• Petakan data dari RGB to YCrCb (Y, Cr, Cb), perlu untuk
mengurangi korelasi antara komponen-komponen,
meningkatakan efesiensi coding. Terdapat transform
reversible and irreversible.
117
I0 (x, y) 2I1(x, y) I2(x, y)
Y0
4
Y 1( x, y) I2(x, y) - I1(x, y)
Y 2( x, y) I0(x, y) - I1(x, y)
118
BAB - 7
CONTENT BASED IMAGE RETRIEVAL
119
Pemahaman user terhadap kebutuhan dan information-seeking
behavior.
Identfikasi teknik yang cocok bagaimana menerjemahkan
content dari citra
Ekstrakting fitur citra awal (raw image)
Bagaimann menyediakan storage untuk databse citra yang
biasanya cukup besar
Maching citra query dan citra yang ada dalam database
Efesiensi
120
Dalam CBIR diperlukan image query, query citra dapat berupa citra
(image) disebut sebagai Query by Example (QBE), sketsa, dan
simbol. Dari macam query tersebut maka yang paling sering
digunakan query by Examle
7.2.1 Warna
Fitur warna merupakan fitur yang paling banyak digunakan dalam
pencarian citra (CBIR). Representasi dari fitur warna biayanya
diwakili dengan histogram warna. Warna merupakan fitur low-level
(low level feature) , hal ini disebabkan karena warna sangat peka
terhadap visual manusia dan berkaitan dengan model warna HVS.
7.2.2 Tekstur
Tekstur dapat merupakan sifat permukaan kasar atau halus ,
vertical atau horizontal. Tekstur dapat merupakan pattern dari
121
suatu citra seperti keteraturan dan granualit. Sementara itu tekstur
sendiri mempunyai fitur juga yaitu fitur statistic (
entropy,homogeneity, kontras) , wavelets, dan fractal. Tekstur
dapat juga didefinisikan sebagai frekuensi perubahan rona pada
citra atau pengulangan rona kelompok obyek yang terlalu kecil
untuk dibedakan secara individual). Tekstur sering dinyatakan
dengan kasar, halus, dan belang-belang. Contoh pengenalan obyek
berdasarkan tekstur:
122
dan klasifikasi citra. Untuk menganailsa tekstur suatu citra dapat
dilakukan sengan dua cara yaitu dengan pendekatan statistic dan
pendekatan stuktur.
123
Dimana adalah ke masukan dalam a gray-tone
spatial dependence matrix, dan Ng jumlah beda gray-levels dalam
kuantisasi citra. Salah satu kekurang co-occurrence matrix adalah
fitur yang telah diesktrak dan tidak harus berhubungan dengan
presepsi visual cira.
124
Penggunaan bentuk (shape) suatu objek merupaka tantangan yang
suit dalam bidang CBIR. Bentuk yang suatu objek memegang
peranan penting dalam pencarian atau searching citra yang mirip.
Penggunaan fitur bentuk dalam bidang image CBIR kurang
berkembang dibandingkan fitur warna dan tekstur hal ini karena fitur
bentuk memeliki kompleksitas yang tinggi disbanding fitur warna
dan tekstur. Khususnya region-region citra yang diwakili oleh objek
yang ditemukan untuk menjelaskan bentuk dari objek tersebut.
Query-by-Example
Seperti diketahui bahwa suatu citra mempunyai beberapa
karakteristik atau atribut yang dapat digunakan untuk keperluan
retrieval, atribut tersebut antara lain:
125
Foto emosi seseorang seperti senang, susah, dan stress.
Metadata seperti siapa yang mengambil foto, dimana, dan
kapan.
126
level reasoning tentang arti dan tujuan objek yang ada. Level ini
dapat dibagi menjadi :
a) Retrieval kejadia atau aktifitas contoh ―Cari gambar orang
sedang menari‖
b) Retriev gambar wajah dengan ekspresi emosi (―Cari gambar
wajah stress‖).
127
Perhitungan jarak untuk dalam CBIR berdasarkan kesamaan warna
dikerjakan dengan menghitung histogram warna untuk setiap pixel
yang didentifikasi pada nilai –nilai tertentu. Penelitian saat ini
tenatng fitur warna adalah dengan men-segmentasi proposi warna
dengan menggunakan s[atial relati0oonship diantara region warna.
128
teksture terletak dalam citra atau image. Tektur merupakan konsep
yang sulit dan kompleks, untuk mengidentifikasi
Yang dimaksud dengan fitur bentuk bukan bentuk dari citra tetapi
merupakan bentuk dari suatu bregion tertentu yang sedang dicari.
Fitur bentuk sering akann menetukan process apa yang akan
diterapkan segmentation atau edge detection ke dalam citra.
Metode yang lain seperti [Tushabe dan Wikinson, 2008] metode
filter bentuk untuk mengidentifikasi bentuk citra. Dalam banyak
129
penelitian deteksi bentuk yang akurat memerlukan campur tangan
manusia karena metode-metode seperti segmentasi sangat sulit
dikerjakan secara otomatis.
Fitur warna dikerjakan dengan menggunakan jarak histogram warna
yang mirip, perhitungan jarak histogram warna dapat dihitung
dengan menggunakan rumus:
dhist( I , Q) (h( I ) h(Q)) A(h( I ) h(Q))
Dimana h(I) adalah histogram database citra dengan K-bin,
sedangkan h(Q) adalah histogram citra query. Sementara A
merupakan matrik K x K . Berikut adalah langkah-langkah untuk
menghitung fitur tekstur, Jarak fitur tekstur dikerjakan tahapan:
Retrieve citra yang ada dalam region yang mempunyai
tekstur yang sama atau mirip dengan region disekitarnya.
• Kemudian Gridded (just like gridded color, but use texture).
• Histogram-based (e.g. compare the LBP histograms).
130
kemiripan dari pattern recognition yang dapat digunakan untuk
mengukur distance untuk, antara lain:
• Global Shape Properties Projection Matching,
• In projection matching, yaitu proyeksi horizontal
dan vertical dari suatu histogram.
• Boundary Matching dengan menggunakan Fourier
Descriptors DAN sudut dan sisi).
131
7.4 CBIR Dalam Compressed Domain
Berdasarkan standar kompresi JPEG, proses dekompresi yang
lengkap dapat diringkas sebagai: i. decoding entropi melalui tabel
Huffman, ii. dequantization untuk mendapatkan koefisien DCT, dan
iii. IDCT untuk merekonstruksi blok piksel. Untuk setiap sistem CBIR
yang bekerja dalam domain piksel, ini adalah syarat operasi atau
oprasi pendahuluan sebelum ekstraksi kunci dan matching distance.
132
133
BAB - 8
CBIR – MATCHING WAJAH
134
subspaces dengan kombinasi teknik eginfaces dan teknik-teknik
Fisher faces dan Tensor faces.
135
tantangan utama dalam pengenalan wajah, yaitu: variasi dalam
illumination dan pose. Kinerja dari teknik visual pengenalan wajah
adalah sangat sensitif terhadap variasi dan kondisi illumiation.
Eigenvector merupakan teknik perhitungan yang banyak digunakan
didalam pengenalan wajah yang pernah diperkenalkan oleh
Kohonen (Kohonen,1999) dengan menggunakan teknik jaringan
syaraf tiruan sederhana yang digunakan untuk normaslisasi citra
wajah. Lebih lanjut dinyatakan bahwa Eigenvector digunakan untuk
menghitung deskripsi wajah dengan memperkirakan korelasi
otomatis matrik eigenvector yang kemudian dikenal dengan
Eigenfaces.
Untuk pengenalan wajah dalam penelitian ini digunakan teknik
Eigenface matching yang telah diperkenalkan oleh Turk (Turk dan
Petland, 2006). Citra wajah dinormalisasi dari gallery dan kemudian
diproyeksikan kedalam similaritas eigenface seperti yang dapat
dilihat pada gambadibawah ini. Sementara itu untuk mencocokan
(matching) dengan citra wajah yang ada di dalam database atau
gallery maka digunakan perhitungan Euclidean distance, jika jarak
Euclidean sama dengan nol maka citra query akan sama persis
dengan citra yang ada di dalam database.
Karena wajah merupakan jendela atau merupakan bagian dari
kepala dan atau tangan yang menggambarakan emosi dan keadaan
136
hidup kita. Wajah merupaka fitur yang unik dari manusia, bahkan
orang kembarpun akan tetap berbeda walaupun wajahnya kelihatan
persis sama. Manusia dapat mendeteksi dan mengidentifikasi wajah
dengan pengetahuan dan pengalaman yang dimilinya atau dengan
alat bantu. Keahlian manusia untuk mengenali wajah dapat
dikerjakan dengan mudah walaupun penampakan wajah
dipengaruhi oleh ekspresi, umur, dan penghalang seperti kacamata
atau perubahan model rambut. Namun untuk mendeteksi wajah
dengan tepat terutama untuk wajah-wajah yang sama sekali baru
adalah tidaklah mudah dan banyak terdapat masalah-masalah yang
berhubungan dengan hal tersebut diatas, masalah-masalah
tersebut antara lain adalah: deteksi suatu model wajah, pengenalan
(recognition), analisa ekspresi wajah, dan klasifikasi berbasis fitur
fisik (Samal and Iyengar, 2002). Terdapat dua kemungkinan tugas
atau pekerjaan dalam sistem pengenalan wajah, yaitu: (i). MATCH
suatu citra wajah dari seseorang yang tidak dikenal dikumpulkan
dan didentifikasi, dan (ii). VERIFICATION – sebagai ganti dari
identfikasi seseorang, sistem ini melibatkan verifikasi dan
pengecekan citra wajah dalam suatu database yang relative kecil.
137
Pendeteksian dan pencarian objek-objek yang menyerupai wajah
dalah merupakan proses yang penting dalam system otomasi
pengenalan wajah atau face recognition (Hjelmas and Low, 2001;
Yang et.al., 2001). Untuk pengenalan wajah dan deteksi wajah,
maka daerah wajah berlu disegmentasi dari citra yang ada.
Sementara itu informasi tentang warna juga merupakan kunci untuk
deteksi wajah walaupun demikian pendekatan yang berbasis warna
sangat sulit dan komplek ditambah dengan background dengan
cahaya penyinaran yang berbeda pada waktu pengambilan foto
atau citra. Deteksi wajah dapat dipandang sebagai hal yang khusus
dari masalah pengenalan wajah (face recognition) yaitu klasifikasi
wajah dan bukan wajah.
Teknik pengenalan citra wajah dapat dikategorikan menjadi empat,
yaitu: Eigenfaces, Feature based, Hiden Markov Model, dan Neural
network berbasis algoritma. Hasil dari implementasi algoritma yang
berbeda dievaluasi pada database citra wajah yang berbeda pula,
Selanjutanya pengenalan wajah merupakan proses deteksi ada
database citra CMU dari Olivetti Research Laboratory face
database dan database dari MIT. Sementara itu terdapat banyak
sekali teknik biometric seperti sidik jari yang dapat digunakan untuk
identifikasi seseorang, namun pengenalan wajah tetap diperlukan.
Dalam banyak aplikasi seperti CCTV di tempat-tempat umum, maka
138
teknik tradisional seperti sidik jari tidak akan dapat digunakan,
karena kita tidak dapat meminta setiap orang untuk datang dan
mengecap jari nya (sidik jarinya). Oleh karena itu perlu suatu
sistem yang mirip dengan mata manusia dalam hal tertentu untuk
mengidentifikasi seseorang.
139
dinyatakan oleh Cox (Cox et.al, 2000) dan Geman (Geman et. al.,
2001)
Pengukuran similaritas atau kemiripan merupakan fokus dari
masalah pengenalan wajah khususnya di bidang computer vision
seperti masalah klasifikasi dan retrieval database citra digital.
Permasalah ini telah memotivasi penelitian-penelitian tentang CBIR
menjadi semaking berkembangluas (Smeulders et.al., 2000;
Tangelder dan Veltkamp, 2005). Lebih lanjut pencari\an citra pada
compressed domain dengan mengunakan banyak metoda telah
banyak dikerjakan dan memberikan hasil yang cukup memuaskan
dan efektif dibandingkan dengan pencarian dalam pixel domain
(Irianto dan Jiang, 2006; Irianto dan Jiang,2007; Irianto dan Jiang,
2008). Seperti telah banyak dibuktikan bahwa dengan level
pemadatan tertentu maka pencarian wajah memberikan hasil yang
justru lebih baik dibandingkan dengan pencarian di dalam
uncompressed domain.
Blackburn (Blackburn et.al, 2001) telah mencoba mengevaluasi
pengaruh citra wajah dengan format JPEG dalam penelitian
pengenalan wajah (face recognition), mereka membuat skenario
bahwa citra wajah yang telah diketahui dalam database (gallery)
dan dibuat dengan kondisi belum dipadatkan (uncompressed)
dengan citra yang tidak diketahui dan diambil dengan kondisi yang
140
tidak terkontrol dan dipadatkan (compressed) pada level tertentu.
Dalam penelitianya citra dipadatkan dengan level 0.8, 0.4, 0,25, dan
0.2 bpp. Mereka menyimpulkan bahwa pemadatan (compression)
tidak mempengaruhi akurasi pengenalan wajah secara signifikan,
pemadatan akan menjadi cukup berarti pada saat compression
mencapai 0.2 bpp. Akan tetapi mereka juga menyatakan bahwa
dijumpai peningkatan dalam akurasi pada beberapa rasio
pemadatan (ratio compression), sehingga direkomendasikan untuk
diadakan penelitian lebih lanjut tentang bagaimana pengaruh
compression terhadap pengenalan wajah (face recognition).
141
Dalam metoda ini digunakan citra umum (generap purpose images)
pada citra abu-abu (citra 8bit) yang biasanya memberikan informasi
yang kurang atau tidak lengkap dibandingkan dengan citra RGB
(color images). Satu hal lagi yang perlu dicatat bahwa database
yang digunakan adalah database citra umum seperti citra
pemandangan, citra model, citra binatang, dan citra mosaic.
Sementara itu hasil dari metoda Binary Texture memberikan
Precision sebesar 0.66. Satu teknik atau metoda lain yang pernah
diterapkan pada general purpose images adalah metoda
Orientation, dimana pertamakali Block didefinisikan sebagai model
dua tepi (edges) horizontal dan vertical. Fitur tepi horizontal dan
vertical dapat dibentuk dari dua dimensi koefisien DCT dari suatu
block. Fitur tepi dari matriks 8 x 8 dapat ditulis sebagai suatu set
atau himpunan:
Fitur Horisontal: H = {Hi: i=0, 1, 2,…, 7}
Vertical features: V = {Vj: j=0, 1, 2,…, 7}
Dimana Hi dan Vi adalah himpunan koefisien DCT C(u,v) untuk
u,v=0,1,2,…,7 dari persamaan koefisien DCT dua dimensi berikut
ini:
1 M 1 N 1
F 0,0 xi , j
MN i 0 j 0
142
2 M 1 N 1
( 2i 1)u ( 2 j 1)v
FU , V
MN
x
i 0 j 0
i, j cos
2M
cos
2N
Teknik berbasis Orientation atau tepi ini juga dikerjakan pada citra
umum dan pada grayscale images atau citra abu-abu 8 bit. Dari
penelitian dihasilkan bahwa efektivita teknik ini adalah 58.3 %
dengan kata lain nilai precisionya adalah sekitar 0.58. Dibandingkan
dengan metoda Binary Texture metoda ini kurang bagus dengan
kata lain metoda Binary Texture mempunyai efektifitas yang lebih
baik dibandingkan dengan metoda Orientation pada citra yang
sama (general purpose images dan citra grayscale).ata, satu
hidung, dan satu mulut dengan susunan atau layout yang hampir
mirip. Walaupun hal ini membuat klasifikasi dan pengenalan wajah
semakin sulit, tetapi akan memudahkan proses fitur ekstrasi (Leiba
et.al., 2005). Lebih lanjut suatu teknik yang berguna untuk untuk
ekstrasi fitur wajah dikemukan oleh Ferrari (Ferrari, et.al., 2006)
yang disebut sebagai proyeksi integral. Lebih lanjut dikemukakan
bahwa fitur-fitur yang harus menjadi perhitungan dalam deteksi
wajah adalah terdiri dari: (i). Mulut dan hidung diletakan dengan
menggunakan strategi yang sama. Pertamakali diperkirakan posisi
yang sebenarnya dengan menghitung proyeksi horizontal dari
143
gardien vertical untuk hidung dan mulut (garis diantara bibir yang
merupakan daerah yang gelap dibawah bibir), (ii). Alis mata, juga
dihitung dengan cara yang sama dengan mulut dan hidung, (iii).
Susunan atau outline wajah, digunakan pendekatan yang berbeda
untuk deteksi outline wajah. Untuk deteksi susunan wajah
digunakan program dinamis untuk mengikuti gradien intensitas dari
susunan wajah.
144
8.6 Rekayasa Pattern Posisi Anggota Tubuh Yang Mengalami
Gangguan Kejiwaan
145
8.7 Matching Kemiripan Untuk Deteksi Kelainan Jiwa
Untuk menghitung kemiripan (similarity) antara face image query
dengan citra posisi wajah dan anggota tubuh yang ada dalam
database secara langsung diperlukan biaya yang cukup mahal
dalam arti algoritma yang kompleks dan proses yang cukup lama.
Untuk mengatasi masalah ini, maka dalam penelitian ini dilakukan
tiga tahapan dalam matching citra posisi wajah dan anggota tubuh.
Pertama mencari kemiripan topologi posisi wajah dan anggota
tubuh query dengan citra dalam database yang merupakan filter,
kedua penggunaan informasi untuk memperbaiki calon citra yang
akan terpanggil, dan akhirnya metoda penghitungan matching
dikerjakan untuk menentukan kemiripan (similarity) antara image
query dengan citra posisi wajah dan anggota tubuh yang ada dalam
database. Dalam penelitian ini digunakan wajah normal dan
wajah dengan obstacles. Pengenalan posisi wajah dan anggota
tubuh wajah yang diduga mengalami gangguan jiwa dengan pose
TIDAK NORMAL dapat di-ilustrasikan dengan gambar 1 berikut ini.
146
Gambar 8.1. Sistem pengenala wajah yang diduga mengalami
gangguan jiwa TIDAK NORMAL (dengan obstacles)
147
8.8 Algoritma Modul Query Wajah Dan Matching
Aplikasi yang dihasilkan telah dapat digunakan untuk menngenali
wajah sesorang yang diduga mengalami gangguan jiwa. Dalam
tahapm ini juga GUI telah selesai 100 . Dalam penelitian ini kita
berhasil membagung algoritma yang cukup efektif dalam face
recognition pagi penderita gangguan jiwa , dimana precision dan
recall sebesar 0,67 dan 0,28. Adapu algorithma dari aplikasin ini,
dapat di jelaskan sebagai betikut:
1. Query citra wajah diduga stress
a. Input citra wajah diduga stress
b. Ubah citra RGB kedalam YCbCr dan HVS
2. Ekstrasi Fitur Statistik, dengan menghitung Eigenfaces
3. Hitun rata-rata matrik , dan kemudian dikuran gkan dari
citra awal dan disimpan dalam variable i
148
5. Hitung Eigenvector dan eigenvalue dari kovariant matrik,
Disini eigenvectors (eigenfaces) Ui dan nilai eigenya
(eigenvalues) i harus dihitung.
6. Kemudian pilih principal components citra wajah
Dari eigenvectors M (eigenfaces) ui, hanya M’ dipilih yang
mempunyai tertinggi nilai eigen value nya. Semakin tinggi
eigenvalue, maka semakin banyak fitur karakteristik dari
wajah yang diinformasikan. Eigenfaces denagn nilai
eigenvalue yang rendah dapat dibaikan . Setelah eigenface
M’ dan Ui ditentukan , maka tahapan training selesai.
7. Hitung kemiripan/matching citra query dan citra dalam
database, dengan menggunakan Euclidean Distance
149
Dalam laporan kemajuan ini kami juga belum dapat menghitung
efektifitas dari algoritma untuk menentukan wajah orang mengalami
gangguan jiwa belum dapat dilaksanakan , karena aplikasi belum
selesai 100%.
150
Gambar 8.3 . Snapshot Open Database Citra Wajah
151
Gambar 8.4. Snapshot Matching / Pencarian Citra Wajah
152
diharapkan efektifitas atau baik tidaknya algoritma atau teknik yang
kami buat untuk menentukan seseorang sedang mengalami stress
dennga akurat. Dari hasil sementara menunjukan bahwa efektifitas
pencarian atau matching gambar masih kurang dari 70%, hal
mungkin disebabkan karena jumlah citra perlu ditambah sampai
dengan sekitar 50.000 dan algoritma perlu diperbaiki.
153
BAB - 9
DETEKSI KEJIWAAN MANUSIA
DENGAN TEKNIK CBIR
154
Sementara itu umumnya penyebab gangguan jiwa atau yang
menyebakan ketidak normalan perilaku manusia adalah : keturunan
dan konstitusi, umur dan jenis kelamin, keadaan badaniah, keadaan
psikologik, keluarga, adat-istiadat, kebudayaan dan kepercayaan,
pekerjaan, pernikahan dan kehamilan, kehilangan dan kematian
orang yang dicintai, agresi, rasa permusuhan, hubungan antar
amanusia, dan sebagainya dikemukakan oleh Maramis pada tahun
1990 . Lebih lanjut dikatakan bahwa jumlah penderita gangguan
jiwa dari yang ringan sampai berat pada tahun 2020 akan mencapai
lebih dari 75.000.000 orang atau 1 dari setiap 4 manusia Indonesia
akan menderita sakit atau gangguan kejiwaan.
155
kamera digital dengan berbagai variasi jarak yang berbeda-beda
dan atau dengan tingkat penyinaran (britghness) yang berbeda-
beda pula. Oleh karena itu pengenalan ekspresi wajah atau face
expression recognition dapat dimanfaatkan untuk mendeteksi
kondisi kejiwaan atau kelainan jiwa seseorang sedini mungkin.
156
memperhatikan semua segi-segi dalam kehidupan manusia
dan dalam hubungannya dengan manusia lain.
157
seseorang didalam lingkungan waktu nyata dengan menggunakan
metoda hirarki citra wavelet dan skema guide coarse untuk
meningkatkan efektifitas pencarian dan pengenalan ekspresi citra
wajah.
158
skala yang bias. Topik pengenalan wajah masih menjadi tantangan,
terutama dalam didalam lingkungan yang tidak terkontrol . Pada
tahun 2007 Aldini dan peneliti lainya menyatakan bahwa terdapat
dua tantangan utama dalam pengenalan wajah, yaitu: variasi dalam
illumination dan pose. Kinerja dari teknik visual pengenalan wajah
adalah sangat sensitif terhadap variasi dan kondisi illumiation.
159
database atau gallery maka digunakan perhitungan Euclidean
distance, jika jarak Euclidean sama dengan nol maka citra query
akan sama persis dengan citra yang ada di dalam database.
160
citra wajah dari seseorang yang tidak dikenal dikumpulkan dan
didentifikasi, dan (ii). VERIFICATION – sebagai ganti dari identfikasi
seseorang, sistem ini melibatkan verifikasi dan pengecekan citra
wajah dalam suatu database yang relative kecil.
161
berbeda dievaluasi pada database citra wajah yang berbeda pula,
Selanjutanya pengenalan wajah merupakan proses deteksi ada
database citra CMU dari Olivetti Research Laboratory face
database dan database dari MIT. Sementara itu terdapat banyak
sekali teknik biometric seperti sidik jari yang dapat digunakan untuk
identifikasi seseorang, namun pengenalan wajah tetap diperlukan.
Dalam banyak aplikasi seperti CCTV di tempat-tempat umum, maka
teknik tradisional seperti sidik jari tidak akan dapat digunakan,
karena kita tidak dapat meminta setiap orang untuk datang dan
mengecap jari nya (sidik jarinya). Oleh karena itu perlu suatu
sistem yang mirip dengan mata manusia dalam hal tertentu untuk
mengidentifikasi seseorang.
162
domain yang lain, sebagai contoh pada citra-citra pakaian, rumah,
perabot rumah tangga, dan lukisan cat, mental face telah
merupakan aplikasi yang sangat ekstensif dikembangkan dalam
bidang-bidang keamanan, e-bisnis, dan teknologi web. Salah satu
contoh pencarian mental images yang cukup representaif telah
dinyatakan oleh peneliti-peniliti sebelumnya.
163
recognition), mereka membuat skenario bahwa citra wajah yang
telah diketahui dalam database (gallery) dan dibuat dengan kondisi
belum dipadatkan (uncompressed) dengan citra yang tidak
diketahui dan diambil dengan kondisi yang tidak terkontrol dan
dipadatkan (compressed) pada level tertentu. Dalam penelitianya
citra dipadatkan dengan level 0.8, 0.4, 0,25, dan 0.2 bpp. Mereka
menyimpulkan bahwa pemadatan (compression) tidak
mempengaruhi akurasi pengenalan wajah secara signifikan,
pemadatan akan menjadi cukup berarti pada saat compression
mencapai 0.2 bpp. Akan tetapi mereka juga menyatakan bahwa
dijumpai peningkatan dalam akurasi pada beberapa rasio
pemadatan (ratio compression), sehingga direkomendasikan untuk
diadakan penelitian lebih lanjut tentang bagaimana pengaruh
compression terhadap pengenalan wajah (face recognition).
164
dilakukan oleh Irianto dan Jiang, , semua koefisien dalam block
DCT hanya terdiri dari dua variabel 0 dan 1 yand didapat dari
koefisien DCT tetangga disekelilingnya (disebelah kirinya, kanan,
atas dan bawah).
165
Dimana Hi dan Vi adalah himpunan koefisien DCT C(u,v) untuk
u,v=0,1,2,…,7 dari persamaan koefisien DCT dua dimensi berikut
ini:
1 M 1 N 1
F 0,0 xi , j
MN i 0 j 0
2 M 1 N 1
(2i 1)u (2 j 1)v
FU , V
MN
x
i 0 j 0
i, j cos
2M
cos
2N
proses fitur ekstrasi (Leiba et.al., 2005). Lebih lanjut suatu teknik
yang berguna untuk untuk ekstrasi fitur wajah dikemukan oleh
Ferrari (Ferrari, et.al., 2006) yang disebut sebagai proyeksi integral.
Lebih lanjut dikemukakan bahwa fitur-fitur yang harus menjadi
perhitungan dalam deteksi wajah adalah terdiri dari: (i). Mulut dan
hidung diletakan dengan menggunakan strategi yang sama.
Pertamakali diperkirakan posisi yang sebenarnya dengan
menghitung proyeksi horizontal dari gardien vertical untuk hidung
dan mulut (garis diantara bibir yang merupakan Teknik berbasis
Orientation atau tepi ini juga dikerjakan pada citra umum dan pada
grayscale images atau citra abu-abu 8 bit. Dari penelitian dihasilkan
bahwa efektivita teknik ini adalah 58.3 % dengan kata lain nilai
precisionya adalah sekitar 0.58. Dibandingkan dengan metoda
Binary Texture metoda ini kurang bagus dengan kata lain metoda
166
Binary Texture mempunyai efektifitas yang lebih baik dibandingkan
dengan metoda Orientation pada citra yang sama (general purpose
images dan citra grayscale).ata, satu hidung, dan satu mulut
dengan susunan atau layout yang hampir mirip. Walaupun hal ini
membuat klasifikasi dan pengenalan wajah semakin sulit, tetapi
akan memudahkan daerah yang gelap dibawah bibir), (ii). Alis mata,
juga dihitung dengan cara yang sama dengan mulut dan hidung,
(iii). Susunan atau outline wajah, digunakan pendekatan yang
berbeda untuk deteksi outline wajah. Untuk deteksi susunan wajah
digunakan program dinamis untuk mengikuti gradien intensitas dari
susunan wajah.
167
dari wajah serta vector tekstur yang dinormalisasikan dengan
bentuk.
168
dibentuk dengan vektor masing-masing dan vektor-vektor
sebelumnya.
169
Gambar 9.1 Snapshot wajah gangguan jiwa
170
BAB - 10
CBIR UNTUK PENGENALAN
TINDAK KEJAHATAN
171
Fitur koefisien DCT akan di-ekstrak untuk membangun suatu
histogram yang selanjutnya digunakan untuk matching wajah
referensi (image query) dengan wajah yang ada di dalam database.
Sedangkan proses untuk memisahkan wajah dengan non wajah
dikerjakan dengan mengubah citra RGB dengan format JPEG ke
citra YCbCr dan ke HVS terlebih dahulu.
172
10.2 Content Based Image Retrieval dan JPEG
173
Kemudian setiap pixel dalam blok (Bi) diproses melalui
fungsi 2D Discrete Cosine Transform dan menghasilkan
blok-blok DCT (Bi*), dan setiap satu koefisien DC (yang
merupakan rata-rata intensitas dari semua blok) dan
koefisien AC yang banyaknya 63 pada setiap blok, dapat
diformulasikan sebagai berikut:
174
10.3 Pencarian Citra Wajah
Pencarian citra secara tradisional didasarkan pada query-by-
example (QBE) dimulai dari input citra kedalam sistem (query
image) yang dibandingkan dengan citra yang ada didalam
database, beberapa penelitian telah dibuat oleh para peneliti lain.
Dalam pencarian citra berdasarkan wajah, mereka menyatakan
bahwa standar image query dapat merupakan suatu mental image.
Lebih lanjut dikatakan bahwa fokus dari penelitian mereka adalah
dengan wajah, meskipun semua algoritma yang mereka
kembangkan dapat diaplikasikan pada domain yang lain, sebagai
contoh pada citra-citra pakaian, rumah, perabot rumah tangga, dan
lukisan cat, dan mental face yang merupakan aplikasi yang sangat
ekstensif dikembangkan dalam bidang-bidang keamanan, e-bisnis,
dan teknologi web. Salah satu contoh pencarian mental images
yang cukup representatif.
175
yang justru lebih baik dibandingkan dengan pencarian di dalam
uncompr.essed domain.
176
walaupun penampakan wajah dipengaruhi oleh ekspresi, umur, dan
penghalang seperti kacamata atau perubahan model rambut.
Namun untuk mendeteksi wajah dengan tepat terutama untuk
wajah-wajah yang sama sekali baru adalah tidaklah mudah dan
banyak terdapat masalah-masalah yang berhubungan dengan hal
tersebut diatas, masalah-masalah tersebut antara lain adalah:
deteksi suatu model wajah, pengenalan (recognition), analisa
ekspresi wajah, dan klasifikasi berbasis fitur fisik.
177
atau tool yang diharapkan dapat memberikan sumbangan yang
cukup berarti dalam pengenalan dan mencari pelaku tindak kriminal.
178
koefisien DC yang mewakili informasi energi, koefisien AC yang
mewakili informasi frekwensi, dan koefisien DCT yang mewakili
arah atau kecenderungan informasi tentang citra.
Analisa muka wajah secara tegak lurus atau profil dari muka sering
efektif tanpa partisipasi atau adanya knowledge sebelumnya.
Sementara itu untuk pencarian citra wajah digunakan algoritma
yang dapat dijelaskan sebagai berikut:
179
kegiatan yang sekaligus merupakan algoritma pengenalan wajah
wajah yang dibangun.
Fitur-fitur terpisah
180
Gambar 10.2. Diagram sistem retrieval pengenalan wajah
(Q i Ii )2
d(Q, I) i 0
M
181
Dimana Q merupakan citra wajah query dan I adalah vektor dari
fitur citra yang ada dalam database, sedangkan M merupakan
jumlah elemen yang ada dalam fitur citra. Sedangkan untuk
menghitung keefektipan (effectives) dari pencarian citra wajah
digunakan parameter precision dan recall yang dapat ditulis sebagai
berikut:
Semakin besar nilai dari precision dan recall, maka akan semakin
efektif metoda atau teknik pencarian yang digunakan, Precision
mempunyai nilai maksimum 1 dan minimum 0.
182
Tool yang dihasilkan dalam kegiatan penelitianya ini belum begitu
memuaskan dipandang dari sudah penampilan dan visualisasinya,
hal disebabkan karena keterbatasan yang ada. Walaupun begitu
metoda dari tool ini sudah cukup memuaskan dalam mengenali
wajah seseorarng yang kita cari (face recognition). Teknik atau
metoda pencarian dan pengenalan wajah kriminal dengan
memanfaatkan fitur-fitur gambar berwarna dengan format gambar
yang dipadatkan (JPEG) relatif cukup memuaskan dan efektif.
183
Efektifitas Pengenalan Wajah Kriminal
1,00
P 0,75
0,50
e 0,25
i 0,00
r
0,002
0,004
0,008
0,014
0,014
0,016
0,018
0,018
0,018
0,018
0,020
0,020
0,022
o
c
n
i Recall
s
184
database. Urutan atau algoritma teknik ini dapat dijelaskan sebagai
berikut:
1. Input wajah reference (image query)
2. Pemisahan wajah, dimana input citra wajah RGB di ubah ke
citra YCbCr dan HVS, sehingga didapat calon wajah (face
candidate) yang akan dicari.
3. Generate key indexing dari fitur koefisien DCT dengan
membangun suatu histogram dari 2D Matrix citra wajah,
yaitu dengan menghitung:
I (image query atau wajah referensi), sebagai
berikut:
H(i) = { h0,h1,h2,…,h63}, dan
hi = ∑
Q(u,v) adalah koefesien Citra pada baris u
dan kolom v.
4. Seperti langkah ke 3, untuk citra wajah dalam database.
H(i) = { h0,h1,h2,…,h63}, dan
hi = ∑
d(u,v) adalah koefesien Citra pada baris u
dan kolom v.
5. Hitung similaritas (kemiripan) antra citra referensi dengan
citra yang ada dalam database, dengan rumus :
185
√∑
186
8. Untuk query image (wajah referensi berikuitnya) kembali
ulabgi langkah 1 – 8.
187
DAFTAR PUSTAKA
.
Adini, Y., Y. Moses, and S. Ullman. 1997. Face Recognition: The
problem of compensating for changes in illumination direction. IEEE
PAMI, 19(7), pp..721-732.
Cox. I.J, M.L. Miller, and T.P. Minka, T.V. Papathomas, and P.N.
Yianilos.2000. ―The Bayesian Image Retrieval System, PicHunter:
Theory, mplementation, and Psychophysical Experiments,‖ IEEE
Trans. Image Processing, Vol. 9, No. 1, 2000, pp.20–37
Cox. I.J, M.L. Miller, and T.P. Minka, T.V. Papathomas, and P.N.
Yianilos,2000, ―The Bayesian Image Retrieval System, PicHunter:
Theory, mplementation, and Psychophysical Experiments,‖ IEEE
Trans. Image Processing, Vol. 9, No. 1,pp.20–37.
188
descriptions, segmentation techniques and image ontology for
image retrieval in the compressed domain. Ph.D Thesis, University
Of Bradford, United Kingdom.
189
Liu. C.T, P.-L. Tai, A. Y.-J. Chen, C.-H. Peng dan J.-S. Wang, ―A
content{based medical teaching _le assistant for CT lung image
retrieval‖, Proceedings of the IEEE International Conference on
Electronics, Circuits, Systems (ICECS2000), Jouneih,Kaslik,
Lebanon,
190
Shapiro. G, Linda dan George C. Stockman. 2007. Computer
vision, Prentice Hall, Upper Saddle River, New Jersey, 2001, hal. 27
191
192
193
194
195