Benvenuto in Scribd!

Salta carosello

Fingerprinting

Caricato da

Raluca Ene

Il 0% ha trovato utile questo documento (0 voti)

47 visualizzazioni22 pagine

fingerprinting audio

Copyright

Formati disponibili

PDF, TXT o leggi online da Scribd

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Segnala questo documento

fingerprinting audio

Copyright:

Formati disponibili

Scarica in formato PDF, TXT o leggi online su Scribd

Segnala contenuti inappropriati

Il 0% ha trovato utile questo documento (0 voti)

47 visualizzazioni22 pagine

Fingerprinting

Caricato da

Raluca Ene

fingerprinting audio

Copyright:

Formati disponibili

Scarica in formato PDF, TXT o leggi online su Scribd

Segnala contenuti inappropriati

Salta alla pagina

Sei sulla pagina 1di 22

Cerca all'interno del documento

MASK: Robust Local Features for

Audio Fingerprinting
Xavier Anguera, Antonio Garzn and
Tomasz Adamek
Telefonica Research

Outline

What is audio fingerprinting

MASK proposal
Experiments
Conclusions

?
watermarking

fingerprinting

What makes a good audio

fingerprint?

Discriminability

Robustness

MASK
FIngerprint

Compactness

Efficiency

MASK == Masked Audio Spectral Keypoints

Considered prior art

Avery Wang, An industrial strength audio search
algorithm, in Proc. ISMIR, 2003.
Jaap Haitsma and Antonius Kalker, A highly robust
audio fingerprinting system, in Proc. ISMIR, 2002.
Shumeet Baluja and Michele Covell, Waveprint:
Efficient wavelet-based audio fingerprinting, Proc.
Pattern Recognition 41 (2008)

10ms, 100ms Hamming window

FFT 1024, bandwidth

limited to 300-3KHz

18 or 34 MEL-spectrum bands

Selection of salient spectral points

Mel
spectrum

1. Detect all maximas

2. Trim to the desired
number

( t) 2
T hr [n] = E [n 1] exp
2 2
where t is the distance (in frames) between the prev
peak and the considered peak, E [n
1] is
the energy o
=0.98
=40
previously selected peak and , are two parameters use
set the threshold falling rate and its width, respectively. In
proposed implementation we set them to 0.98 and 40 fol
ing a similar implementation used in the Shazam ngerp
by Dan Ellis1.
t

(beautiful, Timit-female)

time

2.3. Spectr ogram Masking Around Salient Points

Once the salient points have been selected we apply a m

Spectral masking around salient points

S > S b[n] =1
i
j

otherwise b[n] = 0

Spectral Regions
Include one or several timefrequency values
Overlaps are allowed
The number of comparisons
defines the size of the fingerprint
Designed manually (for now)

Current MASK regions

19 frames = 190ms

5 MEL bands

Fingerprint encoding

4-5 bits for the MEL band where the maxima is

located
22 Bits obtained from spectral regions comparison

Indexing and retrieval

Reference inverted file index
01100
00101

10011

MASK FP

(movie1, 10); (movie6, 4); (movie9, 1) ; (movie7, 34)

(movie5, 35); (movie7, 80)

(movie9, 24); (movie3, 5); (movie8, 11)

Exact
matching

DDBB

Content
ID

Time
offset

-Nq
Nq

QUERY MASK
0->01100
1->10011

13->11101
14->01101
15->00010

Hamming > 4 -> 0

Hamming < 4 -> 1

Matching
segment start

Final score

Matching
Segment end

Experimental section

database
NIST-TRECVID 2010-2011 data for video-copy detection
400h reference videos
1400 audio queries per year (201 unique videos X 7)
7 audio transformations

original
MP3 compression
MP3 compression + multiband companding
Bandwidth limit (500-3K) + single-band companding
Mixed with speech
Mixed with speech + multiband companding
Mixed with speech + bandwidth limit + monoband companding

Metric & baseline

normalized detection cost rate (NDCR) in
balanced profile
NDCRBALANCED = PMISS + 200RFA

Compare results with a similar fingerprint to

the Philips fingerprint
Jaap Haitsma and Antonius Kalker, A highly robust audio fingerprinting system, in Proc.
International Symposium on Music Information Retrieval (ISMIR), 2002.

Comparison per transformation

Scores histogram

Conclusions
A novel binary fingerprint is proposed to
improve on some shortcomings from well
reputed prior art.
We show that we can extract the FP and use it
for VCD with excellent results

Potrebbero piacerti anche

Virtualization Questionnaire Template
Documento9 pagine
Virtualization Questionnaire Template
Lakshminarayana Mg
Nessuna valutazione finora
Presentation Slides
Documento13 pagine
Presentation Slides
nguyen hung
Nessuna valutazione finora
PESQ - Perceptual Evaluation of Speech Quality: Principle
Documento2 pagine
PESQ - Perceptual Evaluation of Speech Quality: Principle
Charaka Chathuranga Vithana
Nessuna valutazione finora
Improved Noise Discrimination For An Ammonia Tank AE Test: Specialist NDT Services
Documento28 pagine
Improved Noise Discrimination For An Ammonia Tank AE Test: Specialist NDT Services
Gonzalo Tellería
Nessuna valutazione finora
Speech Coders For Wireless Communication
Documento53 pagine
Speech Coders For Wireless Communication
Vikas Ps
Nessuna valutazione finora
OmniScan X3 EN 202307 Web
Documento8 pagine
OmniScan X3 EN 202307 Web
jonathantaylor2011
Nessuna valutazione finora
Ultra Low-Power ANSI S1.11 Filter Bank For Digital Hearing Aids
Documento7 pagine
Ultra Low-Power ANSI S1.11 Filter Bank For Digital Hearing Aids
Suverna Sengar
Nessuna valutazione finora
Emccd Camera
Documento4 pagine
Emccd Camera
Jongsoo Kim
Nessuna valutazione finora
2021 ELF 10000 - Flyer 1
Documento1 pagina
2021 ELF 10000 - Flyer 1
Zhang zhensheng
Nessuna valutazione finora
Speaker Recognition System Using MFCC and Vector Quantization
Documento7 pagine
Speaker Recognition System Using MFCC and Vector Quantization
lambanaveen
Nessuna valutazione finora
07 - Al Walker - Applications in Live Convert Sound PDF
Documento33 pagine
07 - Al Walker - Applications in Live Convert Sound PDF
Francesco Altieri
Nessuna valutazione finora
This Item Is The Archived Peer-Reviewed Author-Version of
Documento4 pagine
This Item Is The Archived Peer-Reviewed Author-Version of
Rahul Subramonian Bama
Nessuna valutazione finora
Lecture 4 - WDM Networks
Documento15 pagine
Lecture 4 - WDM Networks
Abhishek Srivastava
100% (1)
PCTEL MXflex Scanning Receiver Brochure Web
Documento6 pagine
PCTEL MXflex Scanning Receiver Brochure Web
Bảo Hân Nguyễn
Nessuna valutazione finora
Telecommunications and Signal Processing at UT Austin
Documento22 pagine
Telecommunications and Signal Processing at UT Austin
arjun
Nessuna valutazione finora
Ampex Recording Theory
Documento121 pagine
Ampex Recording Theory
Kevin Haworth
100% (1)
Dual-Tone Multiple Frequency (DTMF) Detector Implementation
Documento8 pagine
Dual-Tone Multiple Frequency (DTMF) Detector Implementation
Vibhav Kumar
Nessuna valutazione finora
Demon Analysis PDF
Documento21 pagine
Demon Analysis PDF
Bùi Trường Giang
100% (1)
Toward A Blurry Rasterizer: Jacob Munkberg
Documento52 pagine
Toward A Blurry Rasterizer: Jacob Munkberg
yurymik
Nessuna valutazione finora
Fundamentals of Digital Signal Processing: Dr. D. K. Mohanta
Documento48 pagine
Fundamentals of Digital Signal Processing: Dr. D. K. Mohanta
Kalamchety Ravikumar Srinivasa
100% (1)
Ijacst04742018 PDF
Documento4 pagine
Ijacst04742018 PDF
kaushik
Nessuna valutazione finora
SAWFilter PDF
Documento350 pagine
SAWFilter PDF
Cube7 Geronimo
Nessuna valutazione finora
Analysis of Feature Extraction Techniques For Speech Recognition System
Documento4 pagine
Analysis of Feature Extraction Techniques For Speech Recognition System
sridharchandrasekar
Nessuna valutazione finora
Technical Specifications For Spectrum 100 FT-IR Spectrometer
Documento4 pagine
Technical Specifications For Spectrum 100 FT-IR Spectrometer
besbes12345
Nessuna valutazione finora
Agilent Wirescope 350 - 5971-6109
Documento2 pagine
Agilent Wirescope 350 - 5971-6109
Rodriigo Saa
Nessuna valutazione finora
A Self-Steering Digital Microphone Array: At&T NJ, Usa
Documento4 pagine
A Self-Steering Digital Microphone Array: At&T NJ, Usa
Mayssa Rjaibia
Nessuna valutazione finora
DLA Probe EN 202311 Web
Documento4 pagine
DLA Probe EN 202311 Web
ERO
Nessuna valutazione finora
Solutions: Cardiff Cardiff University Examination Paper
Documento15 pagine
Solutions: Cardiff Cardiff University Examination Paper
Khan Muhammad Zaid
Nessuna valutazione finora
Wang 2010
Documento6 pagine
Wang 2010
manishscry
Nessuna valutazione finora
Speech Analysis in Search of Speakers With MFCC, PLP, Jitter and Shimmer
Documento4 pagine
Speech Analysis in Search of Speakers With MFCC, PLP, Jitter and Shimmer
Luis Carlos Espeleta
Nessuna valutazione finora
Voice Recognition Using MFCC Algorithm
Documento4 pagine
Voice Recognition Using MFCC Algorithm
Nguyễn Đình Nghĩa
Nessuna valutazione finora
Codes TFM Webinar-DS
Documento96 pagine
Codes TFM Webinar-DS
Thành Trịnh
Nessuna valutazione finora
Aries Vibrometer Vela
Documento2 pagine
Aries Vibrometer Vela
Manel Montesinos
Nessuna valutazione finora
Report On Project 1 Speech Emotion Recognition
Documento10 pagine
Report On Project 1 Speech Emotion Recognition
archana kumari
Nessuna valutazione finora
Digital Instantaneous Frequency Measurement Techni
Documento35 pagine
Digital Instantaneous Frequency Measurement Techni
Hongdang Dinh
Nessuna valutazione finora
Investigation of Signal Thresholding Effects On The Accuracy of Sound Source Localization
Documento6 pagine
Investigation of Signal Thresholding Effects On The Accuracy of Sound Source Localization
IJAR JOURNAL
Nessuna valutazione finora
LAVOCE WAF124.01 12in WOOFER E.A
Documento1 pagina
LAVOCE WAF124.01 12in WOOFER E.A
wahyudi hidayat
Nessuna valutazione finora
A Comparative Simulation of Mobile WiMAX Physical PDF
Documento14 pagine
A Comparative Simulation of Mobile WiMAX Physical PDF
Abdelhakim Khlifi
Nessuna valutazione finora
Easy Does It: Robust Spectro-Temporal Many-Stream ASR Without Fine Tuning Streams
Documento28 pagine
Easy Does It: Robust Spectro-Temporal Many-Stream ASR Without Fine Tuning Streams
Jom Kantapon
Nessuna valutazione finora
Gauss Meter & EMC Spectrum Analyzer Series SPECTRAN 50xx
Documento11 pagine
Gauss Meter & EMC Spectrum Analyzer Series SPECTRAN 50xx
Alexandra Cocean
Nessuna valutazione finora
tms-4 Eng
Documento4 pagine
tms-4 Eng
Pegah_m
Nessuna valutazione finora
Speaker Authentication: KARTIK PAL (131029) UPASANA (131093) Arun Pratap Singh (131014)
Documento17 pagine
Speaker Authentication: KARTIK PAL (131029) UPASANA (131093) Arun Pratap Singh (131014)
Kartik Pal
Nessuna valutazione finora
GE Weldstar PDF
Documento4 pagine
GE Weldstar PDF
James
Nessuna valutazione finora
A Comprehensive Analysis of Voice Activity Detection Algorithms For Robust Speech Recognition System Under Different Noisy Environment
Documento6 pagine
A Comprehensive Analysis of Voice Activity Detection Algorithms For Robust Speech Recognition System Under Different Noisy Environment
vol1no2
Nessuna valutazione finora
97 PDF
Documento7 pagine
97 PDF
International Journal of Scientific Research in Science, Engineering and Technology ( IJSRSET )
Nessuna valutazione finora
Ultrasound Beam Fromation 2009
Documento13 pagine
Ultrasound Beam Fromation 2009
scuby660
Nessuna valutazione finora
ACUPRO Version 4: Measurement of Acoustical Properties of Materials and Systems
Documento18 pagine
ACUPRO Version 4: Measurement of Acoustical Properties of Materials and Systems
Anonymous 4Pq2vhjWLV
Nessuna valutazione finora
EXFO Spec-Sheet AXS-110 v3 en
Documento3 pagine
EXFO Spec-Sheet AXS-110 v3 en
Huy Du
Nessuna valutazione finora
EEE 420 Digital Signal Processing: Instructor: Erhan A. Ince E-Mail
Documento19 pagine
EEE 420 Digital Signal Processing: Instructor: Erhan A. Ince E-Mail
gtgreat
Nessuna valutazione finora
Test Equipment Solutions Datasheet
Documento37 pagine
Test Equipment Solutions Datasheet
Senoara Susan
Nessuna valutazione finora
Technology Design Focus Scan Data Sheet2
Documento2 pagine
Technology Design Focus Scan Data Sheet2
jcarbajal2013
Nessuna valutazione finora
DSP - Student (Without Bonafide)
Documento50 pagine
DSP - Student (Without Bonafide)
Santhoshkumar R P
Nessuna valutazione finora
10 Natural Language Processing
Documento4 pagine
10 Natural Language Processing
hardik
Nessuna valutazione finora
DSP Assignment Test
Documento1 pagina
DSP Assignment Test
rcherr
Nessuna valutazione finora
How To Overcome EMI Problems Clock Generators 08-31-2010
Documento30 pagine
How To Overcome EMI Problems Clock Generators 08-31-2010
Raghu Nathan
Nessuna valutazione finora
Janusz Rajski Nilanjan Mukherjee: Mentor Graphics Corporation
Documento36 pagine
Janusz Rajski Nilanjan Mukherjee: Mentor Graphics Corporation
Puja Mazumdar
Nessuna valutazione finora
LAVOCE WAF123.01 12in WOOFER E.A
Documento1 pagina
LAVOCE WAF123.01 12in WOOFER E.A
wahyudi hidayat
Nessuna valutazione finora
Audio Fingerprinting Based On Normalized Spectral Subband Moments
Documento4 pagine
Audio Fingerprinting Based On Normalized Spectral Subband Moments
Zadaci Aops
Nessuna valutazione finora
Fast Multipole Boundary Element Method
Documento36 pagine
Fast Multipole Boundary Element Method
Hequn Min
Nessuna valutazione finora
OPM5 and OPM4 Optical Power Meters
Documento3 pagine
OPM5 and OPM4 Optical Power Meters
Gadi Huaman Flores
Nessuna valutazione finora
Software Radio: Sampling Rate Selection, Design and Synchronization
Da Everand
Software Radio: Sampling Rate Selection, Design and Synchronization
Elettra Venosa
Nessuna valutazione finora
Parallels RAS v16 5 Administrators Guide
Documento298 pagine
Parallels RAS v16 5 Administrators Guide
Lukman N Hakim
Nessuna valutazione finora
DataGrid Zend Framework - Manual
Documento14 pagine
DataGrid Zend Framework - Manual
Domingos Teruel
Nessuna valutazione finora
1 Propositional Logic - Axioms and Inference Rules
Documento22 pagine
1 Propositional Logic - Axioms and Inference Rules
Muhammad Abdullah
Nessuna valutazione finora
EFY-Top100 Oct09 PDF
Documento15 pagine
EFY-Top100 Oct09 PDF
Enoch L S
Nessuna valutazione finora
Software Architecture ATM Example PDF
Documento3 pagine
Software Architecture ATM Example PDF
Lê Quốc Huy
Nessuna valutazione finora
Construction Drawings
Documento17 pagine
Construction Drawings
jacksondcpl
50% (2)
Temp Scanner-Modbus Details PDF
Documento35 pagine
Temp Scanner-Modbus Details PDF
GIRI
Nessuna valutazione finora
Reinforcement Learning Is Direct Adaptive Optimal Control: Richard S. Sutton, Andrew G. Barto, Ronald J. Williams
Documento7 pagine
Reinforcement Learning Is Direct Adaptive Optimal Control: Richard S. Sutton, Andrew G. Barto, Ronald J. Williams
hewitt0724
Nessuna valutazione finora
S4hana-Launch Mena Aborchert - Final
Documento48 pagine
S4hana-Launch Mena Aborchert - Final
pilloleon
Nessuna valutazione finora
Workflowsim: A Toolkit For Simulating Scientific Workflows in Distributed Environments
Documento8 pagine
Workflowsim: A Toolkit For Simulating Scientific Workflows in Distributed Environments
Santhosh B Acharya
Nessuna valutazione finora
Assignment 0 OOP
Documento11 pagine
Assignment 0 OOP
HUZAIFA SAEED
Nessuna valutazione finora
D D D D D: Description
Documento87 pagine
D D D D D: Description
ahireprash
Nessuna valutazione finora
Microprocessor
Documento22 pagine
Microprocessor
Naim 'Afifi
Nessuna valutazione finora
254 Web Development Standards Draft v2.0
Documento44 pagine
254 Web Development Standards Draft v2.0
WarBug
Nessuna valutazione finora
Resume of Mominul Islam
Documento2 pagine
Resume of Mominul Islam
Momin_khan1981
Nessuna valutazione finora
HiPath ProCenter V7-0 Call Director
Documento24 pagine
HiPath ProCenter V7-0 Call Director
api-3852468
Nessuna valutazione finora
Case Tool Lab Manual
Documento13 pagine
Case Tool Lab Manual
Dinesh Sinnarasse
Nessuna valutazione finora
Uio Howto
Documento18 pagine
Uio Howto
archankumarturaga
Nessuna valutazione finora
Comandos Mikrotik
Documento4 pagine
Comandos Mikrotik
Daniel Reyna
Nessuna valutazione finora
New Microsoft Word Document
Documento1 pagina
New Microsoft Word Document
Pu Ne
Nessuna valutazione finora
Ijves Y14 05338
Documento5 pagine
Ijves Y14 05338
Sachin
Nessuna valutazione finora
Python Variable Types
Documento6 pagine
Python Variable Types
Manohar Reddy
Nessuna valutazione finora
Polygon Vicon
Documento2 pagine
Polygon Vicon
Alejandro Patricio Castillo Fajardo
Nessuna valutazione finora
CoreSight Components - Technical Reference Manual
Documento376 pagine
CoreSight Components - Technical Reference Manual
asd fsda
Nessuna valutazione finora
Morphxit An Introduction To Axapta X++
Documento327 pagine
Morphxit An Introduction To Axapta X++
Agus Prasetyo
Nessuna valutazione finora
Admextractconnections PMLFRM
Documento3 pagine
Admextractconnections PMLFRM
YoussefOuchrif
Nessuna valutazione finora
Lnai 1111
Documento345 pagine
Lnai 1111
JoséCarlosFerreira
Nessuna valutazione finora
Agile Docs
Documento6 pagine
Agile Docs
ganisubi
Nessuna valutazione finora