Sei sulla pagina 1di 3

Reti neurali convoluzionali

Una rete neurale convoluzionale e una rete neurale specializzata per trattare immagini. Il blocco
fondamentale di una rete convoluzionale e il layer convoluzionale: questo è composto da filtri che lavorano
in parallelo.

Se __ è La dimensione del filtro, l'immagine ottenuta come risultato del filtraggio e un'immagine: ¿.

L'operatore di convoluzione dei filtri digitali funziona come una finestra mobile dove ogni casella del filtro
viene moltiplicata per il corrispettivo nella finestra mobile e risultati vengono sommati loro in modo da
ottenere un unico pixel. Il modo duale di vedere la cosa e che ogni layer convoluzionale è composto da
gruppi di neuroni dimensione ¿2 che condividono lo stesso bias (in un'immagine con un solo canale, ogni
gruppo di neuroni raggiunge ¿ pesi ).

Posizionando layer successivi, questo eredi sono in grado di individuare caratteristiche e forme sempre più
complesse nelle immagini. A differenza dei layer densi quelli convoluzionali sono solo parzialmente
connessi, il che permette di elaborare immagini anche molto grandi mantenendo sotto controllo il numero
di pesi:

❑ ❑
Zij = ∑ ∑ I i +u , ∙W u , v +ba ij=g ( Z ij )
m =0 n=0 j+ v

Se invece considerassimo immagini a colori con più layer avremmo:

❑ ❑ ❑
Zij = ∑ ∑ ∑ I i+u , ∙ W u , v + b a ij=g ( Z ij )
m =0 n=0 k=0 j +v
Ogni layer prende il nome di feature map. Ogni filtro introduce una
nuova immagine in output, la quale verrà trattata come un layer in
input al successivo layer convoluzionale. Il fatto che la dimensione
nell'immagine in input sia minore di quella in output è un problema,
quello che si fa e applicare una cornice di zeri all'immagine in input
prima di processarla, la dimensione di questa cornice sarà:

¿−1
n+ LP −+1 ⇒ P= .
2
Per questa ragione i filtri devono essere sempre dispari.

n' =n+2 P

vuole diminuire la dimensione dell'immagine in


output.
Questa operazione prende il nome di padding.
Keras, padding=”same” vuol dire mantenere la
stessa dimensione in output e ”valid” vuol dire
disattivarlo.

Un'altra opzione che consentono le reti neurali e


lo stride, cioè il passo della sliding Window, di
base questo vale uno, lo si pone >1 quando si
n' =n−¿ ¿ s+1 ¿

Il numero totale di pesi che ogni layer introduce è dato da: n PESI =( C ∙❑2 +1 ) nFILTRI

altri due layer che lavorano sulle immagini sono:

 Maxpooling: riduce la dimensione dell'immagine di un fattore scelto in input, fai il down sampling.
 Upsampling: aumenta la dimensione dell'immagine di un fattore scelto in input, ha
necessariamente bisogno di un layer convoluzionale subito dopo.
Questi layer non introducono pesi, sono gli algoritmi che servono a manipolare le immagini.

Potrebbero piacerti anche