Sei sulla pagina 1di 1

25/5/2021 Modello della borsa di parole - Wikipedia

Modello della borsa di parole


Da Wikipedia, l'enciclopedia libera.

Il modello della borsa di parole (in inglese: Bag-of-words model, in sigla: BoW) è un metodo
utilizzato nell'Information Retrieval e nel Elaborazione del linguaggio naturale per rappresentare
documenti ignorando l'ordine delle parole. In questo modello, ogni documento è considerato in quanto
contiene parole, analogamente a una borsa; ciò consente una gestione di queste basata su liste, dove ogni
borsa contiene determinate parole di una lista. Nella Computer Vision si applica alla classificazione delle
immagini, trattando l'immagine come caratteristiche (feature) di parole. In particolare, nell'object
recognition, un'immagine può essere trattata come un documento e le caratteristiche rilevate in
determinati punti dell'immagine si considerano "parole" visuali. Nella classificazione di documenti, la
borsa di parole è un vettore sparso del numero di occorrenze delle parole, che non è altro che un
istogramma sparso sul vocabolario. In Computer Vision una borsa di parole visuale è un vettore sparso
di occorrenze del vocabolario di caratteristiche locali dell'immagine.

Applicazione
Nella filtrazione baysiana dello spam, un messaggio di posta elettronica è modellato come una collezione
disordinata di parole selezionata da una o due distribuzioni di probabilità: una rappresentante lo spam e
una rappresentante e-mail legittimate. Mentre alcune parole saranno trovate in entrambe le "borse",
altre saranno trovate solo nella borsa spam e altre solo nella borsa "non spam".

Voci correlate
Information retrieval
IA-completo
N-gramma
Elaborazione del linguaggio naturale

Collegamenti esterni
(EN) Una dimostrazione di due classificatori di borse di parole (https://people.csail.mit.edu/fergus/iccv
2005/bagwords.html) di L. Fei-Fei, R. Fergus e A. Torralba.

Estratto da "https://it.wikipedia.org/w/index.php?title=Modello_della_borsa_di_parole&oldid=104580111"

Questa pagina è stata modificata per l'ultima volta il 3 mag 2019 alle 05:06.

Il testo è disponibile secondo la licenza Creative Commons Attribuzione-Condividi allo stesso modo; possono applicarsi
condizioni ulteriori. Vedi le condizioni d'uso per i dettagli.

https://it.wikipedia.org/wiki/Modello_della_borsa_di_parole 1/1

Potrebbero piacerti anche