Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
COS’è Ciò che gli indicizzatori devono ricercare nei documenti e rappresentare poi nel linguaggio di
indicizzazione.
Cosa NON E’
L’identificazione dei concetti dovrebbe avvenire seguendo un approccio sistematico, con l’ausilio di liste di
controllo dei fattori riconosciuti importanti nel campo disciplinare coperto dall’indice
INDICIZZAZIONE
Stringa di soggetto:
Descrizione standardizzata per ogni concetto Utilizzo delle descrizioni fornite dall’autore
Descrizione indipendente da quella fornita Individuazione e combinazione di tali descrizioni in
dall’autore fase di ricerca
Descrizione utilizzata in fase di ricerca Economica in input, impegnativa in output
Impegnativa in Input, economica o output
- Un termine estratto dal documento può figurare, tale e quale, nel linguaggio documentale o di
indicizzazione
- Un termine estratto dal documento può figurare come rinvio ad un altro termine individuato come
descrittore;
- Un termine può non comparire nel linguaggio documentale
FINALITA’:
Lez. 10-03-2022
ENUNCIATO I SOGGETTO:
CONCETTI:
- INSEGNAMENTO
- INGLESE
- SCUOLA ELEMENTARE
STRINGA DI SOGGETTO:
- Lingua inglese
- Insegnamento
- Scuola elementare
ABSTRACT:
-Rapporto di indagine e dati statistici sull’insegnamento delle lingue inglese e francese nella scuola
elementare italiana nel 1993, con descrizione dei metodi di insegnamento, sussidi didattici, strumenti di
valutazione utilizzati e valutazione degli effetti in termini di educazione inter – e multiculturale; in
subordine, attributi essenziali di una educazione inter e multiculturale.
STRINGA DI SOGGETTO:
Un termine estratto dal documento può figurare, tale e quale, nel linguaggio documentale o di
indicizzazione.
Un termine estratto dal documento può figurare come rinvio ad un altro termine individuato come
descrittore;
VANTAGGI:
maggiore qualità
maggiore coerenza
Concetto TERMINE
SVANTAGGI:
Rischio minore precisione
VANTAGGI:
SVANTAGGI:
Poco coerente
Finalità:
IL LESSICO: Vocabolario controllato in cui tutti i termini devono essere “controllato”, per poter garantire
L’UNIFORMITA’ (un concetto deve essere sempre rappresentato dallo stesso termine) e l’UNIVOCITA’
(ogni termine deve sempre indicare un solo concetto).
LESSICO CONTROLLATO: significa che non tutti i termini che possono indicare un certo concetto sono
accettati.
La semantica: stabilisce la relazione a priori fra i termini scelti per indicare i concetti in modo da costruire
una rete di relazioni per favorire si l’INDICIZZAZIONE nella scelta del termine più opportuno, sia l’UTENTE
che può recuperare sia il soggetto desiderato, ma anche altri soggetti che possono essergli utili in quanto
affini o correlati.
LA SINTASSI: Gestisce le relazioni a posteriori, determinando l’ordine dei concetti e dei termini che li
esprimono, le combinazioni dei termini, in particolare nei soggetti complessi.
Al fine di ottenere:
Molto spesso non è sufficiente esprimere un concetto con un solo termine, ma esso deve essere
ulteriormente specificato e delimitato con l’aggiunta di altre espressioni.
I principali parametri di valutazione dei risultati di una ricerca in cataloghi e altri strumenti di recupero
dell’informazione sono il RICHIAMO e la PRECISIONE
RICHIAMO: numero di risorse pertinenti e rilevanti recuperate sul totale delle risorse pertinenti e rilevanti
disponibili
PRECISIONE: il numero di risorse pertinenti e rilevanti sul totale delle risorse recuperate.
Il soggetto può essere considerato ogni concetto o combinazione di concetti che rappresentino un tema
all’interno di un documento.
Per evitare incongruenze nei risultati dell’analisi è opportuno che il soggetto sia sempre principalmente
identificato con il tema di base del documento.
IL TEMA DI BASE:
Quell’oggetto di conoscenza al quale sono riferibili i singoli temi particolari discussi nel documento e al
quale sono correlate nel testo tutte le informazioni fornite intenzionalmente dall’autore, essendo stata
proprio la volontà di comunicare nozioni dirette e specifiche su quell’oggetto di conoscenza il motivo
fondamentale della produzione intellettuale dell’intero documento Dunque il tema di base è una proprietà
necessaria di qualsiasi testo percepibile come un’unità coerente.
L’analisi della risorsa IN RELAZIONE AL CONCETTO DI ABOUTNESS, ossia la proprietà della risorsa di
trattare un soggetto, di essere ABOUT (su) un certo argomento;
L’analisi della risorsa IN RELAZIONE AL CONCETTO DI LITERARY WARRANT (garanzia bibliografica) in
modo tale che l’indicizzazione sia basata sul materiale a disposizione e non su considerazione
astratte;
L’analisi del contenuto della risorsa IN RELAZIONE ALLA COLLEZIONE, alla tipologia della biblioteca e
del catalogo.
L’analisi relativa al PIANO TECNICO scegliendo tra un linguaggio d’indicizzazione approfondito o più
in generale.
L’ANALISI CONCETTUALE
Quando le fonti non forniscono informazioni chiare e dirette sul tema di base della risorsa è necessario
ricostruirlo:
Al termine di questa fase, l’indicizzazione arriva a formulare un enunciato di soggetto, una “parola” o
“combinazione” d parole del linguaggio naturale che esprime IL SOGGETTO DI UN’OPERA (GRIS-
Gruppo di Ricerca sull’Indicizzazione per Soggetto).
BIBLIO. LEZ DEL 15/03/2022
LEZ. 22-03-2022
Indicizzazione
Manuale
Automatica
Supporto nella definizione di metadati
Controllo terminologico
Recupero dell’informazione
Navigazione
ù NOTA D’AMBITO SN
TERMINE NON UF
PREFERITO
TOP TERM TT
RELAZIONI
TERMINE SPECIFICO NT
Garanzia di coerenza
Supporto all’utente nella scelta delle parole chiave da impiegare in una query
Narrower Term: specificare meglio la ricerca e ridurre gli item che potrebbero essere recuperati
Broader Term e Related Term: ampliare la ricerca nel caso vengano restituiti pochi documenti
RT sono i termini associati in qualche modo al termine, non sempre. Un RT in caso di termine come
“malattia” potrebbe essere un virus. Nel caso il termine fosse poco esaustivo, i BT insieme all’RT mi danno
più risorse rispetto ad un termine solo con RT.
Thesaurus: Navigazione
LEZ. 24-03-2022
- A faccette
Coinvolgimento di esperti
Validazione
Aggiornamento
Tipologie di corpus
- Specialistico o generale
- Di lingua scritta, dell’orale o misti
- Sincronico e diacronico
- Monolingue o multilingue
- Costituito da testi interi o da frammenti
- Rappresentatività
- Estensione
- -----------Numero di parole unità (token)
Limiti
- Rappresentatività relativa
- Arbitrarietà
Approccio deduttivo
Approccio introduttivo
- Definizione preliminare della struttura (es. categorie)
- Inserimento progressivo dei termini
Combinazioni di entrambi
Scope notes (nota d’ambito) subentra quando c’è la polisemia (radio osso o apparecchio per ascoltare la
musica. La nota d’ambito serve per disambiguare due termini identici con significato diverso. Importante il
termine associato in un periodo storico particolare, ad es. per STORIA MODERNA.
DEF, HN
Qualificatori
Poligerarchia vs Monogerarchia
- Sinonimia
- --termini Specialistici/comuni
-----Cefalea/Mal di testa
- Nomi commerciali
- -------- Biro/ Penna a sfera
- ---------database/ Data-base
- Acronimi/Abbreviazioni
- -----------Papaprazzo/Fotoreporter
- Prestiti linguistici
- -------Computer/Elaboratore elettronico
- OBIETTIVO
- DESTINATARI
Funzioni
Funzioni
- Search expansion