Sei sulla pagina 1di 8

Regole di trascrizione in italiano

Sommario

1. Introduzione alla Piattaforma di Lavoro ...................................................................................................... 3


spiegazione .......................................................................................................................................................... 3

Tasti di scelta rapida: ............................................................................................................................................ 3


2. Svolgimento del Lavoro ............................................................................................................................... 4
3. Linee Guida di Annotazione ........................................................................................................................ 4
3.1 Da scartare: ............................................................................................................................................. 4
3.2 Segmentazione: ....................................................................................................................................... 4
a) Non considerare la completezza della frase nel tagliare l’ audio................................................................... 4

b) La parte dell’area grigia non è chiara. ......................................................................................................... 4

c) Parte dell’area grigia è sovrapposta (2 o più interlocutori che parlano simultaneamente) ............................ 4

d) Parte dell’area grigia è musica, melodie, canzoni, rumori di animali o suoni della natura: ............................ 5

e) Pause/rumori all’inizio, al centro o alla fine dell’audio clip. ......................................................................... 5

f) Interiezioni ed esclamazioni ........................................................................................................................ 5

g) Parole inglesi nell’audio: ............................................................................................................................ 5


h) Dialetto (parole in idiomi locali) e lingue straniere. ..................................................................................... 6
3.3 Trascrizione del testo. ................................................................................................................................ 6
a) Sono richiesti gli spazi tra le parole. Non lasciare mai attaccata una parola all’altra. ................................... 6

b) La versione finale dell’audio deve contenere almeno due parole(≥2). ........................................................... 6

c) I numeri arabi devono essere trascritti per esteso in italiano Esempio 1--> uno ............................................ 7

d) La punteggiatura non va usata nel testo eccetto l’apostrofo (‘).................................................................... 7

e) Parole e frasi ripetute devono essere trascritte strettamente secondo il numero di volte in cui sono ripetute 7

f) Abbreviazioni ............................................................................................................................................. 7

g) Lettere maiuscole ....................................................................................................................................... 7


h) Parole colloquiali o parole pronunciate in modo non standard........................................ 错误!未定义书签。

i) Parole troncate: ......................................................................................................................................... 7

j) Parole con lo stesso suono: ......................................................................................................................... 7


k) Abbreviazioni/linguaggio parlato .................................................................................. 错误!未定义书签。

l) Accenti locali .............................................................................................................................................. 8

m) Linguaggio scurrile, abusi di parole, audio accelerati: .................................................................................. 8

n) Le poesie devo essere trascritte normalmente. ............................................................................................ 8


o) I doppi spazi tra le parole sono accettati. .................................................................................................... 8
p) Parole scandite........................................................................................................................................... 8
1. Introduzione alla piattaforma di lavoro
Taglia una sezione di parlato umano dall’audio e trascrivi l’audio nell’apposito spazio.

spiegazione
• Parte grigia: pezzo di audio ritagliato di default. Dobbiamo considerare SOLO la parte grigia.

• Parte blu: risultato del tuo segmento, devi trascrivere questo pezzo nell’apposito spazio.

• Parte bianca: l’audio prima e dopo la parte grigia, non si deve trascrivere e/o
segmentare; è possibile anche ascoltare questa parte come riferimento.

• Classificazione degli audio:

○ Speech – voce umana chiara


○ Discard – l’audio non soddisfa I requisiti del discorso ASR.
• Contenitore di testo: spazio dove inserire il testo.

• Video: non viene usato in questo progetto.

Tasti di scelta rapita:


1 – continua a riprodurre da dove hai interrotto.

2 - pausa.

3 – riproduci l’intero audio.

5 – riproduci l’audio di default (parte grigia)

a – riproduci il segmento (la corrente parte blu tagliata)

s – inizia la segmentazione.

e – termina la segmentazione.
2. Svolgimento del lavoro
• Step 1. Ascolta l’audio di default.(parte grigia)

• Step 2. Seleziona la categoria audio (speech o discard)

• Step 3-1. Se scegli di classificare ‘discard’, inoltra questo task direttamente. Non serve
cambiare il testo in basso.
• Step 3-2. Se scegli di classificare ‘speech’, devi determinare se intercettare l’audio o meno. Quindi procedi
alla trascrizione dell’audio.

3. Linee guida di annotazione


3.1 Discard:
• L’intero audio non è in italiano.
• L’intero audio non è chiaro o il discorso non è incomprensibile.
• L’intero audio è una canzone con testo in sottofondo o parlato non umano,
questo include melodie, suoni di animali o della natura.
• Se è presente una sola parola italiana l’audio deve essere scartato.
• Se l’intero audio è composto da interiezioni ed esclamazioni deve essere scartato.
• L’intero audio è in dialetto: deve essere scarto (anche se capisci quel dialetto).
Nota: Se selezioni “discard”, non serve trascrivere, semplicemente fai click su “submit” e procedi all’audio
successivo.

3.2 Segmentazione:
a) Non considerare la completezza della frase nel tagliare l’audio.
b) Una parte dell’area grigia non è chiara.
• Un segmento deve sempre partire con parole chiare, se le parole non sono chiare nella parte iniziale o
in quella finale, devi tralasciare questa parte non chiara.

• Se la parte non chiara è nel mezzo del parlato, è necessario segmentare uno dei due lati.
Per esempio: “Parte chiara iniziale + parte non chiara+ Parte chiara finale” –“Parte
chiara iniziale ” oppure “Parte chiara finale” possono essere accettate come
segmento. Scegli quella più lunga e non trascriverle entrambe.

Ma nota: Se il rumore (parte non chiara) influisce sul contenuto, escludilo, mantieni il resto e
trascrivi. Se il rumore non influisce sul contenuto, ignoralo e trascrivi l’intero audio.

c) Parte dell’area grigia è sovrapposta (2 o più interlocutori che parlano simultaneamente)


• Scarta: l’intero audio è composto da voci sovrapposte e non si capisce il contenuto.
• Taglia: gli interlocutori parlano di cose diverse contemporaneamente, ma NON SI
RIESCE a capire il contenuto— in questo caso escludi questa parte e mantieni la
parte chiara da trascrivere;
• Mantieni e trascrivi:
 Gli interlocutori parlano delle stesse cose contemporaneamente e le parole
risultano chiare, devi mantenere questa parte e trascriverla;
 Gli interlocutori non parlano contemporaneamente, l’audio deve essere
trattato come parlato normale e trascritto.
 C’è una voce principale in un gruppo di conversazione, le altre voci sono basse
o poco definite e l’articolazione del suono del parlato dell’interlocutore
principale non subisce l’interferenza degli altri. In questo caso, trascrivi il
parlato principale e tratta gli altri interlocutori come suono di sottofondo o
rumore.

d) Parte dell’area grigia è musica, melodie, canzoni, rumori di animali o suoni della natura:
• Scarta:
 Se l’ intero audio è una canzone o una voce non umana, come musica,
melodie, suoni di animali, suoni della natura e cosìvia - scarta questo audio.
 se l’interlocutore sta cantando una canzone di sole melodie – scarta.
• Cut Out:
 Se il suono in sottofondo è una canzone con un testo, escludi questa parte e
mantieni il parlato umano che si sente chiaramente oppure scarta l’intero
audio se è difficile effettuare tagli sull’audio.

***MA se il suono in sottofondo non influisce sulla comprensibilità del parlato


dell’interlocutore, trascrivi il parlato dell’interlocutore e ignora il suono in sottofondo.
• Mantieni e trascrivi:

 Se il suono in sottofondo è una melodia senza testo e il parlato umano è chiaro


mantienilo e trascrivi l’intero audio.

 Se l’interlocutore canta una canzone senza melodia in sottofondo – trascrivila.


e) Pause/rumori all’inizio, al centro o alla fine dell’audio clip.
• Se il rumore influisce sul contenuto, escludilo, mantieni l’audio in italiano e trascrivilo.
Se il rumore non influisce sul contenuto, ignoralo e trascrivi l’intero audio.
※Per esempio: “Parlato 1 + pausa/rumore (non influisce sul contenuto) + Parlato
2”. Trascrivi Parlato1 + Parlato2.
※Per esempio: Parlato1 + pausa/rumore (influisce sul contenuto)+ Parlato2 ---
“Parlato1 ” oppure “Parlato2” possono essere accettati come segmento. Scegli quello più lungo e non
trascriverli entrambi.
f) Interiezioni ed esclamazioni
• Il parlato selezionato deve partire con ( e finire con) fino a 2 interiezioni o esclamazioni.
※Esempio: C’è una serie di risate (circa 10 "ah") all’inizio del parlato, è sufficiente
mantenere una parte di questo nell’audio (più o meno 2 "ah ah" nell’audio).
• Se riesci chiaramente a contare il numero di esclamazioni/interiezioni, dovresti trascriverle.
※Per esclamazioni/interiezioni ripetute, trascrivi lo stesso numero di
esclamazioni/interiezioni presenti nell’audio. es. 3 "ah" nell’audio, devi scrivere "ah ah
ah" nel testo.
• Interiezioni/esclamazioni non quantificabili--- non trascrivere ed escludile.
※Per esempio: Parlato1 + interiezioni/esclamazioni non quantificabili+ Parlato2
“Parlato1 ” oppure “Parlato2” possono essere accettati come segmento. Scegli quello più lungo e non
trascriverli entrambi.

Il rumore di un respiro chiaro e distinguibile deve essere trascritto, ad esempio come “ah”.

g) Parole inglesi nell’audio:


Parole inglesi all’inizio o alla fine dell’audio:

• “inglese+ italiano” oppure “italiano + inglese” or “inglese + italiano +inglese”


---- segmenta la parte italiana e trascrivila.
※Per esempio: Se senti dire: “vi mostro la mia camera check" devi escludere "
check." e trascrivere solamente “vi mostro la mia camera ".
MA: se, escludendo la parte inglese, rimane solo 1 parola italiana, scarta l’intero
audio. ※Per esempio: “ matematica check”, escludendo “check” rimane solo 1
parola. Audio da scartare.

Parole inglesi in mezzo all’audio:

• “italiano + inglese + italiano”

Parte inglese ≤3 parole, segmenta e trascrivi “italiano1 + inglese + italiano2 ”. la


parte inglese dovrebbe essere trascritta con parole inglesi.
Parte inglese>3 parole, segmenta solo “italiano1” oppure “italian2”
• Per nomi di brand diffusi ma il cui nome è in inglese, ad esempio: (iphone ten, frisian
flag, eccetera)
Se il nome del brand è all’inizio o alla fine dell’audio
(Parlato 1 + Brand) / (Brand + Parlato 1) per favore trascrivi solo Parlato 1
Parole inglesi nella parte centrale dell’audio:
(Parlato 1 + Brand + Parlato 2)
Parte del brand in inglese ≤3 parole, segmenta e trascrivi “Parlato 1+ Brand + Parlato
2”.
La parte del brand in inglese deve essere trascritta con parole inglesi.
Parte in inglese>3 parole, segmenta solo “Parte 1” or “Parte 2”

Nota: Se la parola inglese viene italianizzata, dovremmo considerarla come “parola italiana”, per
esempio, da “shop” “ shoppare”, trascriviamo “shoppare”.
h) Dialetto (parole in idiomi locali) e lingue straniere : non bisogna trascrivere dialetti e lingue straniere.
Dialetto / lingua straniera all’inizio o alla fine dell’audio:
• “Dialetto / lingua straniera + italiano” oppure “italiano + dialetto / lingua
straniera” oppure “dialetto / lingua straniera + italiano + dialetto / lingua
straniera”
---- Segmenta la parte italiana e trascrivila.
dialetto / lingua straniera nella parte centrale dell’audio:

• “italiano A+ dialetto / lingua straniera + italiano B” — segmenta solo


“italiano A” oppure “italiano B” e trascrivi il segmento più lungo.

3.3 Trascrizione del testo.


a) Sono richiesti gli spazi tra le parole. Non lasciare mai attaccata una parola all’altra.
b) La versione finale dell’audio deve contenere almeno due parole. (≥2).
c) I numeri arabi devono essere trascritti per esteso in italiano. Esempio 1--> uno
d) La punteggiatura non va usata nel testo eccetto l’apostrofo (‘)
• Visto che non è possible usare la punteggiatura nel testo, si raccomanda di non trascrivere gli
username. Esempio @CharlesJunior Non trascriverlo.
e) Parole e frasi ripetute devono essere trascritte strettamente secondo il numero di
volte in cui sono ripetute.
f) Abbreviazioni
• Abbreviazioni di temini speciali/nomi eccetera (es. ANTV, SCTV, I-LAND) devono essere trascritti in
MAIUSCOLO.
• Abbreviazioni di frasi come cmq, ecc, qlc, eccetera (comunque, eccetera, qualcosa), queste abbreviazioni
devono essere trascritte in minuscolo.
g) Lettere Maiuscole
• Non trascrivere in maiuscolo la prima lettera del testo eccetto i nomi propri.
• Nomi propri come nomi di città, nomi di strade etc. devono essere trascritti in maiuscolo secondo le
regole.
esempio New York, TikTok, Turchia, KFC, NBA
• FB e IG sono abbreviazioni di nomi propri, quindi trascrivili semplicemente come sono.
• Nomi di istituzioni devono essere trascritti in maiuscolo. Esempio: “DPR”,
“MPR”, “BUMN”, ecc
• Nomi di documenti devono essere trascritti in maiuscolo. Esempio: “KTP”
oppure “SIM”
• È possibile trascrivere qualsiasi parola che si riferisce a Dio con la lettera
maiuscola.
h) Parole colloquiali o parole pronunciate in modo non standard
• Se la voce è chiara ma non standard (esempio : voce di un bimbo, voce balbettante), devi trascriverla
usando parole standard.
• Parole inesistenti non possono essere accettate. Solo le parole standard e le parole colloquiali
usate comunemente possono essere accettate nella trascrizione.
• Per le parole colloquiali usate comunemente, si consiglia di scrivere le parole
colloquiali trascrivendole cosìcome le senti. Comunque anche le forme standard
sono corrette e accettabili. Tuttavia se non si è sicuri del fatto che la forma
colloquiale sia accettabile o corretta, è possibile trascrivere la forma standard.
i) Parole troncate:
• 1. In presenza di una parola troncata che non è una singola parola, questa va eliminata.
Esempio: “vi svelo un segre”, bisogna eliminare “segre” e trascrivere “vi svelo un”
• 2. In presenza di una parola troncata che suona some una singola parola, questa va mantenuta e
trascritta.
Esempio: "Voglio andare al super" , va trascritto " Voglio andare al super "
La parola ‘supermercato’ è pronunciata a metà, ma si può sentire “super” . “super” è una parola a sé
stante.
j) Parole con lo stesso suono:
• Ascolta l’intero audio per capire qual è l’intera frase e trascrivi la parola corretta a
seconda del contesto.
• Se ci sono parole multiple con lo stesso suono il cui significato è conforme col
significato della frase, è possibile scegliere qualsiasi parola da usare.
k) Abbreviazioni/linguaggio parlato
• Trascrivere la forma che usa l’interlocutore. Trascrivere quello che viene udito, non
correggere errori grammaticali.
※Esempio. “Che stai a di’”. Seguendo l’audio, bisogna scrivere "di’",
non bisogna trascrivere "dire".
l) Accenti locali
Le parole con accenti locali devono essere trascritte in italiano standard.
m) Linguaggio scurrile, parole offensive, audio accelerati:
• Sia il linguaggio scurrile che le parole offensive vanno trascritti.
• Se un audio accelerato può essere udito distintamente allora va trascritto.
n) Le poesie devo essere trascritte normalmente.
o) I doppi spazi tra le parole sono accettati.
p) Parole scandite
Nelle parole scandite bisogna usare uno spazio tra una lettera e l’altra. Ciascuna lettera deve essere
maiuscola.
Esempio: “F A N T A S T I C O”

3.4 Parole Speciali


Si prega di fare riferimento al documento “term alignment”

Potrebbero piacerti anche