RL Voice

Caricato da

Marcos

Il 0% ha trovato utile questo documento (0 voti)

3 visualizzazioni20 pagine

Resumos sobre RL aplicado a ASR

Copyright

Formati disponibili

PPTX, PDF, TXT o leggi online da Scribd

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Segnala questo documento

Resumos sobre RL aplicado a ASR

Copyright:

Formati disponibili

Scarica in formato PPTX, PDF, TXT o leggi online su Scribd

Segnala contenuti inappropriati

Il 0% ha trovato utile questo documento (0 voti)

3 visualizzazioni20 pagine

RL Voice

Caricato da

Marcos

Resumos sobre RL aplicado a ASR

Copyright:

Formati disponibili

Scarica in formato PPTX, PDF, TXT o leggi online su Scribd

Segnala contenuti inappropriati

Salta alla pagina

Sei sulla pagina 1di 20

Cerca all'interno del documento

Aplicações de RL em ASR

Marcos Ferreira
Aplicações de RL
• Reconhecimento da fala: LSTM bi direcionais, modelo encoder-
decoder;

• Aplicações de RL
• Otimização de modelo de reconhecimento automático de fala
• Processamento de linguagem natural.
• O agente precisa selecionar a melhor resposta a cada tempo t (estado)
Artigo
• End-to-End Speech Recognition Sequence Training With
Reinforcement Learning
• Encoder (extrai caracteristicas), decoder (gera o target baseando-se
na saída anterior, estado atual e caracterisitcas do encoder)
• Atenção: calcula a relevância entre o estado do decoder e as
características pelo encoder.
• Aplicação RL: Otimização
• Método: Policy Gradient
Arquitetura
Modelo
• Agente: Decoder
• Ação: caracter ou fonema;
• Reward: Levenshtein distance
• ASR: gera um texto (caracteres ou fonemas) -Y dado características de
uma fala – X
Modelo
• Estado: Estado do decoder
• Decoder: espectograma
• Action: saída do decoder (caracter ou fonema)
• Probabilidade de transição: P(s’|s,a)
• Raw: qualidade; distância de Levenshtein
• 128 caracteres são preditos, para que seja calculada a recompensa
Recompensa - sentence
• Y(n): ground truth
• Y(n,m): Transcrição
Recompensa - token
Resultados
Artigo
• Autonomous Robotic Dialogue System with Reinforcement Learning
for Elderlies with Dementia
Método
• Análise de 20 horas de conversas entre idosos e membros do centro
de cuidados;
• Determinação de características comuns a uma interação ideal;
Informações
• Sensor de giro e aceleração foram usados para adquirir informações
sobre postura e movimento;
• Microfone: captura informações sobre a fala
• Câmara (olhos), reconhecer emoções pela expressão facial.
• Estado interno do robô: estima o estado emocional e motivacional do
idoso. (Negativo, neutro ou positivo)
• O estado interno afeta o modo como o robô expressa sua resposta
• Os tópicos favoritos de cada participante foram fornecidos pelas
enfermeiras e familiares.
Q - Learning
• Agente: Robô
• Ambiente: Humano
• Estado: Estado interno do robô e ação anterior selecionada
• Ações: resposta curta, resposta longa (questão) e mudança de tópico
• Recompensa:
• se o robô selecionar a mesma ação do operador (pessoa), R = 5
• Se a emoção é positiva e a motivação é alta, R = 1
Resultado
• Interações com 3 idosos;
• Meta: manter a conversa; As conversas duraram mais que 20 minutos
Artigo
• REINFORCEMENT LEARNING OF SPEECH RECOGNITION SYSTEM
BASED ON POLICY GRADIENT AND HYPOTHESIS SELECTION
• Sistema ASR que recebe fala como entrada e a transcreve;
• O Sistema é idealizado para servir a várias pessoas através da internet;
• Ele deve transcrever palestras, apresentações, etc

• O Sistema é alimentado por usuários, que dão uma nota para a transcrição
feita pelo Sistema;
Modelo
• Estado s: sequência do discurso -> hipótese (Sequência de palavras)
• Ações: probabilidade de uma sequência de palavras
• Agente: o Sistema de reconhecimento
• O agente e um rival fornecem hipóteses, sendo que o usuário escolhe
uma.
• R = 1 (Resposta do Sistema é selecionada)
• R = 0 (Resposta do rival é selecionada)
Arquitetura
Resultados
Artigo
• Interactive Spoken Content Retrieval by Deep Reinforcement
Learning

• Objetivo: buscar conteúdo através da fala;

• O Sistema deve interagir com o usuário que está buscando
informação;
• Estado: Features – Input of DQN;
• Ações: coletar dados, exibir lista de possíveis resultados;
Arquitetura do sistema

Potrebbero piacerti anche

Revisão Prova 1.1
Documento2 pagine
Revisão Prova 1.1
Marcos
Nessuna valutazione finora
Eletrônica
Documento75 pagine
Eletrônica
Marcos
Nessuna valutazione finora
Eletrônica
Documento19 pagine
Eletrônica
Marcos
Nessuna valutazione finora
Prova 1
Documento1 pagina
Prova 1
Marcos
Nessuna valutazione finora
Prova 1 - Reposição
Documento2 pagine
Prova 1 - Reposição
Marcos
Nessuna valutazione finora
Eletrônica
Documento75 pagine
Eletrônica
Marcos
Nessuna valutazione finora
Aulas Práticas
Documento15 pagine
Aulas Práticas
Marcos
Nessuna valutazione finora
Eletricidade I
Documento7 pagine
Eletricidade I
Marcos
Nessuna valutazione finora
Dir-615 t1 Controle de Trafego
Documento5 pagine
Dir-615 t1 Controle de Trafego
Marcos
Nessuna valutazione finora
Prova Final
Documento2 pagine
Prova Final
Marcos
Nessuna valutazione finora
Prova Final - 2 Chamada
Documento2 pagine
Prova Final - 2 Chamada
Marcos
Nessuna valutazione finora
4 - Circuitos Combinacionais
Documento20 pagine
4 - Circuitos Combinacionais
Marcos
Nessuna valutazione finora
Levantamento Calculado 23-01-2018
Documento4 pagine
Levantamento Calculado 23-01-2018
Marcos
Nessuna valutazione finora
Eletrônica
Documento6 pagine
Eletrônica
Marcos
Nessuna valutazione finora
5 - Circuitos Sequenciais
Documento27 pagine
5 - Circuitos Sequenciais
Marcos
Nessuna valutazione finora
Exercicios Agntes Fisicos
Documento3 pagine
Exercicios Agntes Fisicos
Marcos
Nessuna valutazione finora
Eletricidade I
Documento13 pagine
Eletricidade I
Marcos
Nessuna valutazione finora
Apresentação
Documento36 pagine
Apresentação
Marcos
Nessuna valutazione finora
Atividade Impericia, Imprudência Negligência
Documento2 pagine
Atividade Impericia, Imprudência Negligência
Marcos
Nessuna valutazione finora
Vol 38
Documento84 pagine
Vol 38
francisquense5
100% (1)
5 - Circuitos Sequenciais - Exercícios
Documento17 pagine
5 - Circuitos Sequenciais - Exercícios
Marcos
Nessuna valutazione finora
5 - Circuitos Sequenciais
Documento27 pagine
5 - Circuitos Sequenciais
Marcos
Nessuna valutazione finora
6 - Sistemas de Controle
Documento36 pagine
6 - Sistemas de Controle
Marcos
Nessuna valutazione finora
Automação Industrial Vol1
Documento8 pagine
Automação Industrial Vol1
Marcos
Nessuna valutazione finora
3 Sensores
Documento82 pagine
3 Sensores
Marcos
Nessuna valutazione finora
4 Atuadores
Documento18 pagine
4 Atuadores
Marcos
Nessuna valutazione finora
Exerci Cio S
Documento5 pagine
Exerci Cio S
Marcos
Nessuna valutazione finora
1 Introdução
Documento21 pagine
1 Introdução
Marcos
Nessuna valutazione finora
2 Controladores
Documento10 pagine
2 Controladores
Marcos
Nessuna valutazione finora
Atividade de Gramatica1
Documento3 pagine
Atividade de Gramatica1
Núbia Ramalho
Nessuna valutazione finora
Simulado de Raciocínio Lógico
Documento4 pagine
Simulado de Raciocínio Lógico
Duque de Caxias preparatorio
Nessuna valutazione finora
Bisturi WeM 120
Documento37 pagine
Bisturi WeM 120
Fábio Vitor Martins
Nessuna valutazione finora
Comunicação - O Que É, Quais Os Tipos - Processo de Comunicação
Documento9 pagine
Comunicação - O Que É, Quais Os Tipos - Processo de Comunicação
Lucimere
Nessuna valutazione finora
Avaliação II - 1 Série EM - 3º Tri 2019 - 2 Chamada
Documento7 pagine
Avaliação II - 1 Série EM - 3º Tri 2019 - 2 Chamada
Bruna Carolini
Nessuna valutazione finora
Origem - Do - Ritual - Schroder - No Brasil
Documento1 pagina
Origem - Do - Ritual - Schroder - No Brasil
Jacson Weich Lemos
Nessuna valutazione finora
Quadro de Terminacoes Verbais PDF
Documento2 pagine
Quadro de Terminacoes Verbais PDF
Geferson Vasconcelos
Nessuna valutazione finora
Teste 8º Ano - 3º Etapa - Original
Documento4 pagine
Teste 8º Ano - 3º Etapa - Original
Bianca Lellis
Nessuna valutazione finora
Revista LER, N.º 122 - Trata-Se de Uma Revista Que Apresenta Matérias, Resenhas e Artigos Científicos Sobre Leituras.
Documento100 pagine
Revista LER, N.º 122 - Trata-Se de Uma Revista Que Apresenta Matérias, Resenhas e Artigos Científicos Sobre Leituras.
leonardo_lindolfo
Nessuna valutazione finora
Planejamento Trimestral 2 Ano
Documento5 pagine
Planejamento Trimestral 2 Ano
Vini Silva
100% (1)
17 Total Engl. Exercicios
Documento107 pagine
17 Total Engl. Exercicios
wagner
Nessuna valutazione finora
Questoes de Estrutura Das Palavras A Adjetivo
Documento3 pagine
Questoes de Estrutura Das Palavras A Adjetivo
Moisaniel Furtado
Nessuna valutazione finora
Visão Através Dos Tattwas
Documento2 pagine
Visão Através Dos Tattwas
antoniocsj
Nessuna valutazione finora
About Throw - Help
Documento3 pagine
About Throw - Help
Baba George
Nessuna valutazione finora
Segundo Livro de Leitura
Documento186 pagine
Segundo Livro de Leitura
Dimitri Pereira Mota
Nessuna valutazione finora
A Arte de Atrair Espíritos em Cristais - Johannes Tritêmio
Documento13 pagine
A Arte de Atrair Espíritos em Cristais - Johannes Tritêmio
Felipe Facklam
Nessuna valutazione finora
Relatório SARESP - Lingua Portuguesa - 2010
Documento257 pagine
Relatório SARESP - Lingua Portuguesa - 2010
Adalberto Ribeiro
100% (1)
Linguagem Corporal
Documento15 pagine
Linguagem Corporal
Adilvaneide Ferreira da Costa (CEP-CZ)
Nessuna valutazione finora
Fonética e Fonologia
Documento26 pagine
Fonética e Fonologia
Gisele Esteves Prado
100% (1)
Slide Resumo O Romantismo em Portugal
Documento20 pagine
Slide Resumo O Romantismo em Portugal
João Pedro Nascimento
Nessuna valutazione finora
Chandi Path Portugues Introd
Documento7 pagine
Chandi Path Portugues Introd
swarupini
100% (3)
Trabalho 1 Semaforos
Documento21 pagine
Trabalho 1 Semaforos
Onesio Machuza
Nessuna valutazione finora
Artigo Bakhtin Rojo
Documento21 pagine
Artigo Bakhtin Rojo
Roxane Rojo
Nessuna valutazione finora
Musicologia Sistemática, Humanismo e Contemporaneidade
Documento26 pagine
Musicologia Sistemática, Humanismo e Contemporaneidade
thiagocabral88
Nessuna valutazione finora
Andrei Cornetta Direitos Territoriais Nas Várzeas de Breves, Marajó Novos Usos Da Floresta e Distintas Percepções Sobre o Ambiente PDF
Documento26 pagine
Andrei Cornetta Direitos Territoriais Nas Várzeas de Breves, Marajó Novos Usos Da Floresta e Distintas Percepções Sobre o Ambiente PDF
Tiago R. Nascimento
Nessuna valutazione finora
Caderno Folclore PORTUGUÊS
Documento16 pagine
Caderno Folclore PORTUGUÊS
Andrea Cardoso dos Santos Rocha
Nessuna valutazione finora
Fonema e Encontro Vocálico PDF
Documento6 pagine
Fonema e Encontro Vocálico PDF
Larissa Queiroz
Nessuna valutazione finora
Conjugação Do Verbo Subir No Dicionário Priberam
Documento2 pagine
Conjugação Do Verbo Subir No Dicionário Priberam
juanleon00
Nessuna valutazione finora
Anais Aled 2011 - Da Gramática Ao Discurso
Documento12 pagine
Anais Aled 2011 - Da Gramática Ao Discurso
Álvaro de Souza
Nessuna valutazione finora
Introdução Aos Estudos Da Linguagem
Documento9 pagine
Introdução Aos Estudos Da Linguagem
Jaqueline Dias
Nessuna valutazione finora