Sei sulla pagina 1di 1

Instituto Federal de Brasília - IFB

Nome: Luana Gonzaga Disciplina: Arquitetura de computadores 2

Lista - Capítulo 2

Questão 2.1
a) Cada elemento é 8b.Uma vez que uma cacheline de 64b tem 8 elementos, e cada acesso de coluna resultará na busca de uma nova
linha para a matriz não ideal, precisamos de um mínimo de 8x8(64 elementos) para a matriz de cache. Portanto, o tamanho mínimo do
cache é 128x8b = 1kb
b) A versão bloqueada só precisa buscar cada elemento de entrada e saída uma vez. A versão desbloqueada terá um erro de cache para
cada rowelement de 64B / 8B = 8. Cada coluna requer 64Bx256 de armazenamento ou 16KB. Assim, os columnelements serão
substituídos no cache antes que possam ser usados novamente. Hencethe a versão desbloqueada terá 9 erros (1 linha e 8 colunas) para
cada 2 na versão bloqueada
c) for (i = 0; i < 256; i=i+B) {
for (j = 0; j < 256; j=j+B) {
for(m=0; m<B; m++) {
for(n=0; n<B; n++) {
output[j+n][i+m] = input[i+m][j+n];}}}}

d) Conjunto de 2 vias associativo. Em um cache de mapeamento direto, os blocos podem ser alocados para mapear regiões sobrepostas
no cache.

Questão 2.11

a) Com a palavra crítica em primeiro lugar, o serviço de falta exigiria 120 ciclos. Sem palavras críticas primeiro, seriam necessários 120
ciclos para os primeiros 16B e 16 ciclos para cada um dos próximos 3 blocos de 16B, ou 120 + (3 × 16) = 168 ciclos
b) Depende da contribuição para o Tempo Médio de Acesso à Memória (AMAT) dos erros de cache de nível 1 e nível 2 e a redução
percentual de tempo de serviço em falta fornecida pela palavra crítica primeiro e reinício antecipado. Se a porcentagem de redução nos tempos de
atendimento perdidos fornecida pela palavra crítica primeiro e pela reinicialização antecipada é praticamente a mesma para os serviços de nível 1
e nível 2, então se o nível -1 de espera contribuir mais para o AMAT, a palavra crítica primeiro seria mais importante para os erros de nível 1.

Questão 2.12

a) 16B, para coincidir com o cache de dados de nível 2 write pat h.


b) Assume mesclar entradas de buffer de gravação são 16B de largura. Como cada rascunho pode escrever 8B, uma entrada de buffer de
gravação mesclada seria preenchida em 2 ciclos. O cache de nível 2 terá 4 ciclos para gravar a entrada. Um recurso de gravação não mesclado
demoraria 4 ciclos para gravar o resultado 8B de cada loja. Isso significa que o buffer de escrita máximo seria 2 vezes mais rápido
c) Com o bloqueio de caches, a presença de falhas efetivamente congela o progresso gerado pela máquina, portanto, se há erros ou não,
isso não altera o número de entradas do buffer de gravação. Com caches sem bloqueio, as gravações podem ser processadas a partir do buffer de
gravação durante as falhas, o que pode significar que menos tentativas são necessárias

Potrebbero piacerti anche