A acústica arquitetônica é a área da acústica que se destina ao estudo do condicionamento acústico de ambientes como salas de concerto, salas de aula, teatros, igrejas, salas de conferência, escritórios, etc. O estudo de acústica de salas compreende tanto a caracterização acústica de ambientes já existentes através de técnicas experimentais, quanto o projeto e simulação acústica de novos recintos através de modelos computacionais. Outra frente de pesquisa é a avaliação subjetiva da acústica dos ambientes, feita através de entrevistas com os usuários de tais ambientes. Tais entrevistas podem ainda ser combinadas com medições e simulações computacionais de forma a correlacionar dados objetivos com dados subjetivos. 

Basicamente é possível dizer que um ambiente pode ter suas características acústicas descritas por sua "resposta ao impulso". A resposta ao impulso de um ambiente, entre uma fonte sonora e um receptor, é composta pelo som direto (caminho direto entre fonte sonora e receptor) e pelas reflexões que a onda sonora sofre (no palco, paredes laterais, teto, piso, etc), como mostrado na Figura 1a. Tais reflexões são distribuídas ao longo do tempo e sua densidade tende a aumentar a medida que o tempo passa (Figura 1b). A amplitude de cada reflexão é controlada pela distância percorrida pelo raio sonoro e pelas características de absorção das superfícies do ambiente que este encontra. Desta forma, na distribuição temporal da densidade de energia sonora, pode-se distinguir três regiões: som direto (composto pelo raio sonoro que percorre o caminho direto entre fonte e receptor), primeiras reflexões (compostas pelas reflexões que chegam ao receptor em até 50-80 [ms]) e a cauda reverberante (composta pelas reflexões finais).
 
 A análise da resposta impulsiva permite a extração de diversos parâmetros acústicos da sala como:
 
  • Tempos de reverberação (T20, T30, T60): tempo que a energia sonora leva para decair 60 dB a partir do momento em que a fonte sonora cessa de emitir som,
  • Early Decay Time (EDT): tempo que a energia sonora leva para cair os primeiros 10 dB  a partir do momento em que a fonte sonora cessa de emitir som,
  • Claridade (C80): expressa uma razão entre a energia sonora contida nas primeiras reflexões (até 80 [ms]) pela energia sonora contida no restante da resposta impulsiva,
  • Índice de transmissão da fala (STI): um índice calculado a partir da resposta impulsiva que expressa o grau de inteligibilidade da fala no ambiente,
  • Fração de Energia Lateral (LEF): expressa uma razão entre a energia sonora que atinge o ouvinte lateralmente (entre 5-80 [ms]) pela energia sonora que atinge o mesmo vinda de todas as direções (entre 0-80 [ms]),
  • Early Support (ST_Early): expressa a razão entre a energia sonora das primeiras reflexões pela energia sonora do som direto para uma resposta impulsiva gravada no palco a 1 [m] da fonte sonora, entre outros.
 
As respostas impulsivas (entre diversas posições de fonte e receptor em uma sala) podem ser determinadas tanto experimentalmente como através de um modelo computacional.

No caso do uso do modelo computacional, utiliza-se um software que usa como dados de entrada: 
 
  • a geometria precisa da sala, elementos aplicados às paredes, teto, piso, etc,
  • os coeficientes de absorção e difusão acústicos das diversas superfícies que compõe o ambiente (paredes, colunas, mobília, absorvedores e difusores),
  • as posições e direcionalidades das fontes sonoras e 
  • as posições e o modelo de audição dos receptores (o último usado para fins de auralização). 
Através de um algoritmo baseado em teoria acústica o software calcula as diversas respostas impulsivas da sala, de onde se extraem os parâmetros acústicos objetivos. De posse da resposta impulsiva é também possível fazer a audição de como um instrumento musical ou uma pessoa falando soariam na sala real (processo chamado de auralização). O sinal audível é gerado através da convolução da resposta impulsiva com um sinal gravado em câmara anecóica (sem reverberação). O uso de modelos computacionais permite que o projetista altere a posição de absorvedores, difusores ou mesmo a geometria da sala sem custos, possibilitando uma otimização da resposta acústica da sala na fase de projeto. 

No caso da medição experimental da resposta impulsiva  uma fonte sonora omnidirecional (dodecaedro) é usada para excitar a sala com um ruído de banda larga (sweep ou ruído branco). A resposta é captada por um microfone omnidirecional (bi-direcional ou bi-auricular, dependendo do parâmetro acústico desejado) em uma dada posição. Através da de-convolução entre a pressão sonora medida pelo microfone e o sinal de excitação fornecido à sala, consegue-se obter a resposta impulsiva da mesma.