Módulo 5.5: Áudio e Trilha Sonora

1 As Camadas do Áudio

Um áudio profissional é construído em camadas. Cada camada tem sua função e elas trabalham juntas para criar a experiência emocional completa.

🎤

NARRAÇÃO

Camada principal - voz que conduz a narrativa

🎵

MÚSICA

Base emocional - sustenta o mood do vídeo

🔊

EFEITOS

Detalhes - sons ambiente e foley

🌫️

AMBIENTE

Textura - sons contínuos de fundo

2 Narração com ElevenLabs

ElevenLabs oferece vozes de altíssima qualidade com controle emocional. Vamos criar a narração profissional para o vídeo "Raízes".

TEXTO DA NARRAÇÃO (do Módulo 5.2)

"Vivemos com pressa.

Mensagens que não terminamos de ler.

Cafés que não terminamos de sentir.

[pausa]

Mas nas montanhas de Minas, o tempo ainda tem outro ritmo.

[pausa]

Mãos que conhecem cada grão pelo nome.

Sol que amadurece sem pressa.

Chuva que chega na hora certa.

[pausa]

Da terra ao torredor.

Do torredor às suas mãos.

[pausa]

Cada xícara carrega essa jornada.

Cada gole, uma pausa que você merece.

[pausa]

Raízes. O tempo das coisas boas."

PROMPT: SELEÇÃO DE VOZ

Preciso selecionar a voz ideal no ElevenLabs para narrar este texto publicitário.

TEXTO DA NARRAÇÃO:
"Vivemos com pressa. Mensagens que não terminamos de ler. Cafés que não terminamos de sentir. [pausa] Mas nas montanhas de Minas, o tempo ainda tem outro ritmo..."

BRIEFING DA VOZ:
- Tom: Calmo, reflexivo, poético mas não pomposo
- Referência: Narrador de documentário de natureza
- Gênero: Masculino, madura (40-55 anos)
- Sotaque: Português brasileiro neutro, sem regionalismos fortes
- Ritmo: Lento, contemplativo, com pausas significativas
- Emoção: Transmitir paz, nostalgia positiva, conexão humana

SUGIRA:
1. 3 vozes do catálogo ElevenLabs que combinam com esse perfil
2. Configurações de "Voice Settings" recomendadas:
   - Stability (estabilidade)
   - Similarity Boost (fidelidade)
   - Style Exaggeration (expressividade)
3. Como marcar as pausas no texto para melhor resultado
4. Se devo usar Speech-to-Speech para maior controle

CONFIGURAÇÕES RECOMENDADAS

Vozes Sugeridas

• Adam - madura, natural
• Antoni - calorosa, emotiva
• Daniel - profunda, autoritativa

Voice Settings

• Stability: 65-75%
• Similarity: 75-85%
• Style: 20-30%

PROMPT: TEXTO FORMATADO PARA ELEVENLABS

Vivemos... com pressa.

Mensagens que não terminamos de ler.

Cafés... que não terminamos de sentir.

...

Mas nas montanhas de Minas... o tempo ainda tem outro ritmo.

...

Mãos que conhecem cada grão pelo nome.

Sol... que amadurece sem pressa.

Chuva... que chega na hora certa.

...

Da terra ao torredor.

Do torredor... às suas mãos.

...

Cada xícara carrega essa jornada.

Cada gole... uma pausa que você merece.

...

Raízes.

O tempo das coisas boas.

DICAS PARA ELEVENLABS

• Use "..." para pausas longas (2-3 segundos)

• Quebras de linha criam pausas médias

• Vírgulas e pontos criam pausas curtas

• Gere múltiplas takes e escolha a melhor

• Use "Projects" para editar takes específicos

3 Trilha Musical com Suno AI

Vamos criar uma trilha sonora original que complementa a narração sem competir com ela. A música deve ser emocional mas sutil.

PROMPT: TRILHA PRINCIPAL (SUNO)

Ambient cinematic instrumental, gentle acoustic guitar fingerpicking, soft piano chords, warm strings in background, Brazilian bossa nova influence, contemplative and peaceful, slow tempo 65 BPM, documentary style underscore, emotional but not dramatic, perfect for voiceover, coffee shop atmosphere, morning golden hour feeling

[Instrumental]

PROMPT: VARIAÇÃO NATUREZA (TRANSIÇÃO)

Ethereal ambient soundscape, soft synthesizer pads, nature-inspired textures, gentle flute melody, organic and earthy, Brazilian countryside feeling, misty mountains atmosphere, contemplative and spacious, 60 BPM, drone background, documentary nature film style, peaceful dawn

[Instrumental]

PROMPT: MOMENTO EMOCIONAL (FINAL)

Uplifting cinematic instrumental, warm orchestral strings crescendo, hopeful piano melody, gentle acoustic guitar, emotional climax building, inspiring and heartwarming, 70 BPM, documentary finale style, sunrise feeling, satisfying resolution, brand anthem quality

[Instrumental]

ESTRUTURA MUSICAL PARA 60 SEGUNDOS

00-15s

Intro sutil - apenas textura

15-45s

Desenvolvimento - melodia suave

45-60s

Clímax emocional - resolução

4 Efeitos Sonoros e Ambiente

Os efeitos sonoros adicionam realismo e imersão. Vamos criar uma lista de sons necessários e onde encontrá-los.

PROMPT: LISTA DE EFEITOS SONOROS

Crie uma lista completa de efeitos sonoros necessários para o vídeo "Raízes", indicando onde posicionar cada som.

CENAS DO VÍDEO:
01. Mãos digitando no celular (0-3s)
02. Tela com mensagens (3-6s)
03. Café no escritório (6-10s)
04. Transição para montanhas (10-15s)
05. Fazenda de café (15-20s)
06. Mãos colhendo (20-25s)
07. Sol no cafezal (25-30s)
08. Chuva nas folhas (30-35s)
09. Torra do café (35-38s)
10. Embalagem (38-42s)
11. Pessoa saboreando (42-50s)
12. Encerramento (50-60s)

PARA CADA CENA, LISTE:
1. Efeitos pontuais (sons específicos com timing)
2. Ambientes contínuos (atmosfera de fundo)
3. Intensidade sugerida (sutil/moderado/destaque)
4. Onde encontrar (ElevenLabs SFX / Freesound / Epidemic Sound)

CRITÉRIOS:
- Sons devem complementar, não competir com narração
- Transições suaves entre ambientes
- Realismo mas não excesso

LISTA DE EFEITOS POR CENA

CENAS 01-03: Ambiente Urbano 0-10s

• Notificações de celular (sutis)
• Burburinho de escritório (ambiente)
• Teclado digitando (pontual)
• Ar condicionado (textura de fundo)

CENAS 04-08: Natureza 10-35s

• Pássaros cantando (ambiente)
• Vento nas folhas (textura)
• Chuva suave (destaque na cena 08)
• Passos em terra (pontual)
• Grãos caindo em cesto (foley)

CENAS 09-12: Produto 35-60s

• Grãos no torrador (destaque)
• Café sendo servido (foley)
• Vapor/água fervendo (sutil)
• Xícara na mesa (pontual)
• Respiração satisfeita (muito sutil)

PROMPT: GERAR SOM COM ELEVENLABS SFX

Coffee beans tumbling and roasting in traditional drum roaster, crackling sounds, gentle mechanical rotation, warm aromatic atmosphere, artisanal coffee production

PROMPT: AMBIENTE DE FAZENDA

Brazilian countryside morning ambience, distant birds singing, gentle breeze through coffee plants, peaceful rural atmosphere, dawn on mountain farm, no traffic or urban sounds

5 Guia de Mixagem

A mixagem equilibra todas as camadas de áudio. Aqui está um guia de níveis para que cada elemento tenha seu espaço.

PROMPT: PLANO DE MIXAGEM

Crie um plano de mixagem de áudio para um vídeo publicitário de 60 segundos com narração.

ELEMENTOS DE ÁUDIO:
1. Narração (voiceover principal)
2. Trilha musical (instrumental)
3. Efeitos sonoros pontuais
4. Ambientes contínuos

REQUISITOS:
- Narração sempre inteligível e em primeiro plano
- Música complementa sem competir
- Efeitos adicionam realismo sem distração
- Transições suaves entre seções

FORNEÇA:
1. Níveis de referência em dB para cada elemento:
   - Durante narração
   - Durante pausas de narração

2. Técnicas de ducking:
   - Quanto abaixar música quando narração entra
   - Tempo de attack/release do compressor sidechain

3. Frequências:
   - Onde fazer cortes de EQ para dar espaço à voz
   - Faixas de frequência de cada elemento

4. Panorama (stereo):
   - Posicionamento de cada elemento no campo stereo

5. Momentos-chave:
   - Onde aumentar/diminuir música
   - Onde destacar efeitos específicos

NÍVEIS DE REFERÊNCIA

Elemento	Com Narração	Sem Narração
Narração	-6 dB	—
Música	-18 dB	-12 dB
Efeitos	-24 dB	-18 dB
Ambiente	-30 dB	-24 dB

DUCKING (Sidechain)

• Redução: -6 a -9 dB quando narração ativa
• Attack: 50-100ms (suave)
• Release: 300-500ms (gradual)
• Ratio: 3:1 a 4:1

6 Organização dos Arquivos de Áudio

ESTRUTURA DE PASTAS

05-audio/
├── voiceover/
│   ├── narration-take1.wav
│   ├── narration-take2.wav
│   └── narration-FINAL.wav
├── music/
│   ├── trilha-principal-v1.mp3
│   ├── trilha-principal-v2.mp3
│   ├── trilha-natureza.mp3
│   └── trilha-emocional-final.mp3
├── sfx/
│   ├── urbano/
│   │   ├── notificacoes.wav
│   │   └── escritorio-ambiente.wav
│   ├── natureza/
│   │   ├── passaros.wav
│   │   ├── vento-folhas.wav
│   │   └── chuva-suave.wav
│   └── produto/
│       ├── torrador-graos.wav
│       ├── cafe-servindo.wav
│       └── xicara-mesa.wav
└── mix/
    └── audio-final-master.wav

Checklist do Módulo 5.5

Ao final deste módulo você deve ter:

Narração gravada com ElevenLabs (~55 segundos) 3 variações de trilha musical (principal, natureza, emocional) Efeitos sonoros para cada cena relevante Ambientes de fundo (urbano e natureza) Plano de mixagem documentado Arquivos organizados na estrutura de pastas

Áudio e Trilha Sonora com IA

ONDE ESTAMOS NO PROJETO

1 As Camadas do Áudio

2 Narração com ElevenLabs

TEXTO DA NARRAÇÃO (do Módulo 5.2)

CONFIGURAÇÕES RECOMENDADAS

DICAS PARA ELEVENLABS

3 Trilha Musical com Suno AI

ESTRUTURA MUSICAL PARA 60 SEGUNDOS

4 Efeitos Sonoros e Ambiente

LISTA DE EFEITOS POR CENA

5 Guia de Mixagem

NÍVEIS DE REFERÊNCIA

6 Organização dos Arquivos de Áudio

ESTRUTURA DE PASTAS

Checklist do Módulo 5.5