Áudio e Trilha Sonora com IA
Crie a paisagem sonora completa do seu vídeo: narração profissional, trilha musical original e efeitos sonoros - tudo com inteligência artificial.
ONDE ESTAMOS NO PROJETO
1 As Camadas do Áudio
Um áudio profissional é construído em camadas. Cada camada tem sua função e elas trabalham juntas para criar a experiência emocional completa.
Camada principal - voz que conduz a narrativa
Base emocional - sustenta o mood do vídeo
Detalhes - sons ambiente e foley
Textura - sons contínuos de fundo
2 Narração com ElevenLabs
ElevenLabs oferece vozes de altíssima qualidade com controle emocional. Vamos criar a narração profissional para o vídeo "Raízes".
TEXTO DA NARRAÇÃO (do Módulo 5.2)
"Vivemos com pressa.
Mensagens que não terminamos de ler.
Cafés que não terminamos de sentir.
[pausa]
Mas nas montanhas de Minas, o tempo ainda tem outro ritmo.
[pausa]
Mãos que conhecem cada grão pelo nome.
Sol que amadurece sem pressa.
Chuva que chega na hora certa.
[pausa]
Da terra ao torredor.
Do torredor às suas mãos.
[pausa]
Cada xícara carrega essa jornada.
Cada gole, uma pausa que você merece.
[pausa]
Raízes. O tempo das coisas boas."
Preciso selecionar a voz ideal no ElevenLabs para narrar este texto publicitário. TEXTO DA NARRAÇÃO: "Vivemos com pressa. Mensagens que não terminamos de ler. Cafés que não terminamos de sentir. [pausa] Mas nas montanhas de Minas, o tempo ainda tem outro ritmo..." BRIEFING DA VOZ: - Tom: Calmo, reflexivo, poético mas não pomposo - Referência: Narrador de documentário de natureza - Gênero: Masculino, madura (40-55 anos) - Sotaque: Português brasileiro neutro, sem regionalismos fortes - Ritmo: Lento, contemplativo, com pausas significativas - Emoção: Transmitir paz, nostalgia positiva, conexão humana SUGIRA: 1. 3 vozes do catálogo ElevenLabs que combinam com esse perfil 2. Configurações de "Voice Settings" recomendadas: - Stability (estabilidade) - Similarity Boost (fidelidade) - Style Exaggeration (expressividade) 3. Como marcar as pausas no texto para melhor resultado 4. Se devo usar Speech-to-Speech para maior controle
CONFIGURAÇÕES RECOMENDADAS
Vozes Sugeridas
- • Adam - madura, natural
- • Antoni - calorosa, emotiva
- • Daniel - profunda, autoritativa
Voice Settings
- • Stability: 65-75%
- • Similarity: 75-85%
- • Style: 20-30%
Vivemos... com pressa. Mensagens que não terminamos de ler. Cafés... que não terminamos de sentir. ... Mas nas montanhas de Minas... o tempo ainda tem outro ritmo. ... Mãos que conhecem cada grão pelo nome. Sol... que amadurece sem pressa. Chuva... que chega na hora certa. ... Da terra ao torredor. Do torredor... às suas mãos. ... Cada xícara carrega essa jornada. Cada gole... uma pausa que você merece. ... Raízes. O tempo das coisas boas.
DICAS PARA ELEVENLABS
• Use "..." para pausas longas (2-3 segundos)
• Quebras de linha criam pausas médias
• Vírgulas e pontos criam pausas curtas
• Gere múltiplas takes e escolha a melhor
• Use "Projects" para editar takes específicos
3 Trilha Musical com Suno AI
Vamos criar uma trilha sonora original que complementa a narração sem competir com ela. A música deve ser emocional mas sutil.
Ambient cinematic instrumental, gentle acoustic guitar fingerpicking, soft piano chords, warm strings in background, Brazilian bossa nova influence, contemplative and peaceful, slow tempo 65 BPM, documentary style underscore, emotional but not dramatic, perfect for voiceover, coffee shop atmosphere, morning golden hour feeling [Instrumental]
Ethereal ambient soundscape, soft synthesizer pads, nature-inspired textures, gentle flute melody, organic and earthy, Brazilian countryside feeling, misty mountains atmosphere, contemplative and spacious, 60 BPM, drone background, documentary nature film style, peaceful dawn [Instrumental]
Uplifting cinematic instrumental, warm orchestral strings crescendo, hopeful piano melody, gentle acoustic guitar, emotional climax building, inspiring and heartwarming, 70 BPM, documentary finale style, sunrise feeling, satisfying resolution, brand anthem quality [Instrumental]
ESTRUTURA MUSICAL PARA 60 SEGUNDOS
4 Efeitos Sonoros e Ambiente
Os efeitos sonoros adicionam realismo e imersão. Vamos criar uma lista de sons necessários e onde encontrá-los.
Crie uma lista completa de efeitos sonoros necessários para o vídeo "Raízes", indicando onde posicionar cada som. CENAS DO VÍDEO: 01. Mãos digitando no celular (0-3s) 02. Tela com mensagens (3-6s) 03. Café no escritório (6-10s) 04. Transição para montanhas (10-15s) 05. Fazenda de café (15-20s) 06. Mãos colhendo (20-25s) 07. Sol no cafezal (25-30s) 08. Chuva nas folhas (30-35s) 09. Torra do café (35-38s) 10. Embalagem (38-42s) 11. Pessoa saboreando (42-50s) 12. Encerramento (50-60s) PARA CADA CENA, LISTE: 1. Efeitos pontuais (sons específicos com timing) 2. Ambientes contínuos (atmosfera de fundo) 3. Intensidade sugerida (sutil/moderado/destaque) 4. Onde encontrar (ElevenLabs SFX / Freesound / Epidemic Sound) CRITÉRIOS: - Sons devem complementar, não competir com narração - Transições suaves entre ambientes - Realismo mas não excesso
LISTA DE EFEITOS POR CENA
- • Notificações de celular (sutis)
- • Burburinho de escritório (ambiente)
- • Teclado digitando (pontual)
- • Ar condicionado (textura de fundo)
- • Pássaros cantando (ambiente)
- • Vento nas folhas (textura)
- • Chuva suave (destaque na cena 08)
- • Passos em terra (pontual)
- • Grãos caindo em cesto (foley)
- • Grãos no torrador (destaque)
- • Café sendo servido (foley)
- • Vapor/água fervendo (sutil)
- • Xícara na mesa (pontual)
- • Respiração satisfeita (muito sutil)
Coffee beans tumbling and roasting in traditional drum roaster, crackling sounds, gentle mechanical rotation, warm aromatic atmosphere, artisanal coffee production
Brazilian countryside morning ambience, distant birds singing, gentle breeze through coffee plants, peaceful rural atmosphere, dawn on mountain farm, no traffic or urban sounds
5 Guia de Mixagem
A mixagem equilibra todas as camadas de áudio. Aqui está um guia de níveis para que cada elemento tenha seu espaço.
Crie um plano de mixagem de áudio para um vídeo publicitário de 60 segundos com narração. ELEMENTOS DE ÁUDIO: 1. Narração (voiceover principal) 2. Trilha musical (instrumental) 3. Efeitos sonoros pontuais 4. Ambientes contínuos REQUISITOS: - Narração sempre inteligível e em primeiro plano - Música complementa sem competir - Efeitos adicionam realismo sem distração - Transições suaves entre seções FORNEÇA: 1. Níveis de referência em dB para cada elemento: - Durante narração - Durante pausas de narração 2. Técnicas de ducking: - Quanto abaixar música quando narração entra - Tempo de attack/release do compressor sidechain 3. Frequências: - Onde fazer cortes de EQ para dar espaço à voz - Faixas de frequência de cada elemento 4. Panorama (stereo): - Posicionamento de cada elemento no campo stereo 5. Momentos-chave: - Onde aumentar/diminuir música - Onde destacar efeitos específicos
NÍVEIS DE REFERÊNCIA
| Elemento | Com Narração | Sem Narração |
|---|---|---|
| Narração | -6 dB | — |
| Música | -18 dB | -12 dB |
| Efeitos | -24 dB | -18 dB |
| Ambiente | -30 dB | -24 dB |
DUCKING (Sidechain)
- • Redução: -6 a -9 dB quando narração ativa
- • Attack: 50-100ms (suave)
- • Release: 300-500ms (gradual)
- • Ratio: 3:1 a 4:1
6 Organização dos Arquivos de Áudio
ESTRUTURA DE PASTAS
05-audio/
├── voiceover/
│ ├── narration-take1.wav
│ ├── narration-take2.wav
│ └── narration-FINAL.wav
├── music/
│ ├── trilha-principal-v1.mp3
│ ├── trilha-principal-v2.mp3
│ ├── trilha-natureza.mp3
│ └── trilha-emocional-final.mp3
├── sfx/
│ ├── urbano/
│ │ ├── notificacoes.wav
│ │ └── escritorio-ambiente.wav
│ ├── natureza/
│ │ ├── passaros.wav
│ │ ├── vento-folhas.wav
│ │ └── chuva-suave.wav
│ └── produto/
│ ├── torrador-graos.wav
│ ├── cafe-servindo.wav
│ └── xicara-mesa.wav
└── mix/
└── audio-final-master.wav
Checklist do Módulo 5.5
Ao final deste módulo você deve ter: