Voz Japonesa
Converta texto em voz japonesa com IA — 100+ vozes masculinas e femininas, pronúncia, MP3 grátis.
100+ vozes de IA — Acento tonal de Tóquio, mora timing e escritas mistas
Do bairro da Liberdade em São Paulo — maior Japantown fora do Japão e lar de uma comunidade nikkei de quase 2 milhões de pessoas — ao preparatório para o JLPT em qualquer universidade brasileira: cole o texto em japonês e ouça o acento tonal de Tóquio na hora. O padrão L-H-L que separa 橋 (ponte) de 箸 (pauzinhos), as vogais mudas em です /des/ e ます /mas/, a mora silenciosa do pequeno っ sokuon e o R alveolar de toque único — tudo reproduzido sem ajuste manual. Hiragana, katakana e kanji convivem no mesmo campo. Escolha Daichi (PRO Neural, masculino) ou Akemi (PRO Neural, feminino) e baixe o MP3 em segundos.
Para qualidade de estúdio, Achird JP (HD, masculino) e Achernar JP (HD, feminino) entregam padrão broadcast — ideal para o circuito brasileiro de dublagem de anime, para as sessões do Bunkyo e para aulas on-line voltadas a descendentes e dekasseguis. O catálogo cobre treino de JLPT N5–N1, dublagem de anime e visual novels, narração para YouTube e audiobooks de literatura japonesa clássica, além de guias de áudio para templos, santuários e roteiros turísticos no Japão. Primeiros 1.000 caracteres gratuitos — sem conta, sem marca d'água.
- 100+ vozes nativas — Standard, PRO, HD
- Hiragana, katakana e kanji misturados
- Acento tonal de Tóquio e mora timing
- Baixe em MP3, WAV, FLAC, OGG
- Grátis — 1.000 caracteres, sem cadastro
Vozes de IA em Japonês — Amostras
Clique para ouvir · 100+ vozes no total
Estes são 4 locutores em destaque. Navegue por todos na página de vozes — filtre por idioma japonês.
Estilos de voz — 3 registros expressivos
Algumas vozes Neural PRO desbloqueiam estilos expressivos além do registro neutro padrão. Mesma frase, mesma locutora — Nanami, uma voz feminina japonesa PRO Neural — lê a linha abaixo em três estados de espírito diferentes.
As três amostras acima leem a mesma frase em japonês. Nanami é a única voz ja-JP com múltiplos estilos expressivos (cheerful, chat, customer-service). As 100+ vozes japonesas restantes leem no registro neutro padrão.
Guia de Pronúncia Japonesa e Acento Tonal
A pronúncia japonesa é definida pelo timing de mora, acento tonal e três sistemas de escrita trabalhando juntos. Estes seis recursos são onde a qualidade do TTS separa o áudio com som nativo do resultado robótico — ouça como o SpeechGen lida com cada um.
Por que o acento tonal importa no TTS
- Pitch, não ênfase — O japonês é uma língua de acento tonal, diferente do português, que se apoia na intensidade. O volume permanece constante; só o padrão alto/baixo muda entre as moras. Um padrão tonal errado soa estrangeiro mesmo quando cada som está perfeito.
- O kanji resolve a ambiguidade — Muitos pares de homófonos diferem apenas no pitch (橋/箸, 雨/飴). Quando você insere kanji, a voz de IA seleciona o padrão de pitch certo a partir do contexto. Escreva em kanji sempre que quiser o áudio mais natural possível.
- Três sistemas de escrita, um motor — hiragana, katakana e kanji convivem livremente no mesmo campo. Empréstimos estrangeiros em katakana (コーヒー, テレビ, パソコン) e nomes em romaji são lidos corretamente sem intervenção manual de fonemas.
Formatação e Convenções para TTS
Ao preparar texto japonês para o gerador de voz, estas regras de formatação afetam como o motor lê seu conteúdo:
Números e contadores
Escreva números em kanji para leitura mais natural: 三つ、五冊、二人. O japonês usa palavras contadoras (助数詞) que variam conforme o tipo de objeto — 一本 (objetos longos), 一枚 (objetos planos), 一匹 (animais pequenos). Algarismos arábicos também funcionam (3 → さん), mas contadores em kanji soam mais nativos.
Moeda
¥1.500 → "せんごひゃくえん". O símbolo do iene é lido automaticamente. Para valores grandes: 一万円 (10.000 ienes) → "いちまんえん". Como o japonês usa 万 (10.000) como unidade, o motor lê 3万円 corretamente sem marcação manual de pronúncia.
Datas e horas
Ordem japonesa de data: ano → mês → dia. 2024年3月15日 → "にせんにじゅうよねん さんがつ じゅうごにち". Hora: 14時30分 → "じゅうよじ さんじゅっぷん". Escreva sempre com os marcadores kanji (年・月・日・時・分) para garantir a leitura correta.
Formalidade (敬語 Keigo)
O japonês tem três registros: casual (だ/である), polido (です/ます) e honorífico (keigo). Use terminações です・ます para conteúdo profissional e だ・だよ para narração casual. O motor lê ambos corretamente — a escolha de formalidade é sua.
O que Você Pode Criar
JLPT, shadowing e aulas nikkei
Cole qualquer frase e ouça exatamente como o contorno tonal sobe e desce entre as moras. Reduza a reprodução para 0,75× e pegue as vogais mudas e o pequeno っ sokuon. Perfeito para preparatório JLPT N5–N1, drills de shadowing contra um modelo nativo e aulas de kanji em escolas japonesas brasileiras — da Liberdade a Curitiba e Londrina.
Dublagem de anime, visual novels e personagens
O Brasil tem uma das maiores tradições de dublagem de anime do mundo — monte o rascunho do áudio antes da sessão. Baixe o pitch em 4–6 semitons para vilões e figuras de autoridade; suba um pouco para personagens mais jovens. Use o Modo Diálogo para atribuir vozes distintas em roteiros com vários personagens. Importa direto no Premiere, DaVinci, Unity ou Ren'Py.
Criação de conteúdo e voice-over em YouTube
Adicione narração profissional a vídeos do YouTube, podcasts e reels em segundos. Achernar JP (HD) entrega voz feminina de nível broadcast; Daichi (PRO Neural) cobre explicadores e walkthroughs com leitura masculina clara. Exporte em MP3 e sincronize no Premiere, DaVinci, CapCut ou qualquer editor da sua rotina.
Turismo e guias de áudio no Japão
Monte guias de áudio para templos e santuários (Kyoto, Nara, Nikko), city tours a pé (Tóquio, Osaka, Sapporo) e boas-vindas de ryokan. Gere avisos em estações de Shinkansen e metrô, descrições de exposições e textos introdutórios de restaurantes. Baixe como MP3 e implante off-line em qualquer dispositivo antes da viagem ao Japão.
Como Funciona — 3 Passos
Do texto ao áudio em segundos. Sem software, sem cadastro necessário.
Cole seu texto
Digite diretamente ou cole até 1.000.000 de caracteres. O motor processa hiragana, katakana, kanji e escritas mistas em uma única passagem. Faça upload de DOCX ou PDF para documentos longos.
Escolha uma voz
Escolha entre 100+ locutores nativos. Filtre por gênero, nível de qualidade (Standard, PRO Neural, HD) e ja-JP. Ajuste a velocidade para praticar o acento tonal no seu ritmo ou defina o pitch para dublagem de personagens.
Ouça e baixe grátis
Clique em Convert to Speech, pré-ouça o resultado e baixe como MP3, WAV ou FLAC. Primeiros 1.000 caracteres gratuitos — sem conta, sem marca d'água em qualquer plano.
Perguntas Frequentes
Para broadcast e audiolivros, Achernar JP (HD, feminino) e Achird JP (HD, masculino) entregam a leitura mais limpa e natural — contornos de pitch de Tóquio em nível de rádio. Para conteúdo cotidiano e aulas de japonês, Daichi (PRO Neural, masculino) e Akemi (PRO Neural, feminino) têm um tom quente e conversacional. As quatro vozes processam hiragana, katakana e kanji misturados em uma única entrada sem marcação fonêmica.
Cole uma palavra ou frase, gere o áudio e escute o contorno alto-baixo entre as moras. Reduza a reprodução para 0,75× — variações de pitch ficam mais fáceis de captar em velocidade reduzida. Para pares mínimos como 橋 (ponte, L-H) vs 箸 (pauzinhos, H-L) — mesmo kana はし, pitch diferente — gere os dois clipes separadamente e compare. Digite em kanji em vez de kana para que o motor escolha o pitch correto pelo contexto.
Sim. A dublagem brasileira é uma das melhores do mundo e o fluxo aqui encaixa perfeitamente: escolha uma voz masculina ou feminina, cole o diálogo e ajuste o pitch em 4–6 semitons — mais grave para vilões e figuras de autoridade, mais agudo para personagens jovens ou enérgicos. Exporte em MP3 e sincronize no Premiere, DaVinci, Unity ou Ren'Py. O Modo Diálogo permite atribuir vozes distintas a cada personagem em um roteiro multi-linha numa única sessão — útil para fandubs, visual novels e cadeias de NPCs em jogos indie.
Sim. Os primeiros 1.000 caracteres são gratuitos sem conta, sem cartão, sem marca d'água — cole, gere e baixe. Crie uma conta grátis e receba mais 3.000 caracteres por dia durante sete dias. Todo arquivo sai com licença comercial embutida em qualquer plano, então o áudio funciona em YouTube monetizado, podcasts, jogos indie e trabalhos comerciais sem taxas adicionais.
Sim. As vozes PRO Neural e HD foram treinadas em japonês padrão de Tóquio e reproduzem os padrões de pitch corretos para o vocabulário comum. Entradas em kanji resolvem a ambiguidade de homófonos pelo contexto — 橋 e 箸 soam diferentes, mesmo que ambos romanizem como "hashi". Para palavras raras, nomes próprios ou vocabulário técnico, insira uma tag SSML <phoneme> para especificar a pronúncia explicitamente.