Voz Japonesa

Converta texto em voz japonesa com IA — 100+ vozes masculinas e femininas, pronúncia, MP3 grátis.

ja-JP

Asuka

Estilo

Velocidade:1.0

Tom:0

Volume:100%

Formato do ficheiro

Formato:

Taxa de bits:

Taxa de Amostragem:

Canais:

Controlo de Pausa

Pausa para parágrafos:

Pausa para frases:

Estas definições controlam a duração do silêncio entre blocos de texto para uma fala com som natural.

Música de fundo

Faixa atual Nenhum selecionado

Volume: 100%

Repetir Repetir fundo infinitamente

100+ vozes de IA — Acento tonal de Tóquio, mora timing e escritas mistas

Do bairro da Liberdade em São Paulo — maior Japantown fora do Japão e lar de uma comunidade nikkei de quase 2 milhões de pessoas — ao preparatório para o JLPT em qualquer universidade brasileira: cole o texto em japonês e ouça o acento tonal de Tóquio na hora. O padrão L-H-L que separa 橋 (ponte) de 箸 (pauzinhos), as vogais mudas em です /des/ e ます /mas/, a mora silenciosa do pequeno っ sokuon e o R alveolar de toque único — tudo reproduzido sem ajuste manual. Hiragana, katakana e kanji convivem no mesmo campo. Escolha Daichi (PRO Neural, masculino) ou Akemi (PRO Neural, feminino) e baixe o MP3 em segundos.

Para qualidade de estúdio, Achird JP (HD, masculino) e Achernar JP (HD, feminino) entregam padrão broadcast — ideal para o circuito brasileiro de dublagem de anime, para as sessões do Bunkyo e para aulas on-line voltadas a descendentes e dekasseguis. O catálogo cobre treino de JLPT N5–N1, dublagem de anime e visual novels, narração para YouTube e audiobooks de literatura japonesa clássica, além de guias de áudio para templos, santuários e roteiros turísticos no Japão. Primeiros 1.000 caracteres gratuitos — sem conta, sem marca d'água.

Vozes de IA em Japonês — Amostras

Clique para ouvir · 100+ vozes no total

Estes são 4 locutores em destaque. Navegue por todos na página de vozes — filtre por idioma japonês.

Estilos de voz — 3 registros expressivos

Algumas vozes Neural PRO desbloqueiam estilos expressivos além do registro neutro padrão. Mesma frase, mesma locutora — Nanami, uma voz feminina japonesa PRO Neural — lê a linha abaixo em três estados de espírito diferentes.

cheerful Conteúdo infantil, anúncios animados, spots promocionais.

chat Vlogs, explicações descontraídas, intros de podcast, conversa amigável.

customerservice Saudações IVR, linhas de suporte, anúncios corteses, tom formal.

As três amostras acima leem a mesma frase em japonês. Nanami é a única voz ja-JP com múltiplos estilos expressivos (cheerful, chat, customer-service). As 100+ vozes japonesas restantes leem no registro neutro padrão.

Guia de Pronúncia Japonesa e Acento Tonal

A pronúncia japonesa é definida pelo timing de mora, acento tonal e três sistemas de escrita trabalhando juntos. Estes seis recursos são onde a qualidade do TTS separa o áudio com som nativo do resultado robótico — ouça como o SpeechGen lida com cada um.

日本語 ni·HO·N·go Acento tonal Tokyo Padrão Tokyo: baixo na primeira mora, alto a partir da segunda, depois cai. にほんご = padrão B-A-A-B. O acento tonal não é ênfase — o volume fica igual enquanto o pitch muda.

おかあさん o·ka·A·san Vogais longas (長音) O duplo あ em おかあさん (mãe) é mantido por duas moras. Compare おかさん — um encurtamento sem sentido. Vogais longas são escritas como ā em romaji. No TTS: use o kana correto e o motor cuida do comprimento automaticamente.

がっこう ga·k·KO·u Timing mora (促音) O pequeno っ (sokuon) é uma mora silenciosa — uma breve pausa antes da consoante seguinte. がっこう (escola) tem um fechamento antes do k. Ignorá-lo deixa a palavra com som artificial. Cada mora tem duração igual no japonês.

です des (not de·su) Vogais silenciosas (無声化) No japonês padrão de Tokyo, as vogais い e う são ensurdecidas (sussurradas ou silenciosas) entre consoantes surdas ou no final de palavras. です soa como "des". Também: ます → "mas". Vozes de IA tratam isso corretamente.

らりるれろ ra·ri·ru·re·ro O R japonês (弾き音) O R japonês é uma vibrante alveolar — um único toque da língua no céu da boca. Não é o R inglês nem o L. Mais próximo do "d" rápido no inglês americano "butter". Daichi e Akemi produzem esse som corretamente sem ajuste SSML.

橋 vs 箸 ha·SHI vs HA·shi Par mínimo tonal 橋 (ponte) = padrão B-A; 箸 (pauzinhos) = padrão A-B. Mesmo kana はし, pitch diferente — significado diferente. É por isso que o acento tonal importa na pronúncia japonesa. A voz de IA resolve a ambiguidade pelo contexto kanji automaticamente.

Por que o acento tonal importa no TTS

Pitch, não ênfase — O japonês é uma língua de acento tonal, diferente do português, que se apoia na intensidade. O volume permanece constante; só o padrão alto/baixo muda entre as moras. Um padrão tonal errado soa estrangeiro mesmo quando cada som está perfeito.
O kanji resolve a ambiguidade — Muitos pares de homófonos diferem apenas no pitch (橋/箸, 雨/飴). Quando você insere kanji, a voz de IA seleciona o padrão de pitch certo a partir do contexto. Escreva em kanji sempre que quiser o áudio mais natural possível.
Três sistemas de escrita, um motor — hiragana, katakana e kanji convivem livremente no mesmo campo. Empréstimos estrangeiros em katakana (コーヒー, テレビ, パソコン) e nomes em romaji são lidos corretamente sem intervenção manual de fonemas.

Formatação e Convenções para TTS

Ao preparar texto japonês para o gerador de voz, estas regras de formatação afetam como o motor lê seu conteúdo:

Números e contadores

Escreva números em kanji para leitura mais natural: 三つ、五冊、二人. O japonês usa palavras contadoras (助数詞) que variam conforme o tipo de objeto — 一本 (objetos longos), 一枚 (objetos planos), 一匹 (animais pequenos). Algarismos arábicos também funcionam (3 → さん), mas contadores em kanji soam mais nativos.

Moeda

¥1.500 → "せんごひゃくえん". O símbolo do iene é lido automaticamente. Para valores grandes: 一万円 (10.000 ienes) → "いちまんえん". Como o japonês usa 万 (10.000) como unidade, o motor lê 3万円 corretamente sem marcação manual de pronúncia.

Datas e horas

Ordem japonesa de data: ano → mês → dia. 2024年3月15日 → "にせんにじゅうよねんさんがつじゅうごにち". Hora: 14時30分 → "じゅうよじさんじゅっぷん". Escreva sempre com os marcadores kanji (年・月・日・時・分) para garantir a leitura correta.

Formalidade (敬語 Keigo)

O japonês tem três registros: casual (だ/である), polido (です/ます) e honorífico (keigo). Use terminações です・ます para conteúdo profissional e だ・だよ para narração casual. O motor lê ambos corretamente — a escolha de formalidade é sua.

O que Você Pode Criar

Study desk with hiragana charts, JLPT textbook and headphones

JLPT, shadowing e aulas nikkei

Cole qualquer frase e ouça exatamente como o contorno tonal sobe e desce entre as moras. Reduza a reprodução para 0,75× e pegue as vogais mudas e o pequeno っ sokuon. Perfeito para preparatório JLPT N5–N1, drills de shadowing contra um modelo nativo e aulas de kanji em escolas japonesas brasileiras — da Liberdade a Curitiba e Londrina.

Home studio with video editing timeline and voiceover waveform

Dublagem de anime, visual novels e personagens

O Brasil tem uma das maiores tradições de dublagem de anime do mundo — monte o rascunho do áudio antes da sessão. Baixe o pitch em 4–6 semitons para vilões e figuras de autoridade; suba um pouco para personagens mais jovens. Use o Modo Diálogo para atribuir vozes distintas em roteiros com vários personagens. Importa direto no Premiere, DaVinci, Unity ou Ren'Py.

Travel flat-lay with torii gate figurine, Japan map, earbuds and shinkansen ticket

Criação de conteúdo e voice-over em YouTube

Adicione narração profissional a vídeos do YouTube, podcasts e reels em segundos. Achernar JP (HD) entrega voz feminina de nível broadcast; Daichi (PRO Neural) cobre explicadores e walkthroughs com leitura masculina clara. Exporte em MP3 e sincronize no Premiere, DaVinci, CapCut ou qualquer editor da sua rotina.

Japanese novel with earphones and shoji window light

Turismo e guias de áudio no Japão

Monte guias de áudio para templos e santuários (Kyoto, Nara, Nikko), city tours a pé (Tóquio, Osaka, Sapporo) e boas-vindas de ryokan. Gere avisos em estações de Shinkansen e metrô, descrições de exposições e textos introdutórios de restaurantes. Baixe como MP3 e implante off-line em qualquer dispositivo antes da viagem ao Japão.

Como Funciona — 3 Passos

Do texto ao áudio em segundos. Sem software, sem cadastro necessário.

Cole seu texto

Digite diretamente ou cole até 1.000.000 de caracteres. O motor processa hiragana, katakana, kanji e escritas mistas em uma única passagem. Faça upload de DOCX ou PDF para documentos longos.

Escolha uma voz

Escolha entre 100+ locutores nativos. Filtre por gênero, nível de qualidade (Standard, PRO Neural, HD) e ja-JP. Ajuste a velocidade para praticar o acento tonal no seu ritmo ou defina o pitch para dublagem de personagens.

Ouça e baixe grátis

Clique em Convert to Speech, pré-ouça o resultado e baixe como MP3, WAV ou FLAC. Primeiros 1.000 caracteres gratuitos — sem conta, sem marca d'água em qualquer plano.

Experimente agora — role para cima

Perguntas Frequentes

Qual voz japonesa soa mais natural?

Para broadcast e audiolivros, Achernar JP (HD, feminino) e Achird JP (HD, masculino) entregam a leitura mais limpa e natural — contornos de pitch de Tóquio em nível de rádio. Para conteúdo cotidiano e aulas de japonês, Daichi (PRO Neural, masculino) e Akemi (PRO Neural, feminino) têm um tom quente e conversacional. As quatro vozes processam hiragana, katakana e kanji misturados em uma única entrada sem marcação fonêmica.

Como praticar o acento tonal com TTS?

Cole uma palavra ou frase, gere o áudio e escute o contorno alto-baixo entre as moras. Reduza a reprodução para 0,75× — variações de pitch ficam mais fáceis de captar em velocidade reduzida. Para pares mínimos como 橋 (ponte, L-H) vs 箸 (pauzinhos, H-L) — mesmo kana はし, pitch diferente — gere os dois clipes separadamente e compare. Digite em kanji em vez de kana para que o motor escolha o pitch correto pelo contexto.

Posso usar essas vozes para dublagem de anime no Brasil?

Sim. A dublagem brasileira é uma das melhores do mundo e o fluxo aqui encaixa perfeitamente: escolha uma voz masculina ou feminina, cole o diálogo e ajuste o pitch em 4–6 semitons — mais grave para vilões e figuras de autoridade, mais agudo para personagens jovens ou enérgicos. Exporte em MP3 e sincronize no Premiere, DaVinci, Unity ou Ren'Py. O Modo Diálogo permite atribuir vozes distintas a cada personagem em um roteiro multi-linha numa única sessão — útil para fandubs, visual novels e cadeias de NPCs em jogos indie.

É realmente grátis para baixar o MP3?

Sim. Os primeiros 1.000 caracteres são gratuitos sem conta, sem cartão, sem marca d'água — cole, gere e baixe. Crie uma conta grátis e receba mais 3.000 caracteres por dia durante sete dias. Todo arquivo sai com licença comercial embutida em qualquer plano, então o áudio funciona em YouTube monetizado, podcasts, jogos indie e trabalhos comerciais sem taxas adicionais.

O motor lê o acento tonal de Tóquio corretamente?

Sim. As vozes PRO Neural e HD foram treinadas em japonês padrão de Tóquio e reproduzem os padrões de pitch corretos para o vocabulário comum. Entradas em kanji resolvem a ambiguidade de homófonos pelo contexto — 橋 e 箸 soam diferentes, mesmo que ambos romanizem como "hashi". Para palavras raras, nomes próprios ou vocabulário técnico, insira uma tag SSML <phoneme> para especificar a pronúncia explicitamente.