Voz Japonesa
Convierte texto a voz japonesa con IA — 100+ voces masculinas y femeninas, pronunciación, MP3 gratis.
100+ voces de IA — Acento tonal de Tokio, mora timing y escrituras mixtas
Para la enorme comunidad hispanohablante de anime — criada con los doblajes de Bola de Dragón y Caballeros del Zodiaco, los salones del manga de Barcelona y la generación que ahora devora series en Crunchyroll — y para los estudiantes de la Casa Asia, el Japan Foundation Madrid y las licenciaturas de japonés de Barcelona y Madrid: pega cualquier texto y escúchalo con el acento tonal correcto de Tokio, el patrón L-H-L que distingue 橋 (puente) de 箸 (palillos), las vocales ensordecidas de です /des/ y ます /mas/, la っ pequeña (sokuon) y la R alveolar que se sitúa entre la R y la L inglesas. Hiragana, katakana y kanji se mezclan libremente en una sola entrada. Elige una voz como Daichi (PRO Neural, masculino) o Akemi (PRO Neural, femenino) y descarga tu MP3 en segundos.
Para calidad de estudio, Achird JP (HD, masculino) y Achernar JP (HD, femenino) ofrecen nivel broadcast. El catálogo cubre preparación del JLPT N5-N1, trabajo de personajes para doblaje de anime y novelas visuales, locuciones para YouTube, narración de audiolibros de literatura clásica (Kawabata, Mishima, Murakami) y audioguías turísticas para templos, santuarios y tours urbanos. Los primeros 1.000 caracteres son gratis — sin cuenta, sin marca de agua.
- 100+ voces nativas — Standard, PRO, HD
- Hiragana, katakana y kanji mezclados
- Acento tonal de Tokio y mora timing
- Descarga MP3, WAV, FLAC, OGG
- Gratis — 1.000 caracteres, sin registro
Voces AI en Japonés — Muestras de Voz
Clic para previsualizar · 100+ voces nativas en total
Son 4 locutores destacados de un total de 100+. Explora todos en la página de voces — filtra por ja-JP.
Estilos de voz — 3 registros expresivos
Algunas voces Neural PRO desbloquean estilos expresivos además del registro neutro predeterminado. Misma frase, misma hablante: Nanami, una voz femenina japonesa PRO Neural, lee la línea de abajo en tres estados de ánimo diferentes.
Las tres muestras anteriores leen la misma frase en japonés. Nanami es la única voz ja-JP con múltiples estilos expresivos (cheerful, chat, customer-service). Las 100+ voces japonesas restantes leen en su registro neutro predeterminado.
Guía de Pronunciación Japonesa y Acento Tonal
La pronunciación japonesa se define por el ritmo mora, el acento tonal y tres sistemas de escritura trabajando juntos. Estas seis características son donde la calidad del TTS separa el audio con sonido nativo de la salida robótica — escucha cómo SpeechGen maneja cada una.
Por Qué el Acento Tonal es Importante para TTS
- Tono, no intensidad — Es una lengua de acento tonal, no de acento de intensidad como el español o el inglés. El volumen se mantiene uniforme; solo cambia el patrón alto-bajo entre las moras. Un patrón tonal incorrecto suena extranjero a un oído nativo aunque cada sonido individual sea perfecto.
- El kanji resuelve la ambigüedad — Muchos pares homófonos difieren solo en el tono (橋/箸, 雨/飴). Cuando introduces kanji, la voz selecciona el patrón tonal correcto del contexto. Escribe con kanji en lugar de solo kana para obtener la lectura más natural.
- Tres sistemas de escritura, un motor — Hiragana, katakana y kanji se mezclan libremente en la misma entrada. Los préstamos extranjeros en katakana (コーヒー, テレビ, パソコン) y los nombres de marca en romaji se leen correctamente sin intervención manual a nivel de fonema.
Formato & Convenciones para TTS
Al preparar texto japonés para el generador de voz, estas reglas de formato afectan cómo el motor lee tu contenido:
Números & Contadores
Escribe los números en kanji para una lectura más natural: 三つ、五冊、二人. La lengua usa palabras contadoras (助数詞) que cambian según el tipo de objeto: 一本 (objetos largos), 一枚 (objetos planos), 一匹 (animales pequeños). Los números arábigos también funcionan — 3 → さん — pero los contadores en kanji suenan más auténticos.
Moneda
¥1,500 → "せんごひゃくえん". El signo del yen se lee automáticamente. Para grandes cantidades: 一万円 (10.000 yenes) → "いちまんえん". El japonés usa 万 (10.000) como unidad — el motor maneja 3万円 correctamente sin marcado de pronunciación manual.
Fechas & Hora
Orden de fecha japonés: año → mes → día. 2024年3月15日 → "にせんにじゅうよねん さんがつ じゅうごにち". Hora: 14時30分 → "じゅうよじ さんじゅっぷん". Escribe con marcadores de fecha kanji (年・月・日・時・分) para una lectura correcta.
Formalidad (敬語 Keigo)
El japonés tiene tres registros: casual (だ/である), educado (です/ます) y honorífico (keigo). Usa las terminaciones です・ます para contenido profesional, だ・だよ para locución casual. El motor de voz lee correctamente ambos registros — la elección del nivel de formalidad es tuya.
Lo que Puedes Crear
Aprendizaje y acento de Tokio
Para estudiantes de japonés de la Universidad Complutense, la Autónoma de Barcelona, la UNAM o los centros del Japan Foundation en Madrid y Ciudad de México: pega cualquier frase y escucha exactamente cómo sube y baja el contorno tonal entre las moras. Baja la velocidad a 0.75× para captar las vocales ensordecidas y la っ pequeña (sokuon). Ideal para preparar niveles JLPT N5-N1, para ejercicios de shadowing contra un modelo nativo y para memorizar vocabulario kanji con su lectura contextual correcta.
Creación de contenido y locución
Añade narración profesional a vídeos de YouTube, podcasts y reels de Instagram o TikTok en segundos. Achernar JP (HD) aporta voz femenina de calidad broadcast para reseñas y tutoriales; Daichi (PRO Neural) cubre presentaciones masculinas claras para explicaciones técnicas y de viajes. Exporta como MP3 y sincroniza directamente en Premiere, DaVinci o CapCut.
Turismo y audioguías
España y Latinoamérica han disparado sus viajes a Japón en los últimos años. Construye audioguías para templos y santuarios (Kioto, Nara, Nikko), tours a pie por Tokio, Osaka o Sapporo, y mensajes de bienvenida para ryokan. Genera avisos del Shinkansen y del metro, descripciones de salas de museo y presentaciones de restaurantes japoneses. Descarga MP3 y reprodúcelo offline en cualquier dispositivo.
Anime, novelas visuales y audiolibros
Para la inmensa comunidad hispanohablante del anime — herederos del doblaje clásico de Bola de Dragón, Caballeros del Zodiaco y Sailor Moon, y visitantes del Salón del Manga de Barcelona: reparte el diálogo de personajes en fandubs de anime, NPCs de videojuegos, escenas de novelas visuales y grabaciones cosplay. Baja el tono 4-6 semitonos para villanos y figuras mayores; súbelo un poco para personajes jóvenes o enérgicos. Usa el Modo Diálogo para asignar voces distintas en guiones multipersonaje. O narra desde Kawabata hasta Murakami con voz fluida. Exporta a Premiere, DaVinci, Unity o Ren'Py.
Cómo Funciona — 3 Pasos
Del texto al audio en segundos. Sin software, sin registro requerido.
Pega tu texto
Escribe directamente o pega hasta 1.000.000 de caracteres. El motor procesa hiragana, katakana, kanji y escrituras mezcladas en una sola pasada. Sube archivos DOCX o PDF para documentos largos.
Elige una voz
Elige entre 100+ locutores nativos. Filtra por género, nivel de calidad (Standard, PRO Neural, HD) y ja-JP. Ajusta la velocidad para practicar el acento tonal o modifica el tono para estilos de personajes en trabajos de doblaje.
Escucha y descarga gratis
Haz clic en Convert to Speech, previsualiza el resultado y descarga como MP3, WAV o FLAC. Los primeros 1.000 caracteres son gratis — sin cuenta. Sin marca de agua en ningún plan.
Preguntas Frecuentes
Para audiolibros y trabajo broadcast, Achernar JP (HD, femenino) y Achird JP (HD, masculino) ofrecen la entrega más limpia y natural — claridad de estudio con contornos tonales precisos de Tokio. Para contenido cotidiano y preparación del JLPT, Daichi (PRO Neural, masculino) y Akemi (PRO Neural, femenino) aportan un tono cálido y conversacional. Las cuatro manejan hiragana, katakana y kanji mezclados en una entrada sin marcado fonémico.
Pega una palabra o frase, genera el audio y escucha el contorno alto-bajo entre las moras. Baja la reproducción a 0.75× — los cambios de tono se detectan mejor a velocidad reducida. Para pares mínimos como 橋 (puente, L-H) y 箸 (palillos, H-L) — mismo kana はし, diferente tono — genera ambos como clips separados y compara directamente. Escribe con kanji en lugar de solo kana para que el motor resuelva el tono correcto del contexto, algo clave a partir del nivel JLPT N3.
Sí, y la comunidad hispana del anime (herencia del doblaje clásico de los 90 que sigue viva en los salones del manga de Barcelona y Ciudad de México) las usa constantemente. Selecciona una voz masculina o femenina, pega el diálogo, ajusta el tono entre 4 y 6 semitonos para moldear al personaje — más grave para villanos y figuras mayores, más agudo para personajes jóvenes o enérgicos. Exporta el MP3 y sincroniza en Premiere, DaVinci, Unity o Ren'Py. El Modo Diálogo permite asignar voces distintas a cada personaje en un guion multipersonaje en una sola sesión — útil para fandubs, novelas visuales y cadenas de diálogo NPC en videojuegos indie.
Sí. Los primeros 1.000 caracteres son gratis sin cuenta, sin tarjeta, sin marca de agua — basta pegar, generar y descargar. Crea una cuenta gratuita y obtendrás 3.000 caracteres adicionales al día durante siete días. Cada archivo se entrega con licencia comercial incluida en todos los planes, así que el audio funciona en canales de YouTube monetizados, podcasts, videojuegos indie y trabajos para clientes sin tasas extra.
Sí. Las voces PRO Neural y HD están entrenadas en el estándar de Tokio y reproducen los patrones tonales correctos para el vocabulario común. La entrada en kanji resuelve la ambigüedad de los homófonos a partir del contexto — 橋 y 箸 se leen de forma distinta aunque ambos se romanicen como "hashi". Para palabras raras, nombres propios o vocabulario técnico, añade una etiqueta SSML <phoneme> para indicar la pronunciación de forma explícita.