자막을 동기화된 AI 음성으로 오디오로 변환하기

일시 정지
명확하게
뒤로 가기
앞으로 나아가세요
인토네이션
SSML (Speech Synthesis Markup Language)
대화에 음성을 추가하세요.
subsay-asbreakmarkprosodyemphasisphoneme
subsay-asbreakprosodyemphasisphoneme
subsay-asbreakprosodyphoneme
subsay-asbreakprosodyemphasisphoneme
subbreakphoneme
문자
0
잔액
1 500 제한사항
? 음성 생성을 위한 한도(문자 수).
더 많은 한도를 받으세요
3 000 문자
? 표준 음성
1 500 문자
? 프리미엄 음성

신경망을 사용하여 동영상 자막을 음성으로 변환하고, 텍스트를 원하는 언어로 더빙합니다. 자막 파일을 업로드하면 SpeechGen이 모든 타임코드를 고려하여 이를 오디오로 변환합니다.

신경망을 통한 자막 더빙 작동 방식

SRT, SUB, VTT 형식의 자막 파일을 업로드하고, 언어와 원하는 음성, 음성 속도, 음정을 선택하세요. "자막 음성 생성" 버튼을 클릭하면 SpeechGen이 고급 신경망 알고리즘을 사용하여 자동으로 자막을 음성으로 변환합니다.

알아야 할 사항

작동 방식. 신경망은 자막 형식을 읽고 타이밍을 기반으로 오디오 세그먼트의 길이를 결정합니다. 예를 들어, 다음과 같은 세그먼트를 고려해보세요:
00:00:00,000 --> 00:00:02,500. 이는 0초부터 2초 500밀리초까지 지정된 텍스트를 음성으로 변환해야 함을 나타냅니다.

SpeechGen이 이 시간 내에 정상 속도로 음성 생성을 완료할 수 없다고 판단하면, 지정된 시간 내에 맞추기 위해 음성을 가속합니다. 그러나, 쾌적한 사운드를 위해 시스템은 최대 가속에 제한을 두고 있습니다. 음성 생성을 위해 3배 이상의 속도 증가가 필요할 경우, 검증기가 경고를 발행합니다.

이 문제는 정확하지 않은 자막과 언어마다 단어 길이가 다르기 때문에 발생할 수 있습니다. 문제가 있는 부분을 수동으로 수정하거나 SpeechGen이 어떤 속도로든 음성을 생성하도록 강제할 수 있습니다.

속도 제한을 무시하는 지시문. 줄의 시작에 해시 기호 #를 넣으면 SpeechGen이 해당 텍스트를 어떤 속도로든 강제로 음성 생성하고 타이밍에 맞춥니다. 하지만 최상의 더빙 품질을 위해 이전 자막 블록과 현재 자막 블록의 시간 간격을 조정하여 가속도를 더 고르게 분배하는 것을 권장합니다.

대괄호로 불필요한 텍스트 숨기기. 대화를 생략하고 싶지만 속도를 유지하려면 전체 텍스트 블록을 [ ]로 강조 표시하세요. SpeechGen은 대괄호 안에 있는 모든 내용을 무시하지만 타이밍은 준수됩니다.

각 파일 형식의 포맷을 준수하세요. 그렇지 않으면 시스템이 음성을 올바르게 합성할 수 없습니다. 예를 들어, srt에서 밀리초 앞에 쉼표를 놓치면 00:00:02500과 같이 시스템은 이를 읽을 숫자로 인식합니다. Google 번역을 통해 자막을 번역할 때 쉼표가 사라질 수 있습니다.

이 페이지에서 SpeechGen은 str, vtt, sub 형식과 연결됩니다. 따라서 일반 텍스트의 경우 표준 페이지 온라인 음성 생성을 사용하세요.

단일 타이밍 블록 내에서 텍스트 줄바꿈은 하나의 문장으로 음성 변환됩니다. 시스템이 문장이 끝났음을 이해할 수 있도록 필요한 위치에 마침표를 삽입하세요.

다중 음성 음성 생성이 가능한가요?

예, 다양한 음성으로 음성을 생성할 수 있습니다. 그러나 단일 타이밍 내에서는 하나의 음성만 음성 생성이 가능합니다. "음성 추가" 버튼을 통해 원하는 음성을 추가하고 각 대화를 단일 자막 블록 내에 완전히 감싸세요. 잘못된 경우 시스템이 경고를 발행합니다.

추가 음성은 어떤 언어로든 선택할 수 있습니다. 단, 자막이 해당 언어의 텍스트와 알파벳인지 확인하세요.

SRT, SUB, VTT 파일의 기술 정보에 대해 한도(크레딧)가 차감되나요?

아니요, 시스템은 기술 정보가 어디에 표시되는지 이해하고 한도를 차감할 때 이를 고려하지 않습니다. 그러나 음성 생성 필드 하단의 "문자 수" 미니 계산기는 모든 문자를 단순히 계산합니다. 걱정하지 마세요, 시스템은 이 정보를 기반으로 하지 않으며, 더 복잡한 자체 알고리즘을 사용합니다. 프로필에서 실제 한도 차감을 확인할 수 있습니다.

경제적인 캐싱이 가능한가요?

예, 동영상의 오프스크린 음성 생성을 할 때 SpeechGen은 각 문장을 캐싱합니다. 음성이 반복되면 변경된 문장에 대해서만 한도가 차감됩니다.

자막 타이밍을 변경하세요 - 동일한 텍스트로 반복되는 음성 생성은 무료입니다. 시스템은 자체 알고리즘에 따라 음성을 가속합니다. 새로운 간격에 맞추어야 할 경우, SpeechGen은 음성을 다시 생성하지 않고 단순히 속도를 높입니다. 따라서 추가 비용에 대한 걱정 없이 자막 간격을 편집하세요.

신경망을 사용한 오프스크린 더빙의 장점

  • 신경망 더빙을 사용하여 인터넷의 모든 동영상에서 자연스럽고 부드러운 더빙을 만드세요. 좋아하는 시리즈의 다음 에피소드를 더빙하기 위해 스튜디오를 기다릴 필요가 없습니다. 번역된 자막을 다운로드하고 SpeechGen에서 음성으로 변환한 후 감상하세요.
  • 자막을 매우 빠르게 오디오로 변환하세요. MP3 또는 WAV 형식의 오디오 파일을 받아 사용하세요. 오디오 파일을 합치고 동영상과 결합하여 더빙된 클립을 시청하세요.
  • 신경망을 사용한 동영상 음성 생성은 외국어 콘텐츠 접근성을 높입니다.
  • 다국어 오프스크린 번역을 만들어 청중을 확대하세요. 인기 있는 언어로 콘텐츠를 방송하세요.

API를 사용하여 자막 더빙이 가능한가요?

예, API를 통해 자막을 더빙할 수 있습니다. 여기에서 자세한 지침을 확인하세요.

누가 이 서비스를 사용할 수 있나요?

저희 서비스는 콘텐츠 제작자, 교육 기관, 마케팅 팀, 동영상을 더 접근 가능하고 인터랙티브하게 만들고자 하는 모든 이에게 적합합니다. 신경망을 사용한 자막 음성 생성은 청중을 확대하고 콘텐츠와의 상호작용을 개선할 수 있는 새로운 기회를 열어줍니다.

사용 예시

  • 국제 청중을 위한 오프스크린 음성 생성을 포함한 교육용 동영상.
  • 여러 언어로 더빙된 마케팅 및 광고 동영상.
  • 자막을 오디오로 변환하여 청각 장애인을 위한 비디오 콘텐츠 접근성 향상.
  • YouTube 채널 및 소셜 네트워크용 다국어 콘텐츠 생성.

지금 SpeechGen을 사용해보세요

이미 수많은 만족한 사용자들이 저희 서비스의 편리함과 효과를 인정했습니다. 신경망을 사용하여 자막을 음성으로 변환하고 오늘 바로 콘텐츠를 넓은 청중에게 전달하세요!

우리는 쿠키를 사용합니다 귀하가 당사 웹사이트에서 최상의 경험을 얻도록 보장합니다. 더 알아보세요: 개인정보 처리방침

쿠키 수락