API-instruksjon for tekst til tale

, 08-09-2025

API-en er kun tilgjengelig etter at du har fylt på kontoen din.

JSON API-stemmer https://speechgen.io/index.php?r=api/voices.

Det er 2 tekst-talealternativer tilgjengelig via API-en:

1 alternativ - rask tale av korte tekster.
2 alternativ - innstilling av en taleoppgave.

Integrasjonseksempler

Oppdag hvordan du kan effektivisere oppretting av stemmeinnhold ved å integrere SpeechGen.io med automasjonstjenesten MAKE. Denne guiden dekker automatisering av tekst-til-tale-prosesser, noe som gjør det enklere og mer effektivt å generere stemmeinnhold for ulike applikasjoner.

1 alternativ - rask tale av korte tekster

URL for variant 1: https://speechgen.io/index.php?r=api/text

Tekst sendes til API-en, du får umiddelbare resultater.

Dette alternativet har en maksimal grense på 2000 tegn. Og også et maksimum på 2 stemmeendringer. Hvis grensene overskrides, vil du få en feil (status = -1).

Forespørselsformat

$data = [ 'token'=>'SekretKeyInYourProfile', 'email'=>'yourMail@gmail.com', 'voice'=>'John', 'text'=>"Text for text to Speech", 'format'=>'mp3', 'speed'=>1.1, 'pitch'=>0.8, 'emotion'=>'good', 'pause_sentence'=>300, 'pause_paragraph'=>400, 'bitrate'=>48000, ];

Obligatoriske parametere:

'token' - 'SekretNøkkelINokProfilenDin' 'email' - 'dinMail@gmail.com' 'voice' - 'Stemme' 'text' - 'Tekst for tekst til tale'

Valgfrie parametere:

'format' - format of the resulting file, by default = mp3, possible values ( 'mp3', 'wav', 'ogg') 'speed' - playback speed, by default 1, (range from 0.1 to 2.0) 'pitch'- voice pitch, by default 0, (range from -20 to 20) 'emotion' - emotion of voice , by default 'good', possible values ( 'good', 'evil', 'neutral'). 'pause_sentence' - The size of the pause between sentences in milliseconds. 'pause_paragraph' - The size of the pause between paragraphs in milliseconds. 'bitrate'=>48000 - Bitrate from 8000 to 192000 Hz.

Følelse Ikke tilgjengelig for alle stemmer, se her.

Svaret kommer i JSON:

{ "id":"4153594", "status":"0", "file":"result.mp3", "file_cors":"result_cors.mp3", "parts":"5", "parts_done":"2", "duration":"0", "format":"mp3", "error":"", "balans":"3331.2720000314", "cost":"0.06" }

Beskrivelse:

"id" - unik stemme-ID "status" - gjeldende talestatus. Tilgjengelig fra 3 verdier: 0 - prosess 1 - fullført vellykket -1 - feil "file" - lydfilbane, tilgjengelig hvis status= 1 "file_cors" - lydfilbane CORS "error" - feiltekst, i tilfelle, hvis status = -1 "parts" - antall taler "parts_done" - antall fullførte deler "duration" - lydfilens varighet i sekunder, tilgjengelig hvis status = 1 "format" - lydfilformat "balans" - grensebalanse "cost" - taleutgifter. (økes etter hvert som stemmedelene blir dubbet)

Eksempel på en kort teksttale i PHP variant 1

$data = [ 'token' => '123456', 'email' => 'mail@mail.com', 'voice' => 'John', 'text' => "Text", 'format' => 'mp3', 'speed' => 1.1, 'pitch' => 0, 'emotion' => 'good', ]; $url = "https://speechgen.io/index.php?r=api/text"; $ch = curl_init(); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data)); $response = curl_exec($ch); var_dump($response); $response = json_decode($response, true); if (curl_errno($ch)) { var_dump("Connection error with text recognition server, " . curl_error($ch)); } else { var_dump($response); if ($response["status"] == 1) { //Copy echo " ok " . $response["file"]; copy($response["file"], 'Filename.' . $response["format"]); } else { //Error, no voiceover possible echo $response["error"]; } } curl_close($ch);

Alternativ 2 er å sette en taleoppgave for teksten.

URL for alternativ 2: https://speechgen.io/index.php?r=api/longtext

Steg 1: Tekst sendes til API-en og en unik stemme-ID oppnås(id).
Steg 2:  Be om resultatet av dubbingen ved å sende dubbingidentifikatoren (id).

Denne metoden har ingen begrensninger og tillater tekstdubbing på opptil 1 000 000 tegn. Dubbingen skjer i prioritert rekkefølge (førstemann til mølla) og kan ta fra 1 til flere minutter, avhengig av tekstens lengde.

Forespørselsformat

$data = [ 'token'=>'SekretKeyInYourProfile', 'email'=>'yourMail@gmail.com', 'voice'=>'John', 'text'=>"Text", 'format'=>'mp3', 'speed'=>1.1, 'pitch'=>0.8, 'emotion'=>'good', 'pause_sentence'=>300, 'pause_paragraph'=>400, 'bitrate'=>48000, ];

Obligatoriske parametere:

'token' - 'SekretNøkkelINokProfilenDin' 'email' - 'dinMail@gmail.com' 'voice' - 'Stemme' 'text' - 'Tekst'

Valgfrie parametere:

'format' - format of the resulting file, by default = mp3, possible values( 'mp3', 'wav', 'ogg') 'speed' - speed, by default 1, (range from 0.1 to 2.0) 'pitch'- voice pitch, by default 0, (range from -20 to 20) 'emotion' - emotional coloration, by default 'good', possible values ( 'good', 'evil', 'neutral'). 'pause_sentence' - The size of the pause between sentences in milliseconds. 'pause_paragraph' - The size of the pause between paragraphs in milliseconds. 'bitrate'=>48000 - Bitrate from 8000 to 192000 Hz.

Ikke tilgjengelig for alle stemmer, se her.

Svaret kommer i JSON:

{ "id":"4153594", "status":"0", "parts":"5", "parts_done":"0", "format":"mp3", "error":"", "balans":"3331.2720000314", "cost":"0.00" }

Beskrivelse:

"id" - unik stemme-ID "status" - gjeldende talestatus. Tilgjengelig fra 2 verdier: 1 - oppgave lagt til vellykket -1 - feil "error" - feiltekst, i tilfelle, hvis status = -1 "parts" - antall taler "parts_done" - antall fullførte deler "format" - lydfilformat "balans" - balansen av kontogrensene "cost" - taleutgifter. (økes etter hvert som stemmedelene blir dubbet)

Steg 2. Etter å ha opprettet en oppgave og mottatt en identifikator (id), må en forespørsel sendes til https://speechgen.io/index.php?r=api/result, for å finne ut resultatet.

Forespørselsformat

$data = [ 'token'=>'SekretKeyInYourProfile', 'email'=>'yourMail@gmail.com', 'id'=>4153594, ];

Obligatoriske parametere:

'token' - SekretNøkkelINokProfilenDin 'email' - dinMail@gmail.com 'id' - Unik stemme-ID mottatt i steg 1

Svaret kommer i JSON:

{ "id":"4153594", "status":"0", "file":"result.mp3", "cuts":["result_1.mp3","result_2.mp3",...], "parts":"5", "parts_done":"0", "format":"mp3", "error":"", "balans":"3331.2720000314", "cost":"0.00" }

Beskrivelse:

"id" - unik stemme-ID "status" - gjeldende talestatus. Tilgjengelig fra 3 verdier: 0 - pågår 1 - fullført vellykket -1 - feil "file" - lydfilbane, tilgjengelig hvis status = 1 "error" - feiltekst, i tilfelle, hvis status = -1 "parts" - antall taler "parts_done" - antall fullførte deler "duration" - lydfilens varighet i sekunder, tilgjengelig hvis status = 1 "format" - lydfilformat "balans" - balansen av kontogrensene "cost" - taleutgifter. (økes etter hvert som stemmedelene blir dubbet) "cuts" - Array av fragmenter, hvis "cut"-taggen brukes i teksten

Eksempel på en kort testtale i PHP variant 2

//STEP 1 $data = [ 'token' => '123456', 'email' => 'mail@mail.com', 'voice' => 'John', 'text' => "Text", 'format' => 'mp3', 'speed' => 1.1, 'pitch' => 0, 'emotion' => 'good', ]; $url = "https://speechgen.io/index.php?r=api/longtext"; $ch = curl_init(); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data)); $response = curl_exec($ch); var_dump($response); $response = json_decode($response, true); $resultId = 0; if (curl_errno($ch)) { var_dump("Error in connecting to the text recognition server, " . curl_error($ch)); } else { var_dump($response); if ($response["status"] == 1) { //Copy echo " ok " . $response["file"]; copy($response["file"], 'FileName.' . $response["format"]); } elseif ($response["status"] == 0) { //Remember the voice ID, and ask for the result later $resultId = $response["id"]; } else { //Error, no voiceover possible echo $response["error"]; } } curl_close($ch); //STEP 2 // Every minute we make a query-check of the result if($resultId){ $data = [ 'token'=>'123456', 'email'=>'mail@mail.com', 'id'=>$resultId, ]; $url = "https://speechgen.io/index.php?r=api/result"; $ch = curl_init(); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data)); $response = curl_exec($ch); var_dump($response); $response = json_decode($response,true); if (curl_errno($ch)) { var_dump("Error in connecting to the text recognition server, ".curl_error($ch)); }else{ var_dump($response); if($response["status"] == 1){ //Copy echo " ok ".$response["file"]; copy($response["file"], 'FileMane.' . $response["format"]); }elseif($response["status"] == 0){ //Not ready yet, we will ask for the result later echo "In process..."; }else{ //Error, no voiceover possible echo $response["error"]; } } curl_close($ch); }

Vi bruker informasjonskapsler for å sikre at du får den beste opplevelsen på nettstedet vårt. Finn ut mer: Personvernregler

Godta cookies