🗣️ (Alpha) iApp Text-to-Speech (TTS) 🆕

🗣️ API การสังเคราะห์เสียงพูดจากข้อความโดยใช้ AI

ยินดีต้อนรับสู่ iApp TTSv3 API บริการสังเคราะห์เสียงพูดจากข้อความที่ล้ำสมัย ซึ่งแปลงข้อความเป็นเสียงพูดที่ฟังดูเป็นธรรมชาติ API ของเราใช้แบบจำลอง AI ขั้นสูงในการสร้างเสียงจากข้อความป้อนเข้าด้วยความแม่นยำและความเร็วที่ยอดเยี่ยม

ลองใช้ Demo

API Key

Demo key is limited to 10 requests per day per IP
Click here to get your API key

Endpoint URL

cURL Command

กรุณากรอกข้อความที่คุณต้องการแปลที่นี่

เริ่มต้นใช้งาน

ข้อกำหนดเบื้องต้น

ข้อความป้อนเข้าเป็นภาษาไทย
โทเค็นสูงสุด: 1400
รูปแบบเอาต์พุต: WAV

เริ่มต้นอย่างรวดเร็ว

การประมวลผลที่รวดเร็วด้วยการเร่งความเร็ว GPU
การสร้างเสียงพูดที่เป็นธรรมชาติ
เอาต์พุตเสียงคุณภาพสูง

คุณสมบัติหลัก

การสังเคราะห์เสียงพูดที่เป็นธรรมชาติโดยใช้ AI ที่ทันสมัย
การปรับแต่งคุณภาพเสียงขั้นสูงผ่านพารามิเตอร์
เวลาตอบสนองที่รวดเร็ว
อินเทอร์เฟซ API REST ที่เรียบง่าย

การใช้งาน API

จุดสิ้นสุด

POST /tts - สร้างเสียงพูดจากข้อความและดาวน์โหลดเป็นไฟล์

ตัวอย่างการร้องขอ API

การใช้ cURL:

# ตรวจสอบสถานะ
curl https://api.iapp.co.th/v3/audio/health

# สร้างเสียงพูดและบันทึกไปยังไฟล์
curl -X POST https://api.iapp.co.th/v3/audio/tts \
  -H "Content-Type: application/json" \
  -d '{"text":"Hello, this is a test.","temperature":0.2,"top_p":0.95}' \
  --output test.wav

การใช้ Python:

import requests

# การร้องขอ Text-to-speech
response = requests.post(
    "https://api.iapp.co.th/v3/audio/tts",
    json={
        "text": "สวัสดีครับ",
        "temperature": 0.2,
        "top_p": 0.95,
        "max_new_tokens": 1400
    }
)

# บันทึกการตอบสนองเสียงไปยังไฟล์
with open("output.wav", "wb") as f:
    f.write(response.content)

พารามิเตอร์การร้องขอ

พารามิเตอร์	ชนิด	คำอธิบาย	ค่าเริ่มต้น
text	string	ข้อความที่จะแปลงเป็นเสียงพูด	จำเป็นต้องระบุ
temperature	float	อุณหภูมิการสร้าง (สูงกว่า = สุ่มมากกว่า)	0.2
top_p	float	พารามิเตอร์การสุ่มตัวอย่าง top-p	0.95
max_new_tokens	integer	จำนวนโทเค็นสูงสุดที่จะสร้าง	1400

แนวทางปฏิบัติที่ดีที่สุด

ใช้เครื่องหมายวรรคตอนอย่างถูกต้องเพื่อการสังเคราะห์เสียงที่ดีขึ้น
รักษาประโยคให้เป็นธรรมชาติและสนทนา
สำหรับข้อความยาว ให้พิจารณาแบ่งออกเป็นส่วนย่อย
ปรับพารามิเตอร์อุณหภูมิและ top-p เพื่อควบคุมสไตล์เสียง:
- อุณหภูมิต่ำ (0.1-0.5): เสียงที่สม่ำเสมอและเสถียรมากขึ้น
- อุณหภูมิสูง (0.6-1.0): มีความแสดงออกมากกว่า แต่คาดเดาได้น้อยลง

🗣️ (Alpha) iApp Text-to-Speech (TTS) 🆕

ลองใช้ Demo