🗣️ (Alpha) iApp Text-to-Speech (TTS) 🆕
🗣️ API การสังเคราะห์เสียงพูดจากข้อความโดยใช้ AI
ยินดีต้อนรับสู่ iApp TTSv3 API บริการสังเคราะห์เสียงพูดจากข้อความที่ล้ำสมัย ซึ่งแปลงข้อความเป็นเสียงพูดที่ฟังดูเป็นธรรมชาติ API ของเราใช้แบบจำลอง AI ขั้นสูงในการสร้างเสียงจากข้อความป้อนเข้าด้วยความแม่นยำและความเร็วที่ยอดเยี่ยม
ลองใช้ Demo
เริ่มต้นใช้งาน
ข้อกำหนดเบื้องต้น
- ข้อความป้อนเข้าเป็นภาษาไทย
- โทเค็นสูงสุด: 1400
- รูปแบบเอาต์พุต: WAV
เริ่มต้นอย่างรวดเร็ว
- การประมวลผลที่รวดเร็วด้วยการเร่งความเร็ว GPU
- การสร้างเสียงพูดที่เป็นธรรมชาติ
- เอาต์พุตเสียงคุณภาพสูง
คุณสมบัติหลัก
- การสังเคราะห์เสียงพูดที่เป็นธรรมชาติโดยใช้ AI ที่ทันสมัย
- การปรับแต่งคุณภาพเสียงขั้นสูงผ่านพารามิเตอร์
- เวลาตอบสนองที่รวดเร็ว
- อินเทอร์เฟซ API REST ที่เรียบง่าย
การใช้งาน API
จุดสิ้นสุด
POST /tts
- สร้างเสียงพูดจากข้อความและดาวน์โหลดเป็นไฟล์
ตัวอย่างการร้องขอ API
การใช้ cURL:
# ตรวจสอบสถานะ
curl https://api.iapp.co.th/v3/audio/health
# สร้างเสียงพูดและบันทึกไปยังไฟล์
curl -X POST https://api.iapp.co.th/v3/audio/tts \
-H "Content-Type: application/json" \
-d '{"text":"Hello, this is a test.","temperature":0.2,"top_p":0.95}' \
--output test.wav
การใช้ Python:
import requests
# การร้องขอ Text-to-speech
response = requests.post(
"https://api.iapp.co.th/v3/audio/tts",
json={
"text": "สวัสดีครับ",
"temperature": 0.2,
"top_p": 0.95,
"max_new_tokens": 1400
}
)
# บันทึกการตอบสนองเสียงไปยังไฟล์
with open("output.wav", "wb") as f:
f.write(response.content)
พารามิเตอร์การร้องขอ
พารามิเตอร์ | ชนิด | คำอธิบาย | ค่าเริ่มต้น |
---|---|---|---|
text | string | ข้อความที่จะแปลงเป็นเสียงพูด | จำเป็นต้องระบุ |
temperature | float | อุณหภูมิการสร้าง (สูงกว่า = สุ่มมากกว่า) | 0.2 |
top_p | float | พารามิเตอร์การสุ่มตัวอย่าง top-p | 0.95 |
max_new_tokens | integer | จำนวนโทเค็นสูงสุดที่จะสร้าง | 1400 |
แนวทางปฏิบัติที่ดีที่สุด
- ใช้เครื่องหมายวรรคตอนอย่างถูกต้องเพื่อการสังเคราะห์เสียงที่ดีขึ้น
- รักษาประโยคให้เป็นธรรมชาติและสนทนา
- สำหรับข้อความยาว ให้พิจารณาแบ่งออกเป็นส่วนย่อย
- ปรับพารามิเตอร์อุณหภูมิและ top-p เพื่อควบคุมสไตล์เสียง:
- อุณหภูมิต่ำ (0.1-0.5): เสียงที่สม่ำเสมอและเสถียรมากขึ้น
- อุณหภูมิสูง (0.6-1.0): มีความแสดงออกมากกว่า แต ่คาดเดาได้น้อยลง