Skip to main content

🗣️ (Alpha) iApp Text-to-Speech (TTS) 🆕

🗣️ API การสังเคราะห์เสียงพูดจากข้อความโดยใช้ AI

Version Status New

ยินดีต้อนรับสู่ iApp TTSv3 API บริการสังเคราะห์เสียงพูดจากข้อความที่ล้ำสมัย ซึ่งแปลงข้อความเป็นเสียงพูดที่ฟังดูเป็นธรรมชาติ API ของเราใช้แบบจำลอง AI ขั้นสูงในการสร้างเสียงจากข้อความป้อนเข้าด้วยความแม่นยำและความเร็วที่ยอดเยี่ยม

ลองใช้ Demo

Demo key is limited to 10 requests per day per IP
Click here to get your API key

เริ่มต้นใช้งาน

ข้อกำหนดเบื้องต้น

  • ข้อความป้อนเข้าเป็นภาษาไทย
  • โทเค็นสูงสุด: 1400
  • รูปแบบเอาต์พุต: WAV

เริ่มต้นอย่างรวดเร็ว

  • การประมวลผลที่รวดเร็วด้วยการเร่งความเร็ว GPU
  • การสร้างเสียงพูดที่เป็นธรรมชาติ
  • เอาต์พุตเสียงคุณภาพสูง

คุณสมบัติหลัก

  • การสังเคราะห์เสียงพูดที่เป็นธรรมชาติโดยใช้ AI ที่ทันสมัย
  • การปรับแต่งคุณภาพเสียงขั้นสูงผ่านพารามิเตอร์
  • เวลาตอบสนองที่รวดเร็ว
  • อินเทอร์เฟซ API REST ที่เรียบง่าย

การใช้งาน API

จุดสิ้นสุด

  • POST /tts - สร้างเสียงพูดจากข้อความและดาวน์โหลดเป็นไฟล์

ตัวอย่างการร้องขอ API

การใช้ cURL:

# ตรวจสอบสถานะ
curl https://api.iapp.co.th/v3/audio/health

# สร้างเสียงพูดและบันทึกไปยังไฟล์
curl -X POST https://api.iapp.co.th/v3/audio/tts \
-H "Content-Type: application/json" \
-d '{"text":"Hello, this is a test.","temperature":0.2,"top_p":0.95}' \
--output test.wav

การใช้ Python:

import requests

# การร้องขอ Text-to-speech
response = requests.post(
"https://api.iapp.co.th/v3/audio/tts",
json={
"text": "สวัสดีครับ",
"temperature": 0.2,
"top_p": 0.95,
"max_new_tokens": 1400
}
)

# บันทึกการตอบสนองเสียงไปยังไฟล์
with open("output.wav", "wb") as f:
f.write(response.content)

พารามิเตอร์การร้องขอ

พารามิเตอร์ชนิดคำอธิบายค่าเริ่มต้น
textstringข้อความที่จะแปลงเป็นเสียงพูดจำเป็นต้องระบุ
temperaturefloatอุณหภูมิการสร้าง (สูงกว่า = สุ่มมากกว่า)0.2
top_pfloatพารามิเตอร์การสุ่มตัวอย่าง top-p0.95
max_new_tokensintegerจำนวนโทเค็นสูงสุดที่จะสร้าง1400

แนวทางปฏิบัติที่ดีที่สุด

  • ใช้เครื่องหมายวรรคตอนอย่างถูกต้องเพื่อการสังเคราะห์เสียงที่ดีขึ้น
  • รักษาประโยคให้เป็นธรรมชาติและสนทนา
  • สำหรับข้อความยาว ให้พิจารณาแบ่งออกเป็นส่วนย่อย
  • ปรับพารามิเตอร์อุณหภูมิและ top-p เพื่อควบคุมสไตล์เสียง:
    • อุณหภูมิต่ำ (0.1-0.5): เสียงที่สม่ำเสมอและเสถียรมากขึ้น
    • อุณหภูมิสูง (0.6-1.0): มีความแสดงออกมากกว่า แต่คาดเดาได้น้อยลง