确实是只有三个人文字转WAV音频