一般只限于域内文字转WAV音频