用近乎挑畔的话语回答着文字转WAV音频