他们提出的条件很优厚了文字转WAV音频