所以他提出的条件也不高文字转WAV音频