所以我们只能是放弃文字转WAV音频