尽量全留下文字转WAV音频