拖延出足够的时间等到救援文字转WAV音频