他们选择等待文字转WAV音频