还是冷静地提出了条件文字转WAV音频