完全可以在说提出条件之后的五秒内完成我想要的结果文字转WAV音频