他们会选择一些环境恰当的地方文字转WAV音频