也就是我们开始行动的时候文字转WAV音频