所以他讲的很详细文字转WAV音频