所以他和昆汀简单解释了一下情况文字转WAV音频