这两个人是跟着过去的文字转WAV音频