也就是一些细节方面的文字转WAV音频