就是因为他足够了解文字转WAV音频