原本就是修士惯常的做法文字转WAV音频