因为用的是所有人都看得懂的文字文字转WAV音频