主要就是为了麻木对方文字转WAV音频