明显是旅客文字转WAV音频