实际上根据媒体的采访文字转WAV音频