视觉嗅觉全部都没有文字转WAV音频