用简单的语言来描绘此时的画面文字转WAV音频