他们只能将上面所示的标注记下来文字转WAV音频