但是最起码他要先将找出问题的所在文字转WAV音频