也就是先体检了文字转WAV音频