更容易探测到那些较小的质量――只要目标位置存在质量文字转WAV音频