将目标锁定在有可能的那几位文字转WAV音频