恐怕就只能是在它们三者之中搜寻文字转WAV音频