所以尽可能抓住自己能够抓住的文字转WAV音频