而是循着本身对变数的感应文字转WAV音频