并且也只是在异象外观察文字转WAV音频