辟塔用视觉信号确认了一下文字转WAV音频