而是用神识去文字转WAV音频