其实不过是他们内心文字转WAV音频