这取决于使用者的内心文字转WAV音频