但是他根据已经掌握到的信息文字转WAV音频