以此来确认现实究竟进行到文字转WAV音频