他能够认识到文字转WAV音频