他已经在进行推测了文字转WAV音频