因为他已经可以断定文字转WAV音频