不过他们的担忧是多余的文字转WAV音频