的确很难理解墨呈的状态文字转WAV音频