也确实无法用外界的标准去衡量他们文字转WAV音频