如果用这个标准来衡量文字转WAV音频