至少是外界的百倍以上文字转WAV音频