所以无论是精准性还是稳定性都远远无法跟传送阵相比文字转WAV音频