我们也无法详细计算文字转WAV音频