而且坐标的准确度无法精确文字转WAV音频