便通过观察计算得到上面这个结论文字转WAV音频