只是他很容易就观察出文字转WAV音频