要不是经过特定的角度以及方位倒是还真不容易发现文字转WAV音频