他大致搞懂了文字转WAV音频