竟然做出了一个近乎同归于尽的选择文字转WAV音频