但他肯定不会直接放弃文字转WAV音频