他说话虽然貌似是在文字转WAV音频