一方面是因为他的确不知道要如何描述那种表演状态文字转WAV音频