尽管能够模仿界域文字转WAV音频