因为他们有了明确代入的对象和支持的目标文字转WAV音频