虽然斯卡拉从一开始就有意把自己的想法从这个方向误导文字转WAV音频