次要目标是卡尔维德文字转WAV音频