在连番的合影之后文字转WAV音频