在简短的拍照和导演致辞环节以后文字转WAV音频