从每一个熟悉或者不熟悉的面孔上掠过文字转WAV音频