按照那特定顺序凝聚出一部分文字转WAV音频