所需要的元素是几何倍数的增长的文字转WAV音频