第一阶段则是理论测试文字转WAV音频