所以现在我们初步构建了一个简陋的个人心理模型文字转WAV音频