要怎么练才能够让这个偶然使出来的动作变成他可以控制的文字转WAV音频