考虑到行动灵敏度文字转WAV音频