看来本体只能用行动文字转WAV音频