5.1 对象级场景理解与人-物交互