10.6.1 (不)平衡的探索式和利用式学习与在线客户忠诚度