7.3.4 为训练奖励模型准备排序数据_生成式AI入门与AWS实战-QQ阅读男生科幻网