**海行（うみゆき）** @umiyuki@mstdn.soysoftware.net · 2023-04-22T08:15:21Z

海行（うみゆき） @umiyuki@mstdn.soysoftware.net

RT @nojiri_h: RLHF(人間のフィードバックによる強化学習)は検証可能な知識より、人に好まれる答を生成する傾向がある、とのこと。人間もコミュ力の高さと教養の有無は別だもんな。 https://t.co/pskqniTMMJ