RT @nojiri_h: RLHF(人間のフィードバックによる強化学習)は検証可能な知識より、人に好まれる答を生成する傾向がある、とのこと。人間もコミュ力の高さと教養の有無は別だもんな。 https://t.co/pskqniTMMJ
海行の個人インスタンスです。 よろしくどうぞ。 ホームページ http://soysoftware.sakura.ne.jp/