Follow

RT @nojiri_h: RLHF(人間のフィードバックによる強化学習)は検証可能な知識より、人に好まれる答を生成する傾向がある、とのこと。人間もコミュ力の高さと教養の有無は別だもんな。 t.co/pskqniTMMJ

Sign in to participate in the conversation
Mastodon

海行の個人インスタンスです。
よろしくどうぞ。

ホームページ
http://soysoftware.sakura.ne.jp/