RT @npaka123: RLHF (人間のフィードバックからの強化学習) の図解|npaka @npaka123 #note https://t.co/6C8n9NoTwl
海行の個人インスタンスです。 よろしくどうぞ。 ホームページ http://soysoftware.sakura.ne.jp/