Follow

RT @npaka123: CarperAI/vicuna-13b-fine-tuned-rlhfのRLHFで使われてるデータセット。
・OASST1
・GPT4All Prompt Generations
・Alpaca

報酬モデルの学習で使われてるデータセット
・OASST1
・Anthropic HH-RLHF
・Stanford Human Preferences Dataset
t.co/sdRyyRi78v

Sign in to participate in the conversation
Mastodon

海行の個人インスタンスです。
よろしくどうぞ。

ホームページ
http://soysoftware.sakura.ne.jp/