**海行（うみゆき）** @umiyuki@mstdn.soysoftware.net · 2023-04-27T07:15:49Z

海行（うみゆき） @umiyuki@mstdn.soysoftware.net

RT @npaka123: CarperAI/vicuna-13b-fine-tuned-rlhfのRLHFで使われてるデータセット。
・OASST1
・GPT4All Prompt Generations
・Alpaca

報酬モデルの学習で使われてるデータセット
・OASST1
・Anthropic HH-RLHF
・Stanford Human Preferences Dataset
https://t.co/sdRyyRi78v