**海行（うみゆき）** @umiyuki@mstdn.soysoftware.net · 2023-05-02T21:30:29Z

海行（うみゆき） @umiyuki@mstdn.soysoftware.net

海行（うみゆき） @umiyuki@mstdn.soysoftware.net

LLaMAのオープン実装？RedPajamaのデータセットで200Bトークン学習させたブツだって。え、RedPajama自身も同じようなモデル作っててすでに600Bトークン学習させてるのに何で？って思ったら、これは完全にハイパーパラメータをLLaMAに揃えてて、性能が再現するかとか確認するためにやってるらしい →RT

May 02, 2023, 21:30 · From Twitter · · ·

Resources

Developers

What is Mastodon?

mstdn.soysoftware.net

More…