Follow

RT @kun1em0n: 昨晩、日本語DollyデータセットでLoRAしたRWKV-3B (80エポック)。CerebrasGPTと同様、語学力は付いたけど知識がさっぱり(データが15Kだけってのもあると思うけど) まだ試してないけど日本語事前学習しているrinnaが一番良かったりするのかもしれない.... t.co/u30xVCUDLH

Sign in to participate in the conversation
Mastodon

海行の個人インスタンスです。
よろしくどうぞ。

ホームページ
http://soysoftware.sakura.ne.jp/