**海行（うみゆき）** @umiyuki@mstdn.soysoftware.net · 2023-05-02T21:30:31Z

海行（うみゆき） @umiyuki@mstdn.soysoftware.net

ちなみに本家LLaMAは、65Bや33Bモデルは1.4Tトークン、7Bと13Bモデルは1Tトークンの学習量らしい。LLaMAの性能の高さを鑑みると、今はこの1Tトークンの学習量が一つの基準かもね