**海行（うみゆき）** @umiyuki@mstdn.soysoftware.net · 2023-04-27T07:15:52Z

海行（うみゆき） @umiyuki@mstdn.soysoftware.net

へえ、こうして見るとStableLMってGPT-2にも勝てないまだかなりおバカなのね。それにしてもLLaMAとかFlan-T5の性能の高さが際立ってるね。Flan-UL2は思ってたよりザコ。でもベンチマーク評価がすなわち性能の高さと言えるのかって話もありそう　→RT