へえ、こうして見るとStableLMってGPT-2にも勝てないまだかなりおバカなのね。それにしてもLLaMAとかFlan-T5の性能の高さが際立ってるね。Flan-UL2は思ってたよりザコ。でもベンチマーク評価がすなわち性能の高さと言えるのかって話もありそう →RT
海行の個人インスタンスです。 よろしくどうぞ。 ホームページ http://soysoftware.sakura.ne.jp/