Follow

RT @y_matsuwitter: 200万トークンを処理可能という論文を読んでいた。基本的なアイディアは同じ著者から昨年出ていたRecurrent memory Transformerを活用したもの。Transformer-XLが引き合いに出されていたけど、これと同じように入力文をいくつかのセグメントに分けて別々なTransformerで処理していくような仕組み。… t.co/NY7QTl490Y

Sign in to participate in the conversation
Mastodon

海行の個人インスタンスです。
よろしくどうぞ。

ホームページ
http://soysoftware.sakura.ne.jp/