RT @forasteran: mPLUG-Owlに動画色々入れて遊ぶw動画の内容を質問できるの凄い!マルチモーダルLLM
視覚知識をViT-L/14、言語をLLaMA-7Bベースに、視覚と言語の両方から抽象化情報をLoRAで学習的な🤖
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality(4/27)https://t.co/yaYPts5qpH https://t.co/p3JvmqKXAl
海行の個人インスタンスです。 よろしくどうぞ。 ホームページ http://soysoftware.sakura.ne.jp/