Show more

Modelscopeの動画生成AIをアニメが生成できるように微調整したブツらしい →RT

RT @shiropen2: 冷蔵庫の中身から料理レシピを考えてくれるAI ChatGPTを利用 米国チームが開発 t.co/GIXlerksL1 冷蔵庫の中を撮影した画像から食材を検出しChatGPTが料理を決め,その材料や分量,作り方を文章で出力。レシピ動画生成の未来も。カロリーや糖質制限,ヴィーガン食,おもてなし料理等も可能。 t.co/JwwmaUoqWL

RT @t_yano: Python 組織が発表しているからPythonの話になってるけど、すべてのオープンソースコード提供者に関連するっぽいな。

これで修正されなかったら、EUはソフトウェア開発から降りたということになるが。 t.co/gWssk1XYZs

RT @DrJimFan: AutoGPT just exceeded PyTorch itself in GitHub stars (74k vs 65k). I see AutoGPT as a fun experiment, as the authors point out too. But nothing more. Prototypes are not meant to be production-ready. Don't let media fool you - most of the "cool demos" are heavily cherry-picked: 🧵 t.co/I44H7BkCqr

テクスチャを生成するSDモデルだって →RT

RT @hwchase17: 🤖Generative Agents🤖

Last week, Park et all released “Generative Agents”, a paper simulating interactions between tens of agents

We gave it a close read, and implemented one of the novel components it introduced: a long-term, reflection-based memory system

🧵 t.co/10QzhSuMiz

RT @taka_aki: Dollyの日本語データセットでDollyモデルをトレーニングするところまで行きました。

Databricksで日本語DollyデータセットによるDollyのトレーニングを試す - Qiita t.co/uLOu9FV2Ry

RT @forasteran: 今度はラバw
(英語ではmuleなので日本でしか通じん🤭)

(Large Language-and-Vision Assistant)
🐴t.co/oJH9QIQoIu
お試し→驚きの説明力w

LLaVAは事前学習済のCLIP ViT-L/14とLLaMAをくっつけて、CC3Mで調整しチャット化も学んでマルチモーダル化した奴
t.co/USmllfK4P3 t.co/GAfk9hiieB

入力プロンプトを最大26倍圧縮できるGistingって技術だって。どういうこっちゃ?というと例えば「以下の内容をフランス語に翻訳してください」ってプロンプトがあるとして「アレやって」だけで通じるように微調整、蒸留するイメージ。これでプロンプト圧縮できて推論速度上がって計算量も節約できる… t.co/GpVCr2ubuR

RT @johnjnay: Gisting: 26x Compression of LLM Prompts

-Trains LLM to compress prompts into smaller sets of "gist" tokens to be reused for compute efficiency
-Can be easily trained as part of instruction fine-tuning
-FLOPs reductions, time speedups

メタがリリースしたDINOv2ってのは、自己教師あり学習で強力なビジョンモデルをトレーニングできる手法らしい。学習済みモデルもオープンソースで公開!画像分類、セグメンテーション、画像検索、深度推定とかができる →RT

RT @omarsar0: Meta AI just released DINOv2!

This is a massive release!

Here's a breakdown of what you need to know:

- DINOv2 is a new method for training high-performance computer vision models based on self-supervised learning.

- DINOv2 enables learning rich and robust visual features… t.co/xXm5mWzsJi t.co/8EILdVW39C

RT @MetaAI: Announced by Mark Zuckerberg this morning — today we're releasing DINOv2, the first method for training computer vision models that uses self-supervised learning to achieve results matching or exceeding industry standards.

More on this new work ➡️ t.co/h5exzLJsFt t.co/2pdxdTyxC4

もしもLLMが出力したテキストを学習させたらLLMの性能上がりました!これ無限に繰り返せそうです!みたいな研究出てきたら僕もゲームエンドって言っちゃうやろなあ

なんかまたゲームエンドしたらしいよ。この研究では、画像AIで生成した画像を使って画像分類タスクのモデルを学習させたら精度が上がる事が分かったらしい。本物の画像じゃなくてAI画像で済むならじゃあもうそれでいいじゃん。この話は終わりね。って事で画像分類はゲームエンドって話になってるらしい… t.co/qRkQlq7ldG

RT @M76119644: 画像分類タスクに画像生成AI系の画像を使っても分類タスクの精度が上がるという論文。(間違えていたら教えてください🙇‍♂️)
実質無限に生成できるから、分類タスク系は終焉を迎えるのかな?こうなると画像系のタスクも急速に色々進みそう。生成系も精度は上がって行くだろうし🤔 t.co/7rsLOL63aE

Show more
Mastodon

海行の個人インスタンスです。
よろしくどうぞ。

ホームページ
http://soysoftware.sakura.ne.jp/