OMG: 在扩散模型中友好处理遮挡的个性化多概念生成

2024年3月26日下午4:12 • 工具软件

OMG: 在扩散模型中友好处理遮挡的个性化多概念生成

腾讯这个新研究，支持多角色多概念在一张图片中生成。以前的 ID 或者概念保持项目只能将一个人还原在图片里面，有了这个项目以后就可以多人合照了。

项目还支持与原有的 ID 保持项目一起使用比如 Lora 以及InstantID。代码已经开源，大佬们可以看看插件实现了。

项目介绍：

我们提出了一个名为OMG的新框架，它是专门为个性化生成设计的，并能友好地处理遮挡问题，能够在一幅图像中无缝集成多种概念。

我们的框架包含两个阶段：第一阶段专注于图像布局的生成和为处理遮挡而收集视觉理解信息；第二阶段则利用这些视觉理解信息，并结合精心设计的噪声混合技术，将多个概念融合在一起，同时考虑遮挡因素。

我们还发现，在噪声混合过程中选择合适的开始去噪时间点对于保持人物身份和图像布局至关重要

此外，OMG还能与多种单概念生成模型兼容，如LoRA和InstantID，无需额外调整。尤其值得一提的是，LoRA模型可以直接从这个网址获取并使用。

原创文章，作者：校长，如若转载，请注明出处：https://www.yundongfang.com/Yun291852.html

处理遮挡概念生成

打赏

微信扫一扫不于多少！

支付宝扫一扫礼轻情意重

字节发布了AnimateDiff-Lightning 模型

上一篇 2024年3月26日

FRESCO：实现零样本视频翻译的空间与时间匹配技术

下一篇 2024年3月26日

Mora：借助多智能体系统实现通用视频生成

Mora：借助多智能体系统实现通用视频生成微软的一个视频生成项目 Mora，利用 Agents 来复原 Sora 的能力，基本还原了 Sora 所有的能力，目前支持生成 1024…

工具软件 2024年3月26日
工具软件

如何使用 Haiper 免费制作 AI 视频

如何使用 Haiper 免费制作 AI 视频 Haiper AI 是一款突破性的 AI 视频生成器，最近进入市场，为用户提供了完全免费创建令人惊叹的逼真视频的能力。Haiper A…

2024年3月17日
工具软件

Assistive：视频生成工具

Assistive：视频生成工具新的视频生成软件Assistive，支持从文本和图像生成视频，从演示视频的流体内容和表现来看，我嗅到了SVD的熟悉味道。同时推出的还有DATA-一…

2024年1月2日
工具软件

TwitterBio：使用 AI 帮你生成推特简介

TwitterBio：使用 AI 帮你生成推特简介使用 Mixtral 和 GPT-3.5生成你的Twitter 简介。项目已经开源，可以改一改生搞成国内的。

2023年12月26日
工具软件

Tripo3d：AI生成3D模型

Tripo3d：AI生成3D模型可以说是现在最强大的3D模型生成工具，一经发布就把几个老牌产品打趴了，支持从文字直接生成3D模型，也支持图片生成。

2023年12月26日
工具软件

Creatify：从一条链接生成视频广告

Creatify：从一条链接生成视频广告 Creatify 这个产品，可以直接从你的产品页面获取内容，可以是官网可以是电商商品页，然后直接生成广告视频。优质广告的广告语口播和内容其…

2023年12月26日
工具软件

ChatGPT 内容创建者手册：生成博客文章、脚本等

ChatGPT 是 OpenAI 打造的尖端语言模型，是内容创作领域的变革力量。这种先进的人工智能的实力在于它以令人印象深刻的速度无缝生成反映人类质量的文本。这种能力使其成为各种内…

2023年12月21日
Midjoourney V6 beta 版本更新后缀加 –v 6就可以

Midjoourney V6 beta 版本更新后缀加 –v 6就可以Midjourney V6 特色亮点： 1、超高图像分辨率：V6 呈现 2048×2048 …

工具软件 2023年12月21日
谷歌发布了一个用于视频生成的大语言模型VideoPoet

谷歌发布了一个用于视频生成的大语言模型VideoPoet，这个有点意思。这个是一个专注于视频生成的多模态 LLM 。支持各种视频生成功能以及音频生成，让 LLM 来指导完整的视频生…

工具软件 2023年12月21日
W.A.L.T：谷歌视频生成模型

W.A.L.T：谷歌视频生成模型刚注意到李飞飞团队的这个视频生成模型W.A.L.T，这效果也太好了，感觉比 Pika 1.0 还要好的多。清晰度和动作都非常好，特别是光剑打斗的那…

工具软件 2023年12月19日
工具软件

Coffee：AI 生成前端组件

Coffee：AI 生成前端组件这个AI生成前端代码的项目“Coffee”有意思，可以生成干净可维护的前端组件代码。交互也很有意思，你只需要在代码对应位置加一个标签在里面写上对组…

2023年12月19日
工具软件

Runway ：上线文字生成语音功能

Runway ：上线文字生成语音功能尝试了一下英文的效果真的很好，感情很丰富自然。中文还是老问题，有外国人口音，这块可能不能指望外国公司了。这个功能可以选的语音模型非常多，可以都…

2023年12月19日
工具软件

Midreal AI：AI生成小说

Midreal AI：AI生成小说 Midreal AI小说生成工具，与其他LLM直接生成的所谓根本没有逻辑和情节的“小说”不同。这个产品可以生成真正的小说，逻辑性和创造力都在线，…

2023年12月19日
工具软件

Midjourney发布网页图片生成功能

Midjourney发布网页图片生成功能 Midjourney上周发布了Alpha版本的网页图片生成功能写一下如何使用Alpha 版本和图片生成的一些变化，后面发现的小细节也会写在…

2023年12月19日
如何使用 Snapchat 生成 AI 图像

Snapchat 最近推出了非常酷的功能，其中之一是使用 AI 生成带有简单提示的图像（甚至扩展图像）。再见，Midjourney？因此，如果您经常使用其他 AI 生成图像并将其发…

技术教程 2023年12月18日
谷歌Google

如何在 Google Bard 中充分利用 Gemini

谷歌最近对其称为 Bard 的大型语言模型进行了重大增强。这种增强功能以集成 Gemini AI 的形式出现，Gemini AI 是一种新颖的神经网络架构。Gemini 的独特之处…

2023年12月15日
工具软件

Midjourney 网页版在哪？如何使用Midjourney 网页版

如何使用 Alpha 版本：如果已经生成一万张图可以使用，在 Discord 里面输入/info 可以看到生成的图片数量，也可以直接访问这个链接看自己是不是有权限：https:/…

2023年12月13日
工具软件

KreaAI工具成灵魂画手新宠

现在KREA已经可以在iPad上搭配使用了。KREA是一款AI绘画图片prompt提示关键词搜索共享平台，它能够帮助创作者利用AI生成的图像来激发灵感，提高效率，拓展想象力。可以…

2023年11月27日
工具软件

Music ControlNet使定制AI音频更灵活

随着文本到音乐生成模型的发展，如今我们能够欣赏到各种风格的高质量AI生成的音乐音频。Music ControlNet的团队提出了一种创新的音乐生成模型，称之为Music Contr…

2023年11月27日
工具软件

Animagine XL的免费使用AI人工智能生图平台

网友Linaqruf自己搭建了一个名为Animagine XL的免费使用AI人工智能生图平台，可以在Huggingface上直接用docker运行。Linaqruf也自己训练了几个…

2023年11月27日
工具软件

Game Asset Generator是一款专为游戏、角色和视觉设计领域打造的AI生成工具

Game Asset Generator是一款专为游戏、角色和视觉设计领域打造的AI生成工具，支持中文等多种语言，致力于为用户提供高质量的原画设计稿、游戏角色和场景素材。采用文生成…

2023年11月27日
工具软件

字节跳动发布AI视频模型PixelDance

PixelDance是一款字节跳动开发引领视频AI人工智能生成领域的创新工具，不仅通过纯文本描述生成视频内容，还结合了用户提供的首帧和尾帧图像，使生成的视频更加生动和连贯。这一先进…

2023年11月27日
工具软件

Dear AI – 生成亲密、深思熟虑且美观的信件

Dear AI – 生成亲密、深思熟虑且美观的信件网站提供一种使用人工智能技术来自动生成各种场合下的信件的服务。它可以根据用户选择的语气和主题快速生成亲切和有思想性的…

2023年11月27日
Stability AI 正式开源 StableStudio！

继可商业开源大语言模型 StableLM后，时隔一个月，Stability AI 再次开源AI 图像生成平台 StableStudio！它是DreamStudio 的开源版实现，可…

工具软件 2023年11月23日
MindEye，一种最新的fMRI（功能磁共振成像，Functional Magnetic Resonance Imaging）生成图像的方法

MindEye，一种最新的fMRI（功能磁共振成像，Functional Magnetic Resonance Imaging）生成图像的方法。MindEye能将fMRI信号影射到…

工具软件 2023年11月23日

OMG: 在扩散模型中友好处理遮挡的个性化多概念生成

相关推荐