开源
-
阿里开源支持视频理解的多模态 LLM Qwen2-VL
阿里开源支持视频理解的多模态 LLM Qwen2-VL 国内现在还没有特别好的多模态闭源模型尤其是支持视频理解的,阿里这就开源了。不过最大的Qwen2-VL 72B 没有开源,只开…
-
FLUX 的周边生态发展迅速
FLUX 的周边生态发展迅速 前段时间由于 SD3 的问题,开源的图片生态发展一度停滞,值得关注的新项目和模型几乎没有。 FLUX 上周发布后这个态势被快速改变了,由于其优秀的图片…
-
Krea AI 发布 AI 视频生成功能
Krea AI 发布 AI 视频生成功能 是可以定义首位帧的,而且每张图片对应的提示词都可以自定义。看起来像是之前发过的基于 ipadapter 的 Animatediff 的工作…
-
DeepSeek 发布 DeepSeek-V2 模型
DeepSeek 发布 DeepSeek-V2 模型 DeepSeeK 上周发布了DeepSeek-V2模型,将现在优秀 LLM 的价格战又抬上了一个新的高度,百万 Token 输…
-
Frame:开源的 AI 眼镜
Frame:开源的 AI 眼镜 由一个开源的AI硬件 ,Frame AI 眼镜。 你可以通过语音和 Frame 进行沟通,它的回复会显示在眼镜屏幕上,而且会有小图标表示现在的情绪。…
-
Friend:开源的语音对话AI 硬件
Friend:开源的语音对话AI 硬件 轻松捕捉对话。只需将其连接到移动设备,无论您走到哪里,都会自动保存会议、聊天和语音备忘录的高质量转录。 获取即时摘要、重点亮点、思维导图、待…
-
Perplexity-Inspired LLM Answer Engine:开源的 AI 搜索应用
Perplexity-Inspired LLM Answer Engine:开源的 AI 搜索应用 一个开源的类似 Perplexity 的 AI 搜索应用,含构建复杂答案引擎所需…
-
Reader:jina开源的网页内容爬取工具
Reader:jina开源的网页内容爬取工具 将网络信息灌输到大语言模型(LLM)中是实现信息实体化的关键步骤,但这一过程充满挑战。最直接的方法是直接抓取网页内容并提取其 HTML…
-
RAG Flow:新的RAG开源框架
RAG Flow:新的RAG开源框架 InfiniFlow开源的项目叫RAG Flow,有下面这些特点: RAGFlow的核心功能是文档的智能解析和管理,支持多种格式,并允许用户使…
-
Databricks 发布了新的可能是现在最强的开源模型 DBRX
Databricks 发布了新的可能是现在最强的开源模型 DBRX 模型架构: 132B参数的MoE模型,一共拥有16个专家,每个Token激活4个专家,意味着有36B的活跃参数,…