AI日报:OpenAI推图片模型GPT Image 1.5;腾讯发布混元世界模型1.5;小米开源MiMo-V2-Flash大模型

资讯 2小时前 admin
4 0

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://app.aibase.com/zh

1、OpenAI 推出全新图像生成模型 GPT Image 1.5,性能显著提升!

OpenAI 推出了全新的图像生成模型 GPT Image 1.5,该模型在图像生成和编辑能力上实现了显著提升,能够精准地遵循用户指令并保留原图的核心要素。同时,它还优化了文本渲染效果,解决了以往 AI 绘图中常见的问题。此外,OpenAI 还加强了安全与合规团队,以确保生成内容的伦理与法律合规性。

AI日报:OpenAI推图片模型GPT Image 1.5;腾讯发布混元世界模型1.5;小米开源MiMo-V2-Flash大模型

【AiBase提要:】

🌟 新发布的 GPT Image1.5 模型大幅提升了图像生成和编辑能力。

🖼️ 用户可以通过 ChatGPT 轻松创建和编辑图像,提供了专业级的图像处理工具。

🔒 OpenAI 建立了专门的安全团队,确保生成内容的伦理与合规。

2、腾讯发布混元世界模型 1.5,开启实时交互的虚拟世界

腾讯正式发布了混元世界模型1.5(Tencent HY WorldPlay),这是国内首个开放的实时互动体验平台。该模型通过文字或图片快速生成独特的互动世界,并支持实时探索。模型具备实时交互、长范围的3D一致性和多样化的交互体验。此外,腾讯首次开源了业内最全面的实时世界模型训练体系,为AI生成内容的未来提供了全新可能。

AI日报:OpenAI推图片模型GPT Image 1.5;腾讯发布混元世界模型1.5;小米开源MiMo-V2-Flash大模型

【AiBase提要:】

🕹️ 实时交互生成能力,以24帧每秒的速度生成720P高清视频。

🌐 长范围的3D一致性,确保场景连贯性。

🔧 首次开源的训练体系,为AI生成内容提供全新可能。

详情链接:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay

3、小米开源3090亿参数MiMo-V2-Flash大模型,推理速度碾压主流竞品,API低至0.1美元/百万Token

小米正式进军高性能开源大模型赛道,发布全新基础语言模型 MiMo-V2-Flash,并以 MIT 协议全面开源模型权重与推理代码。该模型以“超高速、高效率”为核心卖点,在推理、代码生成与智能体任务中表现尤为突出,实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型,引发开发者社区广泛关注。

【AiBase提要:】

🧠 MiMo-V2-Flash采用稀疏激活架构,总参数量高达3090亿,但每次推理仅激活150亿参数,显著降低计算开销。

⚡ 在多项公开基准测试中,MiMo-V2-Flash表现优异,响应速度超越主流竞品,尤其在多轮对话与复杂逻辑推理场景中优势明显。

💰 API定价极具竞争力,每百万输入Token仅0.1美元,输出Token0.3美元,为中小企业和独立开发者提供高性价比的替代方案。

4、字节跳动发布 Seedance 1.5 Pro:AI 音视频创作进入 100% 视听同步时代!

字节跳动发布 Seedance 1.5 Pro,标志着AI音视频创作进入100%视听同步时代,为用户带来更丰富的视听体验。

AI日报:OpenAI推图片模型GPT Image 1.5;腾讯发布混元世界模型1.5;小米开源MiMo-V2-Flash大模型

【AiBase提要:】

🎥 支持音视频联合生成,通过文本或图像引导生成内容。

🎬 提升视听同步能力,实现角色口型、语调与表演节奏的拟合。

🎭 多语种和方言支持,增强喜剧等风格化内容的表现力。

5、Apple Music 将与 ChatGPT 实现全新集成,用户可轻松创建歌单!

OpenAI 宣布 Apple Music 将与 ChatGPT 实现集成,用户可以通过自然语言指令轻松创建歌单和查找音乐,这将极大提升用户体验的便捷性。

AI日报:OpenAI推图片模型GPT Image 1.5;腾讯发布混元世界模型1.5;小米开源MiMo-V2-Flash大模型

【AiBase提要:】

🎵 Apple Music 即将与 ChatGPT 集成,用户可轻松创建歌单。

💬 用户通过自然语言指令可以快速生成适合的播放列表。

🔍 ChatGPT 能够帮助用户查找音乐,提升使用体验的便捷性。

6、Gemini预测市场全美上线: 50 州用户可实时交易现实事件,免手续费限时开放

Gemini正式将预测市场产品Gemini Predictions推向全美,允许用户围绕真实世界事件进行预测性交易。平台基于合规框架构建,采用链下撮合、链上结算机制,保障速度与透明度。为加速用户 adoption,Gemini推出限时零手续费活动。

【AiBase提要:】

🌍 Gemini Predictions 全美上线,覆盖所有50个州,用户可实时交易现实事件。

🔒 平台基于合规框架构建,确保交易在受监管环境中运行,结果不可篡改。

💰 限时零手续费活动,吸引用户参与,挑战现有预测市场平台。

7、Adobe Firefly视频功能大升级:支持精准提示编辑、集成FLUX.2与Astra,告别“重做整段视频”时代

Adobe Firefly视频功能迎来重大更新,新增支持基于文本提示的精准局部修改,并整合多个第三方模型,提升创作自由度和画质。新功能还带来可视化时间轴界面和相机运动迁移能力,为短视频创作者提供电影级运镜。

【AiBase提要:】

🔥 新增基于文本提示的精准局部修改功能,提升创作效率。

🖼️ 集成Black Forest Labs的FLUX.2图像模型,增强生成质量。

🎥 支持相机运动迁移,实现电影级运镜效果。

8、谷歌实验室推出 AI 助手 CC:集成 Gemini 技术,打造智能“日程管家”

谷歌实验室推出了基于 Gemini 技术的全新 AI 助手 CC,通过深度整合谷歌生态系统,帮助用户实现全自动化的日程梳理与任务管理。

AI日报:OpenAI推图片模型GPT Image 1.5;腾讯发布混元世界模型1.5;小米开源MiMo-V2-Flash大模型

暂无评论

暂无评论...