欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、OpenAI 推出全新图像生成模型 GPT Image 1.5,性能显著提升!
OpenAI 推出了全新的图像生成模型 GPT Image 1.5,该模型在图像生成和编辑能力上实现了显著提升,能够精准地遵循用户指令并保留原图的核心要素。同时,它还优化了文本渲染效果,解决了以往 AI 绘图中常见的问题。此外,OpenAI 还加强了安全与合规团队,以确保生成内容的伦理与法律合规性。
【AiBase提要:】
🌟 新发布的 GPT Image1.5 模型大幅提升了图像生成和编辑能力。
🖼️ 用户可以通过 ChatGPT 轻松创建和编辑图像,提供了专业级的图像处理工具。
🔒 OpenAI 建立了专门的安全团队,确保生成内容的伦理与合规。
2、腾讯发布混元世界模型 1.5,开启实时交互的虚拟世界
腾讯正式发布了混元世界模型1.5(Tencent HY WorldPlay),这是国内首个开放的实时互动体验平台。该模型通过文字或图片快速生成独特的互动世界,并支持实时探索。模型具备实时交互、长范围的3D一致性和多样化的交互体验。此外,腾讯首次开源了业内最全面的实时世界模型训练体系,为AI生成内容的未来提供了全新可能。
【AiBase提要:】
🕹️ 实时交互生成能力,以24帧每秒的速度生成720P高清视频。
🌐 长范围的3D一致性,确保场景连贯性。
🔧 首次开源的训练体系,为AI生成内容提供全新可能。
详情链接:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay
3、小米开源3090亿参数MiMo-V2-Flash大模型,推理速度碾压主流竞品,API低至0.1美元/百万Token
小米正式进军高性能开源大模型赛道,发布全新基础语言模型 MiMo-V2-Flash,并以 MIT 协议全面开源模型权重与推理代码。该模型以“超高速、高效率”为核心卖点,在推理、代码生成与智能体任务中表现尤为突出,实测响应速度甚至超越当前热门的豆包、DeepSeek和元宝等国产模型,引发开发者社区广泛关注。
【AiBase提要:】
🧠 MiMo-V2-Flash采用稀疏激活架构,总参数量高达3090亿,但每次推理仅激活150亿参数,显著降低计算开销。
⚡ 在多项公开基准测试中,MiMo-V2-Flash表现优异,响应速度超越主流竞品,尤其在多轮对话与复杂逻辑推理场景中优势明显。
💰 API定价极具竞争力,每百万输入Token仅0.1美元,输出Token0.3美元,为中小企业和独立开发者提供高性价比的替代方案。
4、字节跳动发布 Seedance 1.5 Pro:AI 音视频创作进入 100% 视听同步时代!
字节跳动发布 Seedance 1.5 Pro,标志着AI音视频创作进入100%视听同步时代,为用户带来更丰富的视听体验。
【AiBase提要:】
🎥 支持音视频联合生成,通过文本或图像引导生成内容。
🎬 提升视听同步能力,实现角色口型、语调与表演节奏的拟合。
🎭 多语种和方言支持,增强喜剧等风格化内容的表现力。
5、Apple Music 将与 ChatGPT 实现全新集成,用户可轻松创建歌单!
OpenAI 宣布 Apple Music 将与 ChatGPT 实现集成,用户可以通过自然语言指令轻松创建歌单和查找音乐,这将极大提升用户体验的便捷性。
【AiBase提要:】
🎵 Apple Music 即将与 ChatGPT 集成,用户可轻松创建歌单。
💬 用户通过自然语言指令可以快速生成适合的播放列表。
🔍 ChatGPT 能够帮助用户查找音乐,提升使用体验的便捷性。
6、Gemini预测市场全美上线: 50 州用户可实时交易现实事件,免手续费限时开放
Gemini正式将预测市场产品Gemini Predictions推向全美,允许用户围绕真实世界事件进行预测性交易。平台基于合规框架构建,采用链下撮合、链上结算机制,保障速度与透明度。为加速用户 adoption,Gemini推出限时零手续费活动。
【AiBase提要:】
🌍 Gemini Predictions 全美上线,覆盖所有50个州,用户可实时交易现实事件。
🔒 平台基于合规框架构建,确保交易在受监管环境中运行,结果不可篡改。
💰 限时零手续费活动,吸引用户参与,挑战现有预测市场平台。
7、Adobe Firefly视频功能大升级:支持精准提示编辑、集成FLUX.2与Astra,告别“重做整段视频”时代
Adobe Firefly视频功能迎来重大更新,新增支持基于文本提示的精准局部修改,并整合多个第三方模型,提升创作自由度和画质。新功能还带来可视化时间轴界面和相机运动迁移能力,为短视频创作者提供电影级运镜。
【AiBase提要:】
🔥 新增基于文本提示的精准局部修改功能,提升创作效率。
🖼️ 集成Black Forest Labs的FLUX.2图像模型,增强生成质量。
🎥 支持相机运动迁移,实现电影级运镜效果。
8、谷歌实验室推出 AI 助手 CC:集成 Gemini 技术,打造智能“日程管家”
谷歌实验室推出了基于 Gemini 技术的全新 AI 助手 CC,通过深度整合谷歌生态系统,帮助用户实现全自动化的日程梳理与任务管理。
转载请注明:AI日报:OpenAI推图片模型GPT Image 1.5;腾讯发布混元世界模型1.5;小米开源MiMo-V2-Flash大模型 | 灵动导航

