🎯 竞品新能力周报

2026年4月8日
📅 数据采集时间:2026-04-08 01:00 (Asia/Shanghai)
15
监控平台
6
国内平台
8
海外平台
10
成功采集

🇨🇳 国内平台

💎 硅基流动 2026-03-10 更新
📄 来源:官方更新公告 - https://docs.siliconflow.cn/cn/release-notes/overview

🗑️ 平台服务调整通知(2026-03-10)

为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2026-03-17 对下列模型进行下线处理:

  • Pro/MiniMaxAI/MiniMax-M2.1
  • Pro/Qwen/Qwen2-7B-Instruct
  • Qwen/Qwen2-7B-Instruct
  • Pro/THUDM/glm-4-9b-chat
  • THUDM/glm-4-9b-chat
  • deepseek-ai/deepseek-vl2
  • Pro/Qwen/Qwen2.5-VL-7B-Instruct
  • Qwen/Qwen3-Next-80B-A3B-Thinking
  • Qwen/Qwen3-Next-80B-A3B-Instruct
  • Qwen/Qwen2.5-Coder-7B-Instruct
  • Pro/Qwen/Qwen2.5-Coder-7B-Instruct
模型下线

💰 价格调整(2026-03-09)

调整 Qwen/Qwen3.5-397B-A17B 模型的价格,详情请前往模型广场查看。

价格调整 查看来源
♾️ 无问芯穹 2026-04-02 更新
📄 来源:GenStudio 更新日志 - https://docs.infini-ai.com/gen-studio/changelog.html

📊 用量统计页面数据更新时效调整(2026-04-02)

用量统计页面中的数据通常会在您实际发起 API 调用后约 10 分钟更新。

功能优化

🚫 停止提供基础版 LLM API 免费服务(2026-03-30)

停止提供基础版 LLM API 免费服务(网页端持续免费),请关注账户余额,及时充值。

服务调整

🤖 上线 Minimax M2.7(2026-03-18)

上线 Minimax 系列大语言模型。可在体验中心试用,支持 API 调用。

新模型

🤖 上线多款新模型(2026-02月)

  • minimax-m2.5(2026-02-13)
  • glm5(2026-02-12)
  • kimi-k2.5(2026-01-29)
新模型

📈 用量统计页面升级(2026-01-17)

大语言模型统计指标全面升级:新增性能指标(如 TTFT、OTPS、RPM、TPM)与详细错误统计,支持从调用量、性能、错误三个维度深度分析服务状况。全局新增数据导出功能,支持下载 Excel 报表。

功能升级 查看来源
🌋 火山机器学习平台 2026-02-09 更新
📄 来源:Release Notes - https://www.volcengine.com/docs/6459/2206987

💾 MLP共享存储新增弹性文件存储(2026-02-09)

新增弹性文件存储(EFS,Elastic File Storage)。地域:华北2(北京)、华东2(上海)

新功能

🔧 自定义任务搜索问题修复(2026-02-09)

修复了列表数据小于1万条时,自定义任务列表搜索"全部"任务显示系统异常的问题。

Bug修复

🔐 存储权限管理优化(2026-02-06)

  • 存储权限预校验:用户在使用MLP机器学习平台里面的共享存储的时候增加对应权限的校验
  • 鉴权方式新增通过【机器学习平台服务关联角色】方式来完成存储鉴权
  • 支持【API密钥:默认】和【机器学习平台服务关联角色】2个选项进行鉴权
  • 客户使用存储(TOS、vePFS等)时需明确选择权限类型:【读写/只读/读写删】
功能升级 查看来源
🔥 火山方舟 抓取失败
📄 来源:产品更新公告 - https://www.volcengine.com/docs/82379/1159177

⚠️ 页面内容未完全加载,无法获取有效更新信息。SPA页面抓取失败,需要手动访问确认。

查看来源
🔵 百度千帆 抓取失败
📄 来源:更新动态 - https://cloud.baidu.com/doc/qianfan/s/Mmh8l4qwj

⚠️ 页面内容未完全加载,无法获取有效更新信息。SPA页面抓取失败,需要手动访问确认。

查看来源
🟠 阿里百炼 月刊未找到
📄 来源:产品月刊(动态URL)

⚠️ 阿里百炼按月发布产品月刊。4月初应读取3月月刊,但由于web_search工具缺少Brave API密钥,无法搜索月刊URL。

请手动搜索"阿里云 百炼 3月 产品月报 2026"查看最新月刊。

🌏 海外平台

🎆 Fireworks 2026-02-05 更新
📄 来源:Changelog - https://docs.fireworks.ai/updates/changelog

🎥 视频音频模型、AWS S3训练集成和SSO改进(2026-02-05)

  • 视频音频输入模型:支持使用视频和音频输入查询多模态模型,用于视频字幕、场景分析和多模态问答。部署Qwen3 Omni和Molmo2等模型。
  • AWS S3训练集成:支持通过GCP-to-AWS OIDC联邦将训练数据集存储在客户自己的AWS S3桶中(BYOB),无需长期凭证。
  • JIT用户配置(企业版):首次通过SSO登录时自动创建用户账户。
新功能

🔥 预热训练和Azure模型上传(2026-01-20)

  • 强化微调的预热训练:支持从之前的监督微调检查点预热启动强化微调作业。
  • Azure联邦身份:模型从Azure Blob Storage上传时支持Azure AD联邦身份认证。
功能升级 查看来源
🔷 Google Vertex AI 2026-04-06 更新
📄 来源:Release Notes - https://cloud.google.com/vertex-ai/docs/release-notes(内容过长,仅展示近期重点)

🔍 RAG Engine元数据搜索(2026-04-06)

支持在Vertex AI RAG Engine中使用基于模式的元数据搜索。可以为语料库定义元数据模式,将元数据附加到该语料库中的文件,并在检索期间使用此元数据过滤上下文。

新功能

🎬 Veo 3.1 Lite发布(2026-04-02)

Veo 3.1 Lite现已公开预览(Public Preview),这是最具成本效益的Veo on Vertex AI模型。

新模型

📅 Gemini 2.5模型退役日期更新(2026-04-02)

Gemini 2.5 Pro、Gemini 2.5 Flash-Lite和Gemini 2.5 Flash的退役日期已更新至2026年10月16日。

退役通知

⚠️ Imagen生成GA端点弃用(2026-03-24)

多个图像生成端点被弃用,建议在2026年6月30日之前更新到新端点,包括imagegeneration@002~006、imagen-3.0/4.0系列等,推荐迁移到gemini-2.5-flash-image。

端点弃用

📦 Vector Search 2.0正式GA(2026-03-05)

Vector Search 2.0正式可用(GA),包括Collections统一数据和向量、自动嵌入、混合搜索和排序等功能。

正式发布

⚡ Gemini 3.1 Flash-Lite(2026-03-03)

Gemini 3.1 Flash-Lite(gemini-3.1-flash-lite-preview)现已公开预览,这是最具成本效益的Gemini模型,针对高流量、成本敏感的LLM流量的低延迟用例进行了优化。

新模型 查看来源
🟧 AWS Bedrock 2026-04-03 更新
📄 来源:AWS What's New Feed - https://aws.amazon.com/about-aws/whats-new/recent/feed/

🛡️ Amazon Bedrock Guardrails跨账户防护正式GA(2026-04-03)

Amazon Bedrock Guardrails现在支持通过跨账户防护在组织内的所有AWS账户中集中执行安全控制。中央安全团队和管理员现在可以自动为组织中Amazon Bedrock的所有基础模型交互实施这些控制,消除为每个账户手动配置防护栏的操作开销。

通过跨账户防护,可以在管理账户的新Amazon Bedrock策略中指定防护栏ID,该策略会自动在所有成员实体(包括组织单位(OU)和单个账户)的所有模型调用中执行配置的防护措施。

正式发布 查看来源
🟨 AWS SageMaker AI 2026-04-06 更新
📄 来源:AWS What's New Feed - https://aws.amazon.com/about-aws/whats-new/recent/feed/

📓 Unified Studio笔记本导入/导出和开发者加速功能(2026-04-06)

Amazon SageMaker Unified Studio笔记本现在支持导入/导出功能,支持从JupyterLab和其他笔记本平台迁移。支持.ipynb、.json和.py格式,同时保留单元格类型和元数据。

新的开发者加速功能包括:单元格重新排序、键盘快捷键、单元格重命名和多行SQL支持。

新功能

📊 Data Agent新增图表功能和物化视图支持(2026-04-03)

Amazon SageMaker Data Agent现在支持交互式图表、Snowflake数据源的SQL分析以及Amazon SageMaker Unified Studio笔记本中的物化视图管理。

  • 可以使用自然语言提示生成交互式图表
  • 支持通过外部连接查询Snowflake表
  • 可以基于查询模式推荐物化视图优化
新功能 查看来源
🚀 RunPod 2026-03 更新
📄 来源:Release Notes - https://docs.runpod.io/release-notes

⚡ Flash beta发布(2026年3月)

Flash现已公开测试。Flash是一个Python SDK,让开发者用单个装饰器在RunPod Serverless GPU上运行函数。

关键特性:远程执行、自动扩展、依赖管理、两种模式(基于队列的端点和负载均衡端点)、Flash应用(使用flash init、flash run和flash deploy构建生产就绪的API)。

新功能

🌍 Flash多数据中心部署(2026年3月)

Flash现在支持同时将端点部署到多个数据中心。传递数据中心列表以在多个区域分发工作负载,提高可用性和降低延迟。还可以为每个数据中心附加网络卷以实现特定区域的数据访问。

功能升级

🔄 GitHub release回滚GA和负载均衡Serverless repos(beta)(2026年2月)

  • GitHub release回滚:从控制台回滚Serverless端点到任何先前的构建版本
  • 负载均衡Serverless repos(beta):Hub中现在提供负载均衡端点
功能升级 查看来源
🟢 PPIO 2026-01 更新
📄 来源:PPIO 博客 - https://blog.ppio.com/

🏆 姚欣获聘"光谷全球产业合伙人"(2026-01-25)

PPIO联合创始人兼CEO姚欣受聘为"光谷全球产业合伙人",成为助力光谷链接全球产业资源的重要伙伴之一。在"2026光谷AI产业发展峰会"上,主持了主题为《武汉如何抓住AI浪潮的机会》圆桌论坛。

公司动态

🤖 上线多款新模型(2026年1月)

  • Kimi K2.5(2026-01-27)
  • GLM-4.7-Flash模板(2026-01-20)
  • GLM-Image部署模板(2026-01-14)
新模型 查看来源
Novita AI 2026-03-27 更新
📄 来源:Changelog - https://novita.ai/docs/changelog/

💰 LLM API计费规则说明(2026-03-27)

明确了LLM API计费规则:

  • 计费基于token数量(输入token和输出token分别计费)
  • 当模型已开始推理时收费
  • 成功请求(200)和客户端断开连接(499)都会收费
  • 无效请求/认证失败/速率限制(400/401/403/429)不收费
  • 平台错误(500/503/504)不收费

关于499状态码:当请求到达模型时,推理会立即开始。如果客户端在请求中途断开连接,已消耗的计算资源仍然可计费(无论是非流式还是流式模式)。

计费说明 查看来源
🤝 Together AI 2026-01 更新
📄 来源:Changelog - https://docs.together.ai/docs/changelog

🔄 模型重定向(2026年1月)

以下模型现在自动重定向到升级版本:

  • mistralai/Mistral-7B-Instruct-v0.3 → mistralai/Ministral-3-14B-Instruct-2512
  • zai-org/GLM-4.6 → zai-org/GLM-4.7
  • DeepSeek-V3-0324 → DeepSeek-V3.1

这些是相同系列的升级,具有兼容的行为。如果需要原始版本,可以作为专用端点部署。

模型升级 查看来源

⚠️ 暂无更新渠道

以下平台暂无公开更新日志

🗣️ 讯飞星辰MaaS — 暂无公开更新日志,一旦发现渠道立即补充
返回历史报告列表