🎯 竞品新能力周报

2026年6月3日
📅 监控范围:2026-05-27 ~ 2026-06-03
15
监控平台
6
国内平台
8
海外平台
1
暂无渠道

🇨🇳 国内平台

💎 硅基流动 2026-05-08 更新
📄 来源:官方更新公告

⚠️ 11款模型下线通知(5月15日生效)

Kimi-K2-Thinking、Kimi-K2-Instruct-0905、GLM-4.6、GLM-4.6V、Ring-flash-2.0、Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Instruct-2507 等11款模型将于2026-05-15下线。

模型下线

🔒 实名认证强制要求(5月15日起)

自2026-05-15起,未完成实名认证的账号将无法使用平台服务。

合规要求

⚠️ 12款模型下线通知(4月29日生效)

Kwaipilot/KAT-Dev、PaddleOCR-VL、QwQ-32B 等12款模型已于2026-04-29下线。

模型下线 查看来源
♾️ 无问芯穹 2026-05-31 更新
📄 来源:GenStudio 更新日志

💰 LLM API 被动缓存功能(6月1日生效)

新增被动缓存功能,缓存的 token 以折扣价格计费,6月1日起生效。

功能升级

⚠️ Qwen2.5 系列8款模型下线

Qwen2.5 系列模型(包括多个尺寸版本)已于5月7日下线。

模型下线

🤖 Mimo V2.5 Pro 上线

新增 mimo-v2.5-pro 模型(4月28日上线)。

新模型

🤖 DeepSeek-V4 系列上线

新增 deepseek-v4-pro、deepseek-v4-flash 模型(4月22日上线)。

新模型

🤖 Kimi K2.6 上线

新增 kimi-k2.6 模型(4月21日上线)。

新模型 查看来源
🔥 火山方舟 近期无更新
📄 来源:产品更新公告

页面最后更新日期为2026.05.11,最近可见更新为202604期(4月)。本期无新更新。

查看来源
🌋 火山机器学习平台 2026-05-22 更新
📄 来源:Release Notes 2026.05

📊 监控仪表盘升级(MLP → VMP)

监控仪表盘从 MLP 平台升级至 VMP 平台,提供更全面的监控能力。

功能升级

💻 VS Code 升级至 v1.111

内置 VS Code 版本升级至 1.111。

功能升级

🤖 新增「数据采集任务」标签页

新增 PICO VR 设备遥操作数据采集功能,成本仅为传统动捕设备的10%。可用区域:华北2(北京)、华北3(北京2)、华东4(大同)、华东2(上海)、华南1(广州)、亚太东南(柔佛)。

新功能 查看来源
🟠 阿里百炼 5月月刊尚未发布
📄 来源:产品月刊

6月初应读5月月刊,但5月月刊尚未发布。4月月刊内容概要:31款新模型上线(含 HappyHorse-1.0、Qwen3.6 全系列、万相2.7);Token Plan 团队版上线;记忆库功能;高代码应用 K8s 部署支持。

查看4月月刊
🔵 百度千帆 2026-04-13 为最新
📄 来源:更新动态(SPA)

页面最后更新为2026-04-13,无5月下旬至6月初的新更新内容。最新条目:GLM-5.1 模型上线、API-Key 查看功能。

查看来源

🌏 海外平台

🎆 Fireworks 2026-05-14 更新
📄 来源:Changelog

⚠️ 9款 Serverless 模型下线通知

DeepSeek V3.1/V3.2 → 推荐迁移至 Kimi K2.6/GLM 5.1;GLM 4.7/5 → GLM 5.1;Qwen3 8B → GPT-OSS 20B;Llama 3.3 70B → GPT-OSS 120B 等。

模型下线

🤖 视频/音频输入模型支持

新增 Qwen3 Omni、Molmo2 等视频与音频输入模型。

新模型

🔗 AWS S3 BYOB 训练数据集成

支持通过 OIDC 联邦认证将 AWS S3 数据集用于模型训练。

新功能

🔐 JIT SSO 用户自动创建(Enterprise)

企业版新增 JIT SSO 用户自动创建功能。

功能升级

🔥 Warm-Start RFT 训练

支持从 SFT checkpoint 启动 RFT 训练,加速模型微调流程。

功能升级

🤖 多款新模型上线

  • Gemma 3 12B/4B
  • Qwen3 Omni 30B A3B
  • Devstral Small 2 24B
  • Nemotron Nano 3 30B
  • DeepSeek V3.2
  • Mistral Large 3 675B
  • KAT Coder/Dev
  • Kimi K2 Thinking
新模型

💰 Cached Token 定价展示

新增缓存 token 定价显示,Prompt caching 提供50%折扣。

功能升级 查看来源
🟧 AWS Bedrock 2026-06-02 更新
📄 来源:AWS What's New RSS

🤖 GPT-5.5、GPT-5.4 与 Codex 正式上线 Bedrock

OpenAI GPT-5.5、GPT-5.4 现已 GA,Codex 支持通过 Bedrock 运行推理,支持 VS Code、JetBrains、Xcode 集成。定价与 OpenAI 第一方一致。

新模型

📊 CloudWatch 监控支持 bedrock-mantle 端点

新增 CloudWatch metrics for bedrock-mantle endpoint(支持 OpenAI/Anthropic 兼容 API),覆盖推理计数、输入/输出 token 总量、客户端错误计数,支持按账号/项目/模型/项目+模型粒度。

新功能

🔐 AgentCore Identity 支持 BYO Secrets

Bedrock AgentCore Identity 现支持引用客户自管理的 AWS Secrets Manager secret ARN,满足严格治理合规需求。在14个 AWS Region 可用。

功能升级 查看来源
🟨 AWS SageMaker AI 2026-06-02 更新
📄 来源:AWS What's New RSS

🛡️ SageMaker 支持 SCP 权限边界

Unified Studio 现支持自定义 IAM 权限边界(Permissions Boundaries),满足组织级 SCP合规要求,所有新项目自动继承。

功能升级

🔧 HyperPod Troubleshooting Skills

新增 AI 编码助手(Claude Code、Cursor、Kiro)的集群诊断 Skills,通过自然语言诊断 GPU 硬件故障、NCCL 通信问题、性能瓶颈等。Skills 已开源,支持 Slurm 和 EKS 集群。

新功能

⚡ HyperPod 支持 EFA-only 网络接口

支持配置 efa-only 网络接口,不占用 VPC IP 地址,适用于大规模分布式训练。通过 CreateCluster/UpdateCluster API 的 ClusterNetworkInterface 配置启用。

功能升级 查看来源
🔷 Google Vertex AI 2026-05-26 更新
📄 来源:Release Notes

🤖 Data Science Agent GA

Colab Enterprise 中的 Data Science Agent 正式可用(GA),支持自动化探索性数据分析、ML 任务和洞察交付。

新功能

⚠️ Vertex AI Extensions 下线通知

Vertex AI Extensions 已标记为 deprecated,将于2026年11月26日后关闭,推荐迁移到 Agent Platform。

下线通知

🔍 RAG Cross Corpus Retrieval 预览版

支持从多个 RAG corpora 同时检索相关上下文或生成答案,通过 AsyncRetrieveContexts 和 AskContexts API。4月17日发布。

新功能 查看来源
🤝 Together AI 2026-06-01 更新
📄 来源:Changelog

📊 Fine-tuning Job Metrics API

新增 GET /fine-tunes/{id}/metrics API,返回训练指标(loss 曲线等),可编程监控微调进度。

新功能

🖥️ Slurm Startup Scripts

GPU clusters 支持 Slurm startup scripts,节点启动/作业分配/完成时自动执行脚本。

功能升级

⚡ Evaluations 单次比较模式

compare evaluator 新增 disable_position_bias_correction 参数,单次评估节省50% judge 成本和延迟。

功能升级

🤖 Qwen3.7-Max 上线 Serverless

新增 Qwen/Qwen3.7-Max,定价 $2.50/$7.50 per 1M tokens。

新模型

🤖 多款视频/图像新模型上线

  • ByteDance/Seedream-5.0-lite(图像)
  • alibaba/happyhorse-1.0-i2v/r2v(视频)
  • google/veo-3.1/veo-3.1-lite(视频)
  • pearl-ai/gemma-4-31b-it
新模型

⚠️ 多款模型下线

  • moonshotai/Kimi-K2.5 下线
  • Qwen/Qwen3-Coder-480B-A35B-Instruct-FP8 下线 → 推荐 MiniMax-M2.7
  • black-forest-labs/FLUX.1-krea-dev 下线
模型下线

🔐 GPU Clusters OIDC 认证 + RBAC

GPU clusters 支持外部 OIDC 认证(Google/Okta/Auth0/Entra ID),每个用户独立 token 和审计追踪。

新功能 查看来源
🚀 RunPod 2026-03 更新
📄 来源:Release Notes

⚡ Flash Beta:Python SDK 云 GPU 执行

Flash 进入 public beta,用 @Endpoint 装饰器即可在 Serverless GPU 上运行函数,支持自动缩放和依赖管理。同时支持多数据中心部署。

新功能

注意:RunPod release notes 按月而非按周更新,最近条目为2026年3月。2月更新:新增 Public Endpoints(SORA 2、Kling v2.1/v2.6、Seedream 4.0、Qwen3 32B 等);Vercel AI SDK 集成。

查看来源
🟢 PPIO 2026-06 更新
📄 来源:PPIO 博客

🤖 MiniMax M3 首发上线(限时5折)

作为 MiniMax 官方 MaaS 合作伙伴,首发上线 MiniMax M3。支持 1M 超长上下文、原生多模态(图片/视频输入/桌面操作),SWE-Bench Pro 超 GPT-5.5/Gemini 3.1 Pro,SVG-Bench 超 Opus 4.7。

新模型

🤖 DeepSeek-V4 预览版上线

上线 DeepSeek-V4-Pro(1.6T/49B激活)和 DeepSeek-V4-Flash(284B/13B激活),支持100万 token 上下文。

新模型

🤖 Kimi K2.6 首发上线

Kimi K2.6 首发上线 PPIO,原生多模态智能体模型,整体与 GPT-5.4/Opus 4.6 同梯队。支持300子代理集群编排。

新模型

🔒 PPIO Sandbox TURN 内测

Agent 沙箱实时通信服务内测,延迟从300-500ms降至50-100ms。

新功能 查看来源
Novita AI 2026-05-29 更新
📄 来源:Changelog

⚠️ mimo-v2-flash 模型下线通知(6月5日生效)

mimo-v2-flash 将于2026-06-05从 Serverless Endpoints 下线,推荐迁移至 mimo-v2.5。

模型下线 查看来源

⚠️ 暂无更新渠道

🗣️ 讯飞星辰MaaS — 暂无公开更新日志,发现渠道后立即补充
返回历史报告列表