竞品新能力周报

💎 硅基流动 2026-05-08 更新

📄 来源：官方更新公告

⚠️ 11款模型下线通知（5月15日生效）

Kimi-K2-Thinking、Kimi-K2-Instruct-0905、GLM-4.6、GLM-4.6V、Ring-flash-2.0、Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Instruct-2507 等11款模型将于2026-05-15下线。

模型下线

🔒 实名认证强制要求（5月15日起）

自2026-05-15起，未完成实名认证的账号将无法使用平台服务。

合规要求

⚠️ 12款模型下线通知（4月29日生效）

Kwaipilot/KAT-Dev、PaddleOCR-VL、QwQ-32B 等12款模型已于2026-04-29下线。

模型下线查看来源

♾️ 无问芯穹 2026-05-31 更新

📄 来源：GenStudio 更新日志

💰 LLM API 被动缓存功能（6月1日生效）

新增被动缓存功能，缓存的 token 以折扣价格计费，6月1日起生效。

功能升级

⚠️ Qwen2.5 系列8款模型下线

Qwen2.5 系列模型（包括多个尺寸版本）已于5月7日下线。

模型下线

🤖 Mimo V2.5 Pro 上线

新增 mimo-v2.5-pro 模型（4月28日上线）。

新模型

🤖 DeepSeek-V4 系列上线

新增 deepseek-v4-pro、deepseek-v4-flash 模型（4月22日上线）。

新模型

🤖 Kimi K2.6 上线

新增 kimi-k2.6 模型（4月21日上线）。

新模型查看来源

🔥 火山方舟近期无更新

📄 来源：产品更新公告

页面最后更新日期为2026.05.11，最近可见更新为202604期（4月）。本期无新更新。

查看来源

🌋 火山机器学习平台 2026-05-22 更新

📄 来源：Release Notes 2026.05

📊 监控仪表盘升级（MLP → VMP）

监控仪表盘从 MLP 平台升级至 VMP 平台，提供更全面的监控能力。

功能升级

💻 VS Code 升级至 v1.111

内置 VS Code 版本升级至 1.111。

功能升级

🤖 新增「数据采集任务」标签页

新增 PICO VR 设备遥操作数据采集功能，成本仅为传统动捕设备的10%。可用区域：华北2(北京)、华北3(北京2)、华东4(大同)、华东2(上海)、华南1(广州)、亚太东南(柔佛)。

新功能查看来源

🟠 阿里百炼 5月月刊尚未发布

📄 来源：产品月刊

6月初应读5月月刊，但5月月刊尚未发布。4月月刊内容概要：31款新模型上线（含 HappyHorse-1.0、Qwen3.6 全系列、万相2.7）；Token Plan 团队版上线；记忆库功能；高代码应用 K8s 部署支持。

查看4月月刊

🔵 百度千帆 2026-04-13 为最新

📄 来源：更新动态（SPA）

页面最后更新为2026-04-13，无5月下旬至6月初的新更新内容。最新条目：GLM-5.1 模型上线、API-Key 查看功能。

查看来源

🎆 Fireworks 2026-05-14 更新

📄 来源：Changelog

⚠️ 9款 Serverless 模型下线通知

DeepSeek V3.1/V3.2 → 推荐迁移至 Kimi K2.6/GLM 5.1；GLM 4.7/5 → GLM 5.1；Qwen3 8B → GPT-OSS 20B；Llama 3.3 70B → GPT-OSS 120B 等。

模型下线

🤖 视频/音频输入模型支持

新增 Qwen3 Omni、Molmo2 等视频与音频输入模型。

新模型

🔗 AWS S3 BYOB 训练数据集成

支持通过 OIDC 联邦认证将 AWS S3 数据集用于模型训练。

新功能

🔐 JIT SSO 用户自动创建（Enterprise）

企业版新增 JIT SSO 用户自动创建功能。

功能升级

🔥 Warm-Start RFT 训练

支持从 SFT checkpoint 启动 RFT 训练，加速模型微调流程。

功能升级

🤖 多款新模型上线

Gemma 3 12B/4B
Qwen3 Omni 30B A3B
Devstral Small 2 24B
Nemotron Nano 3 30B
DeepSeek V3.2
Mistral Large 3 675B
KAT Coder/Dev
Kimi K2 Thinking

新模型

💰 Cached Token 定价展示

新增缓存 token 定价显示，Prompt caching 提供50%折扣。

功能升级查看来源

🟧 AWS Bedrock 2026-06-02 更新

📄 来源：AWS What's New RSS

🤖 GPT-5.5、GPT-5.4 与 Codex 正式上线 Bedrock

OpenAI GPT-5.5、GPT-5.4 现已 GA，Codex 支持通过 Bedrock 运行推理，支持 VS Code、JetBrains、Xcode 集成。定价与 OpenAI 第一方一致。

新模型

📊 CloudWatch 监控支持 bedrock-mantle 端点

新增 CloudWatch metrics for bedrock-mantle endpoint（支持 OpenAI/Anthropic 兼容 API），覆盖推理计数、输入/输出 token 总量、客户端错误计数，支持按账号/项目/模型/项目+模型粒度。

新功能

🔐 AgentCore Identity 支持 BYO Secrets

Bedrock AgentCore Identity 现支持引用客户自管理的 AWS Secrets Manager secret ARN，满足严格治理合规需求。在14个 AWS Region 可用。

功能升级查看来源

🟨 AWS SageMaker AI 2026-06-02 更新

📄 来源：AWS What's New RSS

🛡️ SageMaker 支持 SCP 权限边界

Unified Studio 现支持自定义 IAM 权限边界（Permissions Boundaries），满足组织级 SCP合规要求，所有新项目自动继承。

功能升级

🔧 HyperPod Troubleshooting Skills

新增 AI 编码助手（Claude Code、Cursor、Kiro）的集群诊断 Skills，通过自然语言诊断 GPU 硬件故障、NCCL 通信问题、性能瓶颈等。Skills 已开源，支持 Slurm 和 EKS 集群。

新功能

⚡ HyperPod 支持 EFA-only 网络接口

支持配置 efa-only 网络接口，不占用 VPC IP 地址，适用于大规模分布式训练。通过 CreateCluster/UpdateCluster API 的 ClusterNetworkInterface 配置启用。

功能升级查看来源

🔷 Google Vertex AI 2026-05-26 更新

📄 来源：Release Notes

🤖 Data Science Agent GA

Colab Enterprise 中的 Data Science Agent 正式可用（GA），支持自动化探索性数据分析、ML 任务和洞察交付。

新功能

⚠️ Vertex AI Extensions 下线通知

Vertex AI Extensions 已标记为 deprecated，将于2026年11月26日后关闭，推荐迁移到 Agent Platform。

下线通知

🔍 RAG Cross Corpus Retrieval 预览版

支持从多个 RAG corpora 同时检索相关上下文或生成答案，通过 AsyncRetrieveContexts 和 AskContexts API。4月17日发布。

新功能查看来源

🤝 Together AI 2026-06-01 更新

📄 来源：Changelog

📊 Fine-tuning Job Metrics API

新增 GET /fine-tunes/{id}/metrics API，返回训练指标（loss 曲线等），可编程监控微调进度。

新功能

🖥️ Slurm Startup Scripts

GPU clusters 支持 Slurm startup scripts，节点启动/作业分配/完成时自动执行脚本。

功能升级

⚡ Evaluations 单次比较模式

compare evaluator 新增 disable_position_bias_correction 参数，单次评估节省50% judge 成本和延迟。

功能升级

🤖 Qwen3.7-Max 上线 Serverless

新增 Qwen/Qwen3.7-Max，定价 $2.50/$7.50 per 1M tokens。

新模型

🤖 多款视频/图像新模型上线

ByteDance/Seedream-5.0-lite（图像）
alibaba/happyhorse-1.0-i2v/r2v（视频）
google/veo-3.1/veo-3.1-lite（视频）
pearl-ai/gemma-4-31b-it

新模型

⚠️ 多款模型下线

moonshotai/Kimi-K2.5 下线
Qwen/Qwen3-Coder-480B-A35B-Instruct-FP8 下线 → 推荐 MiniMax-M2.7
black-forest-labs/FLUX.1-krea-dev 下线

模型下线

🔐 GPU Clusters OIDC 认证 + RBAC

GPU clusters 支持外部 OIDC 认证（Google/Okta/Auth0/Entra ID），每个用户独立 token 和审计追踪。

新功能查看来源

🚀 RunPod 2026-03 更新

📄 来源：Release Notes

⚡ Flash Beta：Python SDK 云 GPU 执行

Flash 进入 public beta，用 @Endpoint 装饰器即可在 Serverless GPU 上运行函数，支持自动缩放和依赖管理。同时支持多数据中心部署。

新功能

注意：RunPod release notes 按月而非按周更新，最近条目为2026年3月。2月更新：新增 Public Endpoints（SORA 2、Kling v2.1/v2.6、Seedream 4.0、Qwen3 32B 等）；Vercel AI SDK 集成。

查看来源

🟢 PPIO 2026-06 更新

📄 来源：PPIO 博客

🤖 MiniMax M3 首发上线（限时5折）

作为 MiniMax 官方 MaaS 合作伙伴，首发上线 MiniMax M3。支持 1M 超长上下文、原生多模态（图片/视频输入/桌面操作），SWE-Bench Pro 超 GPT-5.5/Gemini 3.1 Pro，SVG-Bench 超 Opus 4.7。

新模型

🤖 DeepSeek-V4 预览版上线

上线 DeepSeek-V4-Pro（1.6T/49B激活）和 DeepSeek-V4-Flash（284B/13B激活），支持100万 token 上下文。

新模型

🤖 Kimi K2.6 首发上线

Kimi K2.6 首发上线 PPIO，原生多模态智能体模型，整体与 GPT-5.4/Opus 4.6 同梯队。支持300子代理集群编排。

新模型

🔒 PPIO Sandbox TURN 内测

Agent 沙箱实时通信服务内测，延迟从300-500ms降至50-100ms。

新功能查看来源

✨ Novita AI 2026-05-29 更新

📄 来源：Changelog

⚠️ mimo-v2-flash 模型下线通知（6月5日生效）

mimo-v2-flash 将于2026-06-05从 Serverless Endpoints 下线，推荐迁移至 mimo-v2.5。

模型下线查看来源

🇨🇳 国内平台

⚠️ 11款模型下线通知（5月15日生效）

🔒 实名认证强制要求（5月15日起）

⚠️ 12款模型下线通知（4月29日生效）

💰 LLM API 被动缓存功能（6月1日生效）

⚠️ Qwen2.5 系列8款模型下线

🤖 Mimo V2.5 Pro 上线

🤖 DeepSeek-V4 系列上线

🤖 Kimi K2.6 上线

📊 监控仪表盘升级（MLP → VMP）

💻 VS Code 升级至 v1.111

🤖 新增「数据采集任务」标签页

🌏 海外平台

⚠️ 9款 Serverless 模型下线通知

🤖 视频/音频输入模型支持

🔗 AWS S3 BYOB 训练数据集成

🔐 JIT SSO 用户自动创建（Enterprise）

🔥 Warm-Start RFT 训练

🤖 多款新模型上线

💰 Cached Token 定价展示

🤖 GPT-5.5、GPT-5.4 与 Codex 正式上线 Bedrock

📊 CloudWatch 监控支持 bedrock-mantle 端点

🔐 AgentCore Identity 支持 BYO Secrets

🛡️ SageMaker 支持 SCP 权限边界

🔧 HyperPod Troubleshooting Skills

⚡ HyperPod 支持 EFA-only 网络接口

🤖 Data Science Agent GA

⚠️ Vertex AI Extensions 下线通知

🔍 RAG Cross Corpus Retrieval 预览版

📊 Fine-tuning Job Metrics API

🖥️ Slurm Startup Scripts

⚡ Evaluations 单次比较模式

🤖 Qwen3.7-Max 上线 Serverless

🤖 多款视频/图像新模型上线

⚠️ 多款模型下线

🔐 GPU Clusters OIDC 认证 + RBAC

⚡ Flash Beta：Python SDK 云 GPU 执行

🤖 MiniMax M3 首发上线（限时5折）

🤖 DeepSeek-V4 预览版上线

🤖 Kimi K2.6 首发上线

🔒 PPIO Sandbox TURN 内测

⚠️ mimo-v2-flash 模型下线通知（6月5日生效）

⚠️ 暂无更新渠道