Kimi-K2-Thinking、Kimi-K2-Instruct-0905、GLM-4.6、GLM-4.6V、Ring-flash-2.0、Qwen3-30B-A3B-Thinking-2507、Qwen3-235B-A22B-Instruct-2507 等11款模型将于2026-05-15下线。
模型下线自2026-05-15起,未完成实名认证的账号将无法使用平台服务。
合规要求新增被动缓存功能,缓存的 token 以折扣价格计费,6月1日起生效。
功能升级Qwen2.5 系列模型(包括多个尺寸版本)已于5月7日下线。
模型下线新增 mimo-v2.5-pro 模型(4月28日上线)。
新模型新增 deepseek-v4-pro、deepseek-v4-flash 模型(4月22日上线)。
新模型页面最后更新日期为2026.05.11,最近可见更新为202604期(4月)。本期无新更新。
查看来源监控仪表盘从 MLP 平台升级至 VMP 平台,提供更全面的监控能力。
功能升级内置 VS Code 版本升级至 1.111。
功能升级新增 PICO VR 设备遥操作数据采集功能,成本仅为传统动捕设备的10%。可用区域:华北2(北京)、华北3(北京2)、华东4(大同)、华东2(上海)、华南1(广州)、亚太东南(柔佛)。
新功能 查看来源6月初应读5月月刊,但5月月刊尚未发布。4月月刊内容概要:31款新模型上线(含 HappyHorse-1.0、Qwen3.6 全系列、万相2.7);Token Plan 团队版上线;记忆库功能;高代码应用 K8s 部署支持。
查看4月月刊页面最后更新为2026-04-13,无5月下旬至6月初的新更新内容。最新条目:GLM-5.1 模型上线、API-Key 查看功能。
查看来源DeepSeek V3.1/V3.2 → 推荐迁移至 Kimi K2.6/GLM 5.1;GLM 4.7/5 → GLM 5.1;Qwen3 8B → GPT-OSS 20B;Llama 3.3 70B → GPT-OSS 120B 等。
模型下线新增 Qwen3 Omni、Molmo2 等视频与音频输入模型。
新模型支持通过 OIDC 联邦认证将 AWS S3 数据集用于模型训练。
新功能企业版新增 JIT SSO 用户自动创建功能。
功能升级支持从 SFT checkpoint 启动 RFT 训练,加速模型微调流程。
功能升级OpenAI GPT-5.5、GPT-5.4 现已 GA,Codex 支持通过 Bedrock 运行推理,支持 VS Code、JetBrains、Xcode 集成。定价与 OpenAI 第一方一致。
新模型新增 CloudWatch metrics for bedrock-mantle endpoint(支持 OpenAI/Anthropic 兼容 API),覆盖推理计数、输入/输出 token 总量、客户端错误计数,支持按账号/项目/模型/项目+模型粒度。
新功能Bedrock AgentCore Identity 现支持引用客户自管理的 AWS Secrets Manager secret ARN,满足严格治理合规需求。在14个 AWS Region 可用。
功能升级 查看来源Unified Studio 现支持自定义 IAM 权限边界(Permissions Boundaries),满足组织级 SCP合规要求,所有新项目自动继承。
功能升级新增 AI 编码助手(Claude Code、Cursor、Kiro)的集群诊断 Skills,通过自然语言诊断 GPU 硬件故障、NCCL 通信问题、性能瓶颈等。Skills 已开源,支持 Slurm 和 EKS 集群。
新功能支持配置 efa-only 网络接口,不占用 VPC IP 地址,适用于大规模分布式训练。通过 CreateCluster/UpdateCluster API 的 ClusterNetworkInterface 配置启用。
功能升级 查看来源Colab Enterprise 中的 Data Science Agent 正式可用(GA),支持自动化探索性数据分析、ML 任务和洞察交付。
新功能Vertex AI Extensions 已标记为 deprecated,将于2026年11月26日后关闭,推荐迁移到 Agent Platform。
下线通知支持从多个 RAG corpora 同时检索相关上下文或生成答案,通过 AsyncRetrieveContexts 和 AskContexts API。4月17日发布。
新功能 查看来源新增 GET /fine-tunes/{id}/metrics API,返回训练指标(loss 曲线等),可编程监控微调进度。
新功能GPU clusters 支持 Slurm startup scripts,节点启动/作业分配/完成时自动执行脚本。
功能升级compare evaluator 新增 disable_position_bias_correction 参数,单次评估节省50% judge 成本和延迟。
功能升级新增 Qwen/Qwen3.7-Max,定价 $2.50/$7.50 per 1M tokens。
新模型GPU clusters 支持外部 OIDC 认证(Google/Okta/Auth0/Entra ID),每个用户独立 token 和审计追踪。
新功能 查看来源Flash 进入 public beta,用 @Endpoint 装饰器即可在 Serverless GPU 上运行函数,支持自动缩放和依赖管理。同时支持多数据中心部署。
新功能注意:RunPod release notes 按月而非按周更新,最近条目为2026年3月。2月更新:新增 Public Endpoints(SORA 2、Kling v2.1/v2.6、Seedream 4.0、Qwen3 32B 等);Vercel AI SDK 集成。
查看来源作为 MiniMax 官方 MaaS 合作伙伴,首发上线 MiniMax M3。支持 1M 超长上下文、原生多模态(图片/视频输入/桌面操作),SWE-Bench Pro 超 GPT-5.5/Gemini 3.1 Pro,SVG-Bench 超 Opus 4.7。
新模型上线 DeepSeek-V4-Pro(1.6T/49B激活)和 DeepSeek-V4-Flash(284B/13B激活),支持100万 token 上下文。
新模型Kimi K2.6 首发上线 PPIO,原生多模态智能体模型,整体与 GPT-5.4/Opus 4.6 同梯队。支持300子代理集群编排。
新模型mimo-v2-flash 将于2026-06-05从 Serverless Endpoints 下线,推荐迁移至 mimo-v2.5。
模型下线 查看来源