已于 2026-03-17 下线以下模型:Pro/MiniMaxAI/MiniMax-M2.1、Pro/Qwen/Qwen2-7B-Instruct、Qwen/Qwen2-7B-Instruct、Pro/THUDM/glm-4-9b-chat、THUDM/glm-4-9b-chat、deepseek-ai/deepseek-vl2、Pro/Qwen/Qwen2.5-VL-7B-Instruct、Qwen/Qwen3-Next-80B-A3B-Thinking、Qwen/Qwen3-Next-80B-A3B-Instruct、Qwen/Qwen2.5-Coder-7B-Instruct、Pro/Qwen/Qwen2.5-Coder-7B-Instruct
下线通知支持将 Lite 套餐升级至 Pro 套餐。
新功能Lite 版本折后首月 19.9 元,Pro 版本折后首月 99.9 元。
优惠活动每成功邀请一位好友完成注册获得 5 元代金券。
新功能近7天无新更新。页面为 SPA 动态加载,详细更新内容需手动确认。
查看来源近7天无新更新。最近更新(2月):MLP共享存储新增弹性文件存储(EFS)、存储权限预校验。
查看来源阿里百炼按月发布产品月刊,3月月刊将于4月初发布。
查看2月月刊页面为 SPA 动态加载,自动抓取失败。请点击下方链接手动查看。
查看来源支持 Agent-User Interaction 协议,实现响应式实时 agent 体验。支持流式文本块、推理步骤、工具结果。支持 SSE 和 WebSocket 传输。
新功能 查看来源长期记忆支持流式通知,Memory 记录创建或修改时推送到 Amazon Kinesis,消除轮询需求。
新功能Flash SDK 进入 Public Beta。使用单个 @Endpoint 装饰器即可在 RunPod Serverless GPU 上运行 Python 函数。支持远程执行、自动扩缩容、依赖管理。支持队列模式和负载均衡模式。
新功能 查看来源支持通过 Chat Completions API 查询多模态模型的视频和音频输入,用于视频字幕、场景分析和多模态问答。可部署 Qwen3 Omni 和 Molmo2 等模型。
新功能支持使用 GCP-to-AWS OIDC 联合身份将训练数据集存储在自有 AWS S3 存储桶中(BYOB),无需长期凭证。
新功能部分 v1 功能标记为 Deprecated。
下线通知Gen AI 评估服务现支持评估合作伙伴模型,如 Anthropic 和 Llama 模型。
新功能统一数据和向量的 Collections、自动嵌入、混合搜索和排序、PSC/PGA/VPC Service Controls 支持。
GA3月 Changelog 暂无详细内容(仅显示月份标题)。1月模型重定向:GLM-4.6→GLM-4.7、DeepSeek-V3-0324→DeepSeek-V3.1。
查看来源