竞品新能力周报

💎 硅基流动 2026-03-10 更新

📄 来源：官方更新公告 - https://docs.siliconflow.cn/cn/release-notes/overview

🗑️ 平台服务调整通知（2026-03-10）

为了进一步优化资源配置，提供更先进和优质的技术服务，平台将于 2026-03-17 对下列模型进行下线处理：

Pro/MiniMaxAI/MiniMax-M2.1
Pro/Qwen/Qwen2-7B-Instruct
Qwen/Qwen2-7B-Instruct
Pro/THUDM/glm-4-9b-chat
THUDM/glm-4-9b-chat
deepseek-ai/deepseek-vl2
Pro/Qwen/Qwen2.5-VL-7B-Instruct
Qwen/Qwen3-Next-80B-A3B-Thinking
Qwen/Qwen3-Next-80B-A3B-Instruct
Qwen/Qwen2.5-Coder-7B-Instruct
Pro/Qwen/Qwen2.5-Coder-7B-Instruct

模型下线

💰 价格调整（2026-03-09）

调整 Qwen/Qwen3.5-397B-A17B 模型的价格，详情请前往模型广场查看。

价格调整查看来源

♾️ 无问芯穹 2026-04-02 更新

📄 来源：GenStudio 更新日志 - https://docs.infini-ai.com/gen-studio/changelog.html

📊 用量统计页面数据更新时效调整（2026-04-02）

用量统计页面中的数据通常会在您实际发起 API 调用后约 10 分钟更新。

功能优化

🚫 停止提供基础版 LLM API 免费服务（2026-03-30）

停止提供基础版 LLM API 免费服务（网页端持续免费），请关注账户余额，及时充值。

服务调整

🤖 上线 Minimax M2.7（2026-03-18）

上线 Minimax 系列大语言模型。可在体验中心试用，支持 API 调用。

新模型

🤖 上线多款新模型（2026-02月）

minimax-m2.5（2026-02-13）
glm5（2026-02-12）
kimi-k2.5（2026-01-29）

新模型

📈 用量统计页面升级（2026-01-17）

大语言模型统计指标全面升级：新增性能指标（如 TTFT、OTPS、RPM、TPM）与详细错误统计，支持从调用量、性能、错误三个维度深度分析服务状况。全局新增数据导出功能，支持下载 Excel 报表。

功能升级查看来源

🌋 火山机器学习平台 2026-02-09 更新

📄 来源：Release Notes - https://www.volcengine.com/docs/6459/2206987

💾 MLP共享存储新增弹性文件存储（2026-02-09）

新增弹性文件存储（EFS，Elastic File Storage）。地域：华北2(北京)、华东2(上海)

新功能

🔧 自定义任务搜索问题修复（2026-02-09）

修复了列表数据小于1万条时，自定义任务列表搜索"全部"任务显示系统异常的问题。

Bug修复

🔐 存储权限管理优化（2026-02-06）

存储权限预校验：用户在使用MLP机器学习平台里面的共享存储的时候增加对应权限的校验
鉴权方式新增通过【机器学习平台服务关联角色】方式来完成存储鉴权
支持【API密钥：默认】和【机器学习平台服务关联角色】2个选项进行鉴权
客户使用存储（TOS、vePFS等）时需明确选择权限类型：【读写/只读/读写删】

功能升级查看来源

🔥 火山方舟抓取失败

📄 来源：产品更新公告 - https://www.volcengine.com/docs/82379/1159177

⚠️ 页面内容未完全加载，无法获取有效更新信息。SPA页面抓取失败，需要手动访问确认。

查看来源

🔵 百度千帆抓取失败

📄 来源：更新动态 - https://cloud.baidu.com/doc/qianfan/s/Mmh8l4qwj

⚠️ 页面内容未完全加载，无法获取有效更新信息。SPA页面抓取失败，需要手动访问确认。

查看来源

🟠 阿里百炼月刊未找到

📄 来源：产品月刊（动态URL）

⚠️ 阿里百炼按月发布产品月刊。4月初应读取3月月刊，但由于web_search工具缺少Brave API密钥，无法搜索月刊URL。

请手动搜索"阿里云百炼 3月产品月报 2026"查看最新月刊。

🎆 Fireworks 2026-02-05 更新

📄 来源：Changelog - https://docs.fireworks.ai/updates/changelog

🎥 视频音频模型、AWS S3训练集成和SSO改进（2026-02-05）

视频音频输入模型：支持使用视频和音频输入查询多模态模型，用于视频字幕、场景分析和多模态问答。部署Qwen3 Omni和Molmo2等模型。
AWS S3训练集成：支持通过GCP-to-AWS OIDC联邦将训练数据集存储在客户自己的AWS S3桶中（BYOB），无需长期凭证。
JIT用户配置（企业版）：首次通过SSO登录时自动创建用户账户。

新功能

🔥 预热训练和Azure模型上传（2026-01-20）

强化微调的预热训练：支持从之前的监督微调检查点预热启动强化微调作业。
Azure联邦身份：模型从Azure Blob Storage上传时支持Azure AD联邦身份认证。

功能升级查看来源

🔷 Google Vertex AI 2026-04-06 更新

📄 来源：Release Notes - https://cloud.google.com/vertex-ai/docs/release-notes（内容过长，仅展示近期重点）

🔍 RAG Engine元数据搜索（2026-04-06）

支持在Vertex AI RAG Engine中使用基于模式的元数据搜索。可以为语料库定义元数据模式，将元数据附加到该语料库中的文件，并在检索期间使用此元数据过滤上下文。

新功能

🎬 Veo 3.1 Lite发布（2026-04-02）

Veo 3.1 Lite现已公开预览（Public Preview），这是最具成本效益的Veo on Vertex AI模型。

新模型

📅 Gemini 2.5模型退役日期更新（2026-04-02）

Gemini 2.5 Pro、Gemini 2.5 Flash-Lite和Gemini 2.5 Flash的退役日期已更新至2026年10月16日。

退役通知

⚠️ Imagen生成GA端点弃用（2026-03-24）

多个图像生成端点被弃用，建议在2026年6月30日之前更新到新端点，包括imagegeneration@002~006、imagen-3.0/4.0系列等，推荐迁移到gemini-2.5-flash-image。

端点弃用

📦 Vector Search 2.0正式GA（2026-03-05）

Vector Search 2.0正式可用（GA），包括Collections统一数据和向量、自动嵌入、混合搜索和排序等功能。

正式发布

⚡ Gemini 3.1 Flash-Lite（2026-03-03）

Gemini 3.1 Flash-Lite（gemini-3.1-flash-lite-preview）现已公开预览，这是最具成本效益的Gemini模型，针对高流量、成本敏感的LLM流量的低延迟用例进行了优化。

新模型查看来源

🟧 AWS Bedrock 2026-04-03 更新

📄 来源：AWS What's New Feed - https://aws.amazon.com/about-aws/whats-new/recent/feed/

🛡️ Amazon Bedrock Guardrails跨账户防护正式GA（2026-04-03）

Amazon Bedrock Guardrails现在支持通过跨账户防护在组织内的所有AWS账户中集中执行安全控制。中央安全团队和管理员现在可以自动为组织中Amazon Bedrock的所有基础模型交互实施这些控制，消除为每个账户手动配置防护栏的操作开销。

通过跨账户防护，可以在管理账户的新Amazon Bedrock策略中指定防护栏ID，该策略会自动在所有成员实体（包括组织单位（OU）和单个账户）的所有模型调用中执行配置的防护措施。

正式发布查看来源

🟨 AWS SageMaker AI 2026-04-06 更新

📄 来源：AWS What's New Feed - https://aws.amazon.com/about-aws/whats-new/recent/feed/

📓 Unified Studio笔记本导入/导出和开发者加速功能（2026-04-06）

Amazon SageMaker Unified Studio笔记本现在支持导入/导出功能，支持从JupyterLab和其他笔记本平台迁移。支持.ipynb、.json和.py格式，同时保留单元格类型和元数据。

新的开发者加速功能包括：单元格重新排序、键盘快捷键、单元格重命名和多行SQL支持。

新功能

📊 Data Agent新增图表功能和物化视图支持（2026-04-03）

Amazon SageMaker Data Agent现在支持交互式图表、Snowflake数据源的SQL分析以及Amazon SageMaker Unified Studio笔记本中的物化视图管理。

可以使用自然语言提示生成交互式图表
支持通过外部连接查询Snowflake表
可以基于查询模式推荐物化视图优化

新功能查看来源

🚀 RunPod 2026-03 更新

📄 来源：Release Notes - https://docs.runpod.io/release-notes

⚡ Flash beta发布（2026年3月）

Flash现已公开测试。Flash是一个Python SDK，让开发者用单个装饰器在RunPod Serverless GPU上运行函数。

关键特性：远程执行、自动扩展、依赖管理、两种模式（基于队列的端点和负载均衡端点）、Flash应用（使用flash init、flash run和flash deploy构建生产就绪的API）。

新功能

🌍 Flash多数据中心部署（2026年3月）

Flash现在支持同时将端点部署到多个数据中心。传递数据中心列表以在多个区域分发工作负载，提高可用性和降低延迟。还可以为每个数据中心附加网络卷以实现特定区域的数据访问。

功能升级

🔄 GitHub release回滚GA和负载均衡Serverless repos（beta）（2026年2月）

GitHub release回滚：从控制台回滚Serverless端点到任何先前的构建版本
负载均衡Serverless repos（beta）：Hub中现在提供负载均衡端点

功能升级查看来源

🟢 PPIO 2026-01 更新

📄 来源：PPIO 博客 - https://blog.ppio.com/

🏆 姚欣获聘"光谷全球产业合伙人"（2026-01-25）

PPIO联合创始人兼CEO姚欣受聘为"光谷全球产业合伙人"，成为助力光谷链接全球产业资源的重要伙伴之一。在"2026光谷AI产业发展峰会"上，主持了主题为《武汉如何抓住AI浪潮的机会》圆桌论坛。

公司动态

🤖 上线多款新模型（2026年1月）

Kimi K2.5（2026-01-27）
GLM-4.7-Flash模板（2026-01-20）
GLM-Image部署模板（2026-01-14）

新模型查看来源

✨ Novita AI 2026-03-27 更新

📄 来源：Changelog - https://novita.ai/docs/changelog/

💰 LLM API计费规则说明（2026-03-27）

明确了LLM API计费规则：

计费基于token数量（输入token和输出token分别计费）
当模型已开始推理时收费
成功请求（200）和客户端断开连接（499）都会收费
无效请求/认证失败/速率限制（400/401/403/429）不收费
平台错误（500/503/504）不收费

关于499状态码：当请求到达模型时，推理会立即开始。如果客户端在请求中途断开连接，已消耗的计算资源仍然可计费（无论是非流式还是流式模式）。

计费说明查看来源

🤝 Together AI 2026-01 更新

📄 来源：Changelog - https://docs.together.ai/docs/changelog

🔄 模型重定向（2026年1月）

以下模型现在自动重定向到升级版本：

mistralai/Mistral-7B-Instruct-v0.3 → mistralai/Ministral-3-14B-Instruct-2512
zai-org/GLM-4.6 → zai-org/GLM-4.7
DeepSeek-V3-0324 → DeepSeek-V3.1

这些是相同系列的升级，具有兼容的行为。如果需要原始版本，可以作为专用端点部署。

模型升级查看来源

🎯 竞品新能力周报

🇨🇳 国内平台

🗑️ 平台服务调整通知（2026-03-10）

💰 价格调整（2026-03-09）

📊 用量统计页面数据更新时效调整（2026-04-02）

🚫 停止提供基础版 LLM API 免费服务（2026-03-30）

🤖 上线 Minimax M2.7（2026-03-18）

🤖 上线多款新模型（2026-02月）

📈 用量统计页面升级（2026-01-17）

💾 MLP共享存储新增弹性文件存储（2026-02-09）

🔧 自定义任务搜索问题修复（2026-02-09）

🔐 存储权限管理优化（2026-02-06）

🌏 海外平台

🎥 视频音频模型、AWS S3训练集成和SSO改进（2026-02-05）

🔥 预热训练和Azure模型上传（2026-01-20）

🔍 RAG Engine元数据搜索（2026-04-06）

🎬 Veo 3.1 Lite发布（2026-04-02）

📅 Gemini 2.5模型退役日期更新（2026-04-02）

⚠️ Imagen生成GA端点弃用（2026-03-24）

📦 Vector Search 2.0正式GA（2026-03-05）

⚡ Gemini 3.1 Flash-Lite（2026-03-03）

🛡️ Amazon Bedrock Guardrails跨账户防护正式GA（2026-04-03）

📓 Unified Studio笔记本导入/导出和开发者加速功能（2026-04-06）

📊 Data Agent新增图表功能和物化视图支持（2026-04-03）

⚡ Flash beta发布（2026年3月）

🌍 Flash多数据中心部署（2026年3月）

🔄 GitHub release回滚GA和负载均衡Serverless repos（beta）（2026年2月）

🏆 姚欣获聘"光谷全球产业合伙人"（2026-01-25）

🤖 上线多款新模型（2026年1月）

💰 LLM API计费规则说明（2026-03-27）

🔄 模型重定向（2026年1月）

⚠️ 暂无更新渠道

以下平台暂无公开更新日志