🎯 竞品新能力周报

2026年3月11日
📅 监控范围:2026-03-04 ~ 2026-03-11
15
监控平台
6
国内平台
8
海外平台
1
暂无渠道

🇨🇳 国内平台

💎 硅基流动 03-10 更新
📄 来源:官方更新公告

⚠️ 模型下线通知(03-17 生效)

以下模型将于3月17日下线,请及时切换:

  • Pro/MiniMaxAI/MiniMax-M2.1
  • Pro/Qwen/Qwen2-7B-Instruct
  • deepseek-ai/deepseek-vl2
  • Qwen/Qwen3-Next-80B-A3B-Thinking
  • Qwen/Qwen3-Next-80B-A3B-Instruct
  • black-forest-labs/FLUX.1 系列
  • fishaudio/fish-speech-1.4/1.5
  • 等共17个模型
下线通知

💰 模型价格调整(03-09)

Qwen/Qwen3.5-397B-A17B 模型价格调整

价格调整 查看来源
♾️ 无问芯穹 03-05 更新
📄 来源:GenStudio 更新日志

💳 Infini 编码套餐新增手动续费

支持手动续费选项,方便用户按需续订。

新功能

📊 套餐额度与用量实时展示

新增套餐额度与实时用量情况展示(5小时/7天/30天),延时1-2分钟级别。

功能升级

🔧 专属 API 接口

新增专属 API 接口用于监控和查询用量。

新功能

🤖 Anthropic 协议模型扩充

Infini 编码套餐 Anthropic 协议支持范围扩充:deepseek-v3.2、kimi-2.5、minimax-m2.1、minimax-m2.5、glm-4.7、glm-5

新模型 查看来源
🟢 PPIO 03-06 更新
📄 来源:PPIO 博客

🚀 PPClaw 让 OpenClaw 告别"最后一公里"难题

一站式云端 AI 助手部署方案,多模型可选。PPClaw 提供 Agent 部署的终极答案,简化 OpenClaw 的云端部署流程。

新功能 Agent能力 查看来源
🔥 火山方舟 02月 更新
📄 来源:产品更新公告

🎬 体验中心新模型

支持 Doubao-Seedance-2.0、Doubao-Seedream-5.0

新模型

📹 视频理解能力升级

  • Doubao-seed-2.0-Pro/Lite/Mini 支持长视频理解和视觉定位
  • 视频生成模型支持 VMP 配置监控告警
  • 长视频理解应用升级到 Doubao-Seed-2.0
功能升级

🔧 API 变更

API 错误码变更:ServerOverloaded → RequestBurstTooFast

API变更 查看来源
🌋 火山机器学习平台 近期无更新
📄 来源:月度文档

近7天暂无新功能发布。最近更新为2026-02-09。

查看来源
🔵 百度千帆 抓取失败
📄 来源:更新动态

SPA页面抓取失败,请手动查看更新内容。

查看来源
🟠 阿里百炼 4月初读3月月刊
📄 来源:产品月刊

阿里百炼按月发布产品月刊,3月月刊将于4月初发布。

查看2月月刊

🌏 海外平台

🟧 AWS Bedrock 03-10 更新
📄 来源:AWS What's New RSS

🔗 AgentCore Runtime 支持 Stateful MCP Server(03-10)

AgentCore Runtime 新增对有状态 MCP 服务器的支持,包括:

  • Elicitation:交互式收集用户输入
  • Sampling:请求 LLM 生成内容
  • Progress Notifications:长时操作进度通知

已在14个 AWS Region 可用。

新功能 Agent能力 查看来源

📊 新增 CloudWatch 监控指标(03-10)

  • TimeToFirstToken:首 token 延迟监控(streaming API)
  • EstimatedTPMQuotaUsage:TPM 配额使用估算

所有商业 Bedrock 区域可用,无需 API 变更或 opt-in。

可观测性 查看来源
🟨 AWS SageMaker AI 03-09 更新
📄 来源:AWS What's New RSS

⚡ Unified Studio 数据预览 v2.0(03-09)

Visual ETL 新增 data preview v2.0,使用浏览器内查询引擎,约1秒内即可预览每个 transform 的输出,无需 Spark session 启动,无额外计算成本。

  • 支持 S3(CSV/Parquet/JSON)、Redshift、S3 Tables、Glue Data Catalog
  • 支持第三方:Snowflake、MySQL、PostgreSQL、SQL Server、Oracle、BigQuery、DynamoDB、DocumentDB
新功能 查看来源
🔷 Google Vertex AI 03-05 更新
📄 来源:Release Notes

🔍 Vector Search 2.0 正式 GA(03-05)

  • Collections 统一数据和向量管理
  • 自动 Embeddings 生成
  • 混合搜索和排序(向量 + 全文 + 语义 Re-ranking)
  • 支持 PSC、PGA、VPC Service Controls
GA 向量搜索

⚡ Gemini 3.1 Flash-Lite 预览版(03-03)

发布 Public Preview,最具成本效益的 Gemini 模型,针对高流量低延迟场景优化。

新模型

⚠️ 视频生成 Preview 端点下线通知(03-03)

veo-3.0/veo-2.0/veo-3.1 系列 preview 端点将于4月2日下线,需迁移到对应的 GA 版本。

下线通知 查看来源
🤝 Together AI 03-10 更新
📄 来源:Changelog

💰 Cached Input Token Pricing(03-10)

MiniMax-M2.5 缓存输入 token 定价:$0.06/1M(标准价格的20%)

价格优化

🆕 新增模型 Qwen3.5-9B(03-07)

Qwen/Qwen3.5-9B 上线 Serverless

新模型

⚠️ 模型下线(03-06)

  • mixedbread-ai/Mxbai-Rerank-Large-V2
  • moonshotai/Kimi-K2-Thinking
  • meta-llama/Llama-3.2-3B-Instruct-Turbo
  • moonshotai/Kimi-K2-Instruct-0905
下线通知

🆕 新增模型(2月)

  • 02-16:Qwen3.5-397B-A17B
  • 02-15:MiniMax-M2.5
  • 02-13:GLM-5
新模型

🚀 Dedicated Container Inference 正式发布(02-12)

原 BYOC,支持容器化部署和扩展自定义模型。

GA

🔧 Python SDK v2.0 正式发布(02-04)

全新类型安全、OpenAPI 驱动的客户端,支持 Jobs API、Hardware API、Code Interpreter Sessions 等。

GA 查看来源
🎆 Fireworks 近期无更新
📄 来源:Changelog

近7天暂无新功能发布。最近更新为2026-02-05。

查看来源
🚀 RunPod 03月 更新
📄 来源:Release Notes

⚡ Flash SDK 公测

Python SDK 公测发布,用装饰器一键部署函数到 Runpod Serverless GPU:

  • 远程执行:@Endpoint 装饰器标记函数自动在 GPU/CPU 上运行
  • 自动扩缩容:Worker 按需从 0 扩展到 N
  • 依赖管理:包自动安装到远程 Worker
  • 两种模式:队列模式(批处理)+ 负载均衡模式(REST API)
  • Flash Apps:flash init / flash run / flash deploy 构建生产级 API
Beta 开发工具 查看来源
Novita AI 03-16 生效
📄 来源:Changelog

💰 GPU 服务定价调整

自2026年3月16日起,GPU Instances 和 Serverless GPU 服务全球定价调整。

价格调整 查看来源

⚠️ 暂无更新渠道

🗣️ 讯飞星辰MaaS — 暂无公开更新日志,发现渠道后立即补充
返回历史报告列表