🎯 竞品新能力周报

2026年3月18日
📅 监控范围:2026-03-11 ~ 2026-03-18
15
监控平台
6
国内平台
8
海外平台
1
暂无渠道

🇨🇳 国内平台

💎 硅基流动 2026-03-10 更新
📄 来源:官方更新公告

⚠️ 模型下线通知(3月17日已生效)

已于 2026-03-17 下线以下模型:Pro/MiniMaxAI/MiniMax-M2.1、Pro/Qwen/Qwen2-7B-Instruct、Qwen/Qwen2-7B-Instruct、Pro/THUDM/glm-4-9b-chat、THUDM/glm-4-9b-chat、deepseek-ai/deepseek-vl2、Pro/Qwen/Qwen2.5-VL-7B-Instruct、Qwen/Qwen3-Next-80B-A3B-Thinking、Qwen/Qwen3-Next-80B-A3B-Instruct、Qwen/Qwen2.5-Coder-7B-Instruct、Pro/Qwen/Qwen2.5-Coder-7B-Instruct

下线通知

💰 Qwen3.5-397B-A17B 定价调整(3月9日)

调整 Qwen/Qwen3.5-397B-A17B 模型定价。

定价调整 查看来源
♾️ 无问芯穹 2026-03-13 更新
📄 来源:GenStudio 更新日志

⬆️ Infini 编码套餐支持 Lite→Pro 升级

支持将 Lite 套餐升级至 Pro 套餐。

新功能
🎁 首次首月购买5折优惠

Lite 版本折后首月 19.9 元,Pro 版本折后首月 99.9 元。

优惠活动

👥 邀请好友奖励机制

每成功邀请一位好友完成注册获得 5 元代金券。

新功能

🔄 配额重置机制变更

7天配额改为每周一 00:00 重置;30天配额改为每订阅周期第一日重置。

功能变更 查看来源
🔥 火山方舟 最近更新 2026-02-25
📄 来源:产品更新公告

近7天无新更新。页面为 SPA 动态加载,详细更新内容需手动确认。

查看来源
🌋 火山机器学习平台 最近更新 2026-02-09
📄 来源:Release Notes

近7天无新更新。最近更新(2月):MLP共享存储新增弹性文件存储(EFS)、存储权限预校验。

查看来源
🟠 阿里百炼 4月初读3月月刊
📄 来源:产品月刊

阿里百炼按月发布产品月刊,3月月刊将于4月初发布。

查看2月月刊
🔵 百度千帆 SPA页面-需手动查看
📄 来源:更新动态

页面为 SPA 动态加载,自动抓取失败。请点击下方链接手动查看。

查看来源

🌏 海外平台

🟧 AWS Bedrock 2026-03-13 更新
📄 来源:AWS What's New RSS

📡 AgentCore Runtime 支持 AG-UI 协议

支持 Agent-User Interaction 协议,实现响应式实时 agent 体验。支持流式文本块、推理步骤、工具结果。支持 SSE 和 WebSocket 传输。

新功能 查看来源
🧠 AgentCore Memory 流式通知(3月12日)

长期记忆支持流式通知,Memory 记录创建或修改时推送到 Amazon Kinesis,消除轮询需求。

新功能
🟨 AWS SageMaker AI 2026-03-16 更新
📄 来源:AWS What's New RSS

⚡ HyperPod 空闲资源共享

支持动态资源共享,允许团队借用超出其保证配额的未分配资源。管理员可配置特定资源类型的借用限制(加速器、vCPU、内存)。

新功能 查看来源
🚀 RunPod 2026-03 更新
📄 来源:Release Notes

⚡ Flash beta:Python SDK 一键 GPU 运行

Flash SDK 进入 Public Beta。使用单个 @Endpoint 装饰器即可在 RunPod Serverless GPU 上运行 Python 函数。支持远程执行、自动扩缩容、依赖管理。支持队列模式和负载均衡模式。

新功能 查看来源
🟢 PPIO 2026-03-06 更新
📄 来源:PPIO 博客 & News
🤖 PPClaw 上线:OpenClaw Agent 部署方案

PPClaw 让 OpenClaw 告别"最后一公里"难题,提供 Agent 部署的终极答案。

新功能 查看来源
Novita AI 2026-03-16 更新
📄 来源:Changelog

💰 GPU 服务定价调整

自2026年3月16日起,调整 GPU Instances 和 Serverless GPU 服务的全球定价。

定价调整 查看来源
🎆 Fireworks 2026-02-05 更新
📄 来源:Changelog

🎬 Video & Audio Input Models

支持通过 Chat Completions API 查询多模态模型的视频和音频输入,用于视频字幕、场景分析和多模态问答。可部署 Qwen3 Omni 和 Molmo2 等模型。

新功能

☁️ AWS S3 训练数据集集成

支持使用 GCP-to-AWS OIDC 联合身份将训练数据集存储在自有 AWS S3 存储桶中(BYOB),无需长期凭证。

新功能

🔐 SSO JIT 用户配置(企业版)

SSO 首次登录时自动创建用户账户,无需手动创建用户。

功能升级 查看来源
🔷 Google Vertex AI 2026-03-16 更新
📄 来源:Release Notes

⚠️ Vertex AI v1 功能下线(3月16日)

部分 v1 功能标记为 Deprecated。

下线通知

🤝 Partner 模型评估支持(3月12日)

Gen AI 评估服务现支持评估合作伙伴模型,如 Anthropic 和 Llama 模型。

新功能

🔍 Vector Search 2.0 正式发布 GA(3月5日)

统一数据和向量的 Collections、自动嵌入、混合搜索和排序、PSC/PGA/VPC Service Controls 支持。

GA

⚡ Gemini 3.1 Flash-Lite 预览版(3月3日)

最具成本效益的 Gemini 模型,针对高流量低延迟场景优化。

新模型 查看来源
🤝 Together AI 2026年3月
📄 来源:Changelog

3月 Changelog 暂无详细内容(仅显示月份标题)。1月模型重定向:GLM-4.6→GLM-4.7、DeepSeek-V3-0324→DeepSeek-V3.1。

查看来源

⚠️ 暂无更新渠道

🗣️ 讯飞星辰MaaS — 暂无公开更新日志,发现渠道后立即补充
返回历史报告列表