🎯 竞品新能力周报
2026-06-25 · 12个平台更新
15
监控平台
12
本周更新
19
定制条目
国内平台
🔷
硅基流动
有更新
📄 https://docs.siliconflow.cn/cn/release-notes/overview · 2026-06-25T14:05:00+08:00
更新
GLM-4.7、Kimi-K2.5 等多款模型将于近期下线
GLM-4.7、Kimi-K2.5 等多款模型将于近期下线
更新
2026-05-15多模型下线通知 + 实名认证要求升级
2026-05-15多模型下线通知 + 实名认证要求升级
⚡
无问芯穹
有更新
📄 https://docs.infini-ai.com/gen-studio/changelog.html · 2026-06-25T14:08:00+08:00
更新
Qwen3系列、Kimi-K2-Thinking、DeepSeek-V4-Flash-Llama等14个模型即将于6月30日下线
Qwen3系列、Kimi-K2-Thinking、DeepSeek-V4-Flash-Llama等14个模型即将于6月30日下线
更新
2026-06-18 Qwen3.6系列模型上线 / 2026-06-17 GLM-5.2模型上线
2026-06-18 Qwen3.6系列模型上线 / 2026-06-17 GLM-5.2模型上线
更新
2026-06-16 预算管理功能上线,新增错误码10024
2026-06-16 预算管理功能上线,新增错误码10024
🌐
阿里百炼
有更新
📄 https://bailian.console.aliyun.com/ · 2026-06-25T14:10:00+08:00
更新
2026-06-09 模型评测排行榜与综合评测功能上线
2026-06-09 模型评测排行榜与综合评测功能上线
更新
模型导入国际站、临时API Key、Responses API异步调用、通义听悟Agent ASR资源包、Spring AI Alibaba
模型导入国际站、临时API Key、Responses API异步调用、通义听悟Agent ASR资源包、Spring AI Alibaba
🟢
PPIO
有更新
📄 https://blog.ppio.com/ · 2026-06-25T14:12:00+08:00
更新
首发上线GLM-5.2、Kimi K2.7 Code;MiniMax M3上线
首发上线GLM-5.2、Kimi K2.7 Code;MiniMax M3上线
更新
入选36氪2026最具价值成长企业100、信通院Token攀登计划、量子位2026 AIGC企业大奖
入选36氪2026最具价值成长企业100、信通院Token攀登计划、量子位2026 AIGC企业大奖
🌋
火山方舟
有更新
📄 https://www.volcengine.com/docs/82379/1159177 · 2026-06-25T14:15:00+08:00
更新
Doubao-Seed-2.0(256k上下文)、Doubao-Seedance-2.0(视频生成)、Doubao-Seedream-5.0(图片生成)
Doubao-Seed-2.0(256k上下文)、Doubao-Seedance-2.0(视频生成)、Doubao-Seedream-5.0(图片生成)
更新
方舟Coding Plan订阅服务、Responses API、方舟文档MCP协议支持
方舟Coding Plan订阅服务、Responses API、方舟文档MCP协议支持
海外平台
🎆
Fireworks
有更新
📄 https://docs.fireworks.ai/updates/changelog · 2026-06-25T14:10:00+08:00
更新
Serverless服务下线Kimi K2.5、Qwen 3.6 Plus、MiniMax M2.5;Audio和Image模型弃用
Serverless服务下线Kimi K2.5、Qwen 3.6 Plus、MiniMax M2.5;Audio和Image模型弃用
更新
GLM 5.2、Kimi K2.7 Code、MiniMax M3、Qwen 3.7 Plus上线
GLM 5.2、Kimi K2.7 Code、MiniMax M3、Qwen 3.7 Plus上线
更新
Video & Audio Models、AWS S3 Training、JIT SSO
Video & Audio Models、AWS S3 Training、JIT SSO
🎯 模型定制能力
微调
Warm-Start RFT
支持从SFT checkpoint继续RFT训练,实现SFT-to-RFT无缝工作流,使用--warm-start-from标志指定checkpoint
RFT
SFT
warm-start
checkpoint
https://docs.fireworks.ai/fine-tuning/warm-start
微调
VLM多模态微调
支持Qwen 2.5 VL模型家族的多模态微调(3B/7B/32B/72B),支持图文JSONL格式,最高64K上下文训练
VLM
多模态
Qwen2.5-VL
https://docs.fireworks.ai/fine-tuning/fine-tuning-vlm
微调
微调作业管理
微调作业支持停止后恢复、基于现有配置克隆新作业,适用于SFT和RFT任务
SFT
RFT
作业管理
https://docs.fireworks.ai/fine-tuning/fine-tuning-models
微调
RFT with DPO
支持DPO(直接偏好优化)和强化学习微调,提供自定义rollout和reward开发能力,支持多轮训练
RFT
DPO
RLHF
偏好优化
https://docs.fireworks.ai/fine-tuning/reinforcement-fine-tuning-models
微调
加权训练
RFT支持逐样本加权训练,控制不同样本对训练的影响程度
加权训练
样本权重
https://docs.fireworks.ai/fine-tuning/fine-tuning-models
微调
QAT量化感知训练
SFT V2支持量化感知训练,在训练过程中考虑量化影响,提升低精度部署效果
QAT
量化感知训练
https://docs.fireworks.ai/fine-tuning/fine-tuning-models
评测
Evaluator & MLOps
Evaluator创建体验增强,支持GitHub模板集成;新增Weights & Biases和MLflow集成,支持实验追踪
Evaluator
W&B
MLflow
实验追踪
https://docs.fireworks.ai/ecosystem/integrations/wandb
数据
AWS S3 BYOB数据集
训练数据集可存储在自有AWS S3桶中,通过GCP-to-AWS OIDC联邦实现安全访问,无需长期凭证
S3
BYOB
数据集
安全训练
https://docs.fireworks.ai/fine-tuning/secure-fine-tuning
数据
数据集下载
支持从Fireworks Web App直接下载数据集,可下载单个文件或批量ZIP下载
数据集下载
数据管理
https://docs.fireworks.ai/fine-tuning/fine-tuning-models
部署
LoRA快速部署
支持live merge或multi-LoRA部署,速度匹配基础模型,单命令简化部署流程
LoRA
live merge
multi-LoRA
https://docs.fireworks.ai/fine-tuning/deploying-loras
🤝
Together AI
有更新
📄 https://docs.together.ai/docs/changelog · 2026-06-25T14:18:00+08:00
更新
Whoami API端点、Early stopping for fine-tuning、Audio transcription上传限制提升至500MB、LoRA adapter支持附加到专用端点
Whoami API端点、Early stopping for fine-tuning、Audio transcription上传限制提升至500MB、LoRA adapter支持附加到专用端点
更新
GLM-5.2 serverless、Kimi K2.7 Code serverless、MiniMax M3 serverless上线;GLM-5、Qwen3.5-397B-A17B下线预告
GLM-5.2 serverless、Kimi K2.7 Code serverless、MiniMax M3 serverless上线;GLM-5、Qwen3.5-397B-A17B下线预告
更新
DeepSeek-V4-Pro降价
DeepSeek-V4-Pro降价
🎯 模型定制能力
微调
Early Stopping早停
微调作业支持早停功能,当验证损失停止改善时自动停止训练,减少成本并避免过拟合,支持patience/min_delta等参数调优
早停
过拟合
验证损失
https://docs.together.ai/docs/fine-tuning/early-stopping
微调
Metrics API
新增GET /fine-tunes/{id}/metrics端点,程序化获取训练指标(损失曲线等),无需打开dashboard即可监控进度
Metrics API
监控
损失曲线
https://docs.together.ai/docs/fine-tuning/metrics-api
微调
新增微调模型
新增支持Qwen3.6-35B-A3B、Gemma-4-31B/26B微调,扩展大模型微调能力
Qwen3.6
Gemma-4
微调
https://docs.together.ai/docs/fine-tuning/supported-models
微调
FP4/INT8量化
支持FP4和INT8量化部署,降低推理成本,多个模型(如GLM-5.2、Gemma-4)已支持FP4量化
FP4
INT8
量化部署
https://docs.together.ai/docs/inference/quantization
评测
Evaluations框架
LLM-as-judge评测框架,支持compare/classify/score功能,可创建自定义评测套件
LLM-as-judge
评测框架
https://docs.together.ai/docs/evaluation/overview
评测
Single-pass对比
compare评测支持disable_position_bias_correction参数,单次运行降低50%成本和延迟
compare评测
位置偏置
https://docs.together.ai/docs/evaluation/compare
数据
数据集验证
微调数据集上传后经过完整服务端schema验证,暴露processing_status和validation_report,可在训练前检测缺失role字段等问题
数据验证
schema验证
质量检查
https://docs.together.ai/docs/fine-tuning/dataset-validation
数据
HuggingFace集成
支持微调任意<100B参数的Hugging Face Hub CausalLM模型
HuggingFace
数据集集成
https://docs.together.ai/docs/fine-tuning/huggingface
部署
LoRA多适配器
支持将多个LoRA适配器附加到单个LoRA专用端点,共享硬件资源
LoRA
多适配器
硬件共享
https://docs.together.ai/docs/fine-tuning/lora-multi-adapter
☁️
Google Vertex AI
有更新
📄 https://cloud.google.com/vertex-ai/docs/release-notes · 2026-06-25T14:22:00+08:00
更新
Data Science Agent正式发布,同时Vertex AI Extensions宣布弃用(2026-11-26关闭)
Data Science Agent正式发布,同时Vertex AI Extensions宣布弃用(2026-11-26关闭)
更新
Gemma 4 26B A4B IT、Veo 3.1 Lite公测
Gemma 4 26B A4B IT、Veo 3.1 Lite公测
更新
Imagen和视频生成GA端点弃用(建议6月30日前迁移)、Gemini 2.5系列退役日期更新至2026-10-16
Imagen和视频生成GA端点弃用(建议6月30日前迁移)、Gemini 2.5系列退役日期更新至2026-10-16
⚙️
Novita AI
有更新
📄 https://docs.novita.ai/ · 2026-06-25T14:28:00+08:00
更新
GLM Text to Speech、GLM Audio to Text、GLM Voice Clone、GLM Image Generation、Hunyuan Image 3将于7月7日下线
GLM Text to Speech、GLM Audio to Text、GLM Voice Clone、GLM Image Generation、Hunyuan Image 3将于7月7日下线
更新
推荐替代: MiniMax Speech 2.8 Turbo、MiniMax Quick Voice Cloning、Seedream 5.0 lite
推荐替代: MiniMax Speech 2.8 Turbo、MiniMax Quick Voice Cloning、Seedream 5.0 lite
📦
AWS Bedrock
有更新
📄 https://aws.amazon.com/bedrock/ · 2026-06-25T14:30:00+08:00
更新
2026-06-01 GPT-5.5/GPT-5.4/Codex GA / 2026-05-28 Claude Opus 4.8上线
2026-06-01 GPT-5.5/GPT-5.4/Codex GA / 2026-05-28 Claude Opus 4.8上线
更新
AMI Watermarks、EMR Serverless实时配置更新、AWS MCP Server跨账户访问、Bedrock Service Quotas扩展
AMI Watermarks、EMR Serverless实时配置更新、AWS MCP Server跨账户访问、Bedrock Service Quotas扩展
🧠
AWS SageMaker AI
有更新
📄 https://aws.amazon.com/sagemaker/ · 2026-06-25T14:32:00+08:00
更新
SageMaker Notebook实例GPU扩展(P6-B200、P5en、P4de)
SageMaker Notebook实例GPU扩展(P6-B200、P5en、P4de)
更新
Unified Studio notebook scheduling、Multi-turn RL for agent customization、ECS Managed Instances支持Trainium/Inferentia、Studio快速设置(20秒内)
Unified Studio notebook scheduling、Multi-turn RL for agent customization、ECS Managed Instances支持Trainium/Inferentia、Studio快速设置(20秒内)
🔀
OpenRouter
有更新
📄 https://openrouter.ai/docs · 2026-06-25T14:35:00+08:00
更新
AI Governance Checklist、AI Data Residency指南发布
AI Governance Checklist、AI Data Residency指南发布
更新
OpenClaw、SillyTavern、Kilo Code、OpenAI Codex CLI、Claude Code集成指南发布
OpenClaw、SillyTavern、Kilo Code、OpenAI Codex CLI、Claude Code集成指南发布
更新
OpenRouter vs Portkey、OpenRouter vs LiteLLM对比指南
OpenRouter vs Portkey、OpenRouter vs LiteLLM对比指南