为了进一步优化资源配置,提供更先进和优质的技术服务,平台将于 2026-03-17 对下列模型进行下线处理:
用量统计页面中的数据通常会在您实际发起 API 调用后约 10 分钟更新。
功能优化停止提供基础版 LLM API 免费服务(网页端持续免费),请关注账户余额,及时充值。
服务调整上线 Minimax 系列大语言模型。可在体验中心试用,支持 API 调用。
新模型大语言模型统计指标全面升级:新增性能指标(如 TTFT、OTPS、RPM、TPM)与详细错误统计,支持从调用量、性能、错误三个维度深度分析服务状况。全局新增数据导出功能,支持下载 Excel 报表。
功能升级 查看来源新增弹性文件存储(EFS,Elastic File Storage)。地域:华北2(北京)、华东2(上海)
新功能修复了列表数据小于1万条时,自定义任务列表搜索"全部"任务显示系统异常的问题。
Bug修复⚠️ 页面内容未完全加载,无法获取有效更新信息。SPA页面抓取失败,需要手动访问确认。
查看来源⚠️ 页面内容未完全加载,无法获取有效更新信息。SPA页面抓取失败,需要手动访问确认。
查看来源⚠️ 阿里百炼按月发布产品月刊。4月初应读取3月月刊,但由于web_search工具缺少Brave API密钥,无法搜索月刊URL。
请手动搜索"阿里云 百炼 3月 产品月报 2026"查看最新月刊。
支持在Vertex AI RAG Engine中使用基于模式的元数据搜索。可以为语料库定义元数据模式,将元数据附加到该语料库中的文件,并在检索期间使用此元数据过滤上下文。
新功能Veo 3.1 Lite现已公开预览(Public Preview),这是最具成本效益的Veo on Vertex AI模型。
新模型Gemini 2.5 Pro、Gemini 2.5 Flash-Lite和Gemini 2.5 Flash的退役日期已更新至2026年10月16日。
退役通知多个图像生成端点被弃用,建议在2026年6月30日之前更新到新端点,包括imagegeneration@002~006、imagen-3.0/4.0系列等,推荐迁移到gemini-2.5-flash-image。
端点弃用Vector Search 2.0正式可用(GA),包括Collections统一数据和向量、自动嵌入、混合搜索和排序等功能。
正式发布Gemini 3.1 Flash-Lite(gemini-3.1-flash-lite-preview)现已公开预览,这是最具成本效益的Gemini模型,针对高流量、成本敏感的LLM流量的低延迟用例进行了优化。
新模型 查看来源Amazon Bedrock Guardrails现在支持通过跨账户防护在组织内的所有AWS账户中集中执行安全控制。中央安全团队和管理员现在可以自动为组织中Amazon Bedrock的所有基础模型交互实施这些控制,消除为每个账户手动配置防护栏的操作开销。
通过跨账户防护,可以在管理账户的新Amazon Bedrock策略中指定防护栏ID,该策略会自动在所有成员实体(包括组织单位(OU)和单个账户)的所有模型调用中执行配置的防护措施。
正式发布 查看来源Amazon SageMaker Unified Studio笔记本现在支持导入/导出功能,支持从JupyterLab和其他笔记本平台迁移。支持.ipynb、.json和.py格式,同时保留单元格类型和元数据。
新的开发者加速功能包括:单元格重新排序、键盘快捷键、单元格重命名和多行SQL支持。
新功能Amazon SageMaker Data Agent现在支持交互式图表、Snowflake数据源的SQL分析以及Amazon SageMaker Unified Studio笔记本中的物化视图管理。
Flash现已公开测试。Flash是一个Python SDK,让开发者用单个装饰器在RunPod Serverless GPU上运行函数。
关键特性:远程执行、自动扩展、依赖管理、两种模式(基于队列的端点和负载均衡端点)、Flash应用(使用flash init、flash run和flash deploy构建生产就绪的API)。
新功能Flash现在支持同时将端点部署到多个数据中心。传递数据中心列表以在多个区域分发工作负载,提高可用性和降低延迟。还可以为每个数据中心附加网络卷以实现特定区域的数据访问。
功能升级PPIO联合创始人兼CEO姚欣受聘为"光谷全球产业合伙人",成为助力光谷链接全球产业资源的重要伙伴之一。在"2026光谷AI产业发展峰会"上,主持了主题为《武汉如何抓住AI浪潮的机会》圆桌论坛。
公司动态明确了LLM API计费规则:
关于499状态码:当请求到达模型时,推理会立即开始。如果客户端在请求中途断开连接,已消耗的计算资源仍然可计费(无论是非流式还是流式模式)。
计费说明 查看来源以下模型现在自动重定向到升级版本:
这些是相同系列的升级,具有兼容的行为。如果需要原始版本,可以作为专用端点部署。
模型升级 查看来源