八月,百度智能云更新了最新的云计算产品动态,百舸、计算、云原生等多项产品功能优化升级,实现资源使用率和降本空间双提升。为方便大家了解,本文就一起来看下吧。
百度智能云官网:点击进入
一、百度智能云产品功能迭代
1、计算
云服务器:支持实例和预留实例券联合购买
用户在购买按量付费的BCC实例时,可以同步购买预留实例券,避免因预留实例券生效而实例尚未创建所产生的资源空置费用。
百度智能云云服务器优惠方案推荐
《点击进入官网选购》
2、存储
并行文件存储PFS:支持创建生命周期规则
支持用户基于文件最后一次访问时间创建生命周期规则,将PFS实例中指定目录下的过期文件和空目录删除,适用于AI训练、自动驾驶等场景中长期未访问的中间训练数据、临时文件、超期历史数据集或过期日志等的自动清理需求,帮助用户精准管理存储空间,提升资源利用率。
百度智能云存储优惠方案推荐
《点击进入官网选购》
3、云原生
Prometheus监控:采集任务支持调整采集间隔
用户可根据业务敏感度自定义采集频率,从而降低Prometheus的存储成本与上报数据量,避免高频采集带来的性能开销,帮助用户在监控精度与成本/性能之间达到最佳平衡。
容器镜像服务CCR
- 支持配置制品清理周期:CCR企业版支持用户配置制品清理周期,实现定时清理BOS存储空间,降低用户存储费用和运维负担。
- 支持跨账号实例同步:CCR企业版支持跨账号实例同步功能,能够将容器镜像和Helm Chart复制到其他账号实例中,助力企业用户实现多团队协作更新容器服务。
1、百舸异构计算平台AIHC
- 新增多个热门模型快速部署:新增面向具身智能、自动驾驶场景的8个快速开始应用,包括SparseDrive/Uniad自动驾驶模型、Maniskil/LeRobot机器人操作工具等,可帮助用户快速搭建和测试自动驾驶、机器人等智能场景应用,让研发过程省时省力;新增ERNIE-4.5系列与ERNIE-4.5-VL系列模型快速部署,支持从轻量级0.3B到高性能21B-A3B、以及多模态28B-A3B多种版本,可应用于文本生成、图像理解、跨模态分析等场景,灵活满足不同业务需求。
- 支持挂载BOS类型数据集:分布式训练任务支持挂载BOS类型数据集,免去本地下载与传输步骤,提升用户数据使用效率。
- 在线服务部署优化:当用户部署在线服务时,可使用CCR免密登录,简化操作流程。同时,在线服务模块还支持用户查看文心系列模型的推理性能与流量监控,方便及时监测了解服务运行状态。另外,在线服务日志持久化默认提供前60天免费存储,方便用户进行数据追溯与分析,并减少部分日志存储成本。
- 开发机模块优化:开发机模块多项服务体验优化上线,主要内容包括:支持用户进行CDS扩容,满足更高的存储需求,灵活应对开发任务;预置镜像新增CUDA最新版本,可提供更佳的GPU加速环境;webIDE支持tensorboard profler能力,方便用户进行可视化分析与性能调优。
- 资源池服务能力及权限管理优化:全托管资源池支持队列节点转让,自运维资源池队列开启GPU虚拟化后支持创建子队列,提升用户使用体验。关于权限管理,不同角色对于资源池详情二级页面是否可见的权限升级细化。自运维资源池,队列管理员&队列开发成员对于节点管理、全局配置、资源池拓扑、监控、事件不可见,队列管理只能看到自己所在的队列。全托管资源池,队列管理员&队列开发成员对于节点管理、全局配置、监控、变更记录不可见。
2、GPT OSS双模型上线,百度百舸全面支持快速部署
GPT OSS是OpenAl推出的重量级开放模型,专为强推理能力、智能体任务及多样化开发场景设计,标志着大模型在开放性与实用性上的重要突破。
该系列包含两款高性能模型:参数规模为117B的GPT-OSS-120B和21B的GPT-OSS-20B。二者皆采用MoE架构,并在MoE权重上创新性地使用4-bit量化方案MXFP4,显著降低资源占用,同时实现更高效的推理速度。
目前,百度百舸平台已经同步支持这2款模型的快速部署,为企业提供一站式AI服务,实现大模型落地“快稳省”的要求。
(本文由美国主机侦探原创,转载请注明出处“美国主机侦探”和原文地址!)

微信扫码加好友进群
主机优惠码及时掌握

QQ群号:938255063
主机优惠发布与交流