一、重磅工具:Gemini变身通用智能体,从“聪明”升级到“能干”
新闻:本周谷歌发布的两项新功能共同让Gemini CLI成为功能强大的通用AI智能体。
谷歌发布了Gemini 2.5计算机使用模型(Gemini 2.5 Computer Use)。这是一款专用的Gemini 2.5模型,能够操作用户交互界面来完成任务。新模型支持开发者在在浏览器与移动应用中构建具备点击、滚动、文本输入及表单填写能力的AI智能体,通过名为computer_use的工具控制计算机。新模型在网页和移动设备控制基准测试中表现优于竞争对手,WebVoyager测试成绩为79.9%,且延迟较低。Gemini 2.5计算机使用模型现可通过Gemini API调用。
谷歌开源AI编程智能体