Agent TARS – 字节跳动开源的多模态 AI Agent 框架

Agent TARS – 字节跳动开源的多模态 AI Agent 框架

Agent TARS是一款开源的多模态AI代理,它能够通过视觉解析网页内容,还适合于深度研究、操作系统功能,能够处理复杂的工作流程,通过 Agent 框架执行复杂任务,可以进行全面的规划和执行, 收集...
14小时前
060
SpatialLM – 群核科技开源的空间理解多模态模型

SpatialLM – 群核科技开源的空间理解多模态模型

SpatialLM 是群核科技开源的空间理解多模态模型,该模型仅通过一段视频即可生成物理正确的3D场景布局,赋予机器人和智能系统类似人类的空间认知能力。SpatialLM突破了传统大语言模型对物理世界...
16小时前
0120