up博主

帅气的我简直无法用语言描述!
Soundwave – 港中文深圳开源的语音理解大模型,高效处理语音任务

Soundwave – 港中文深圳开源的语音理解大模型,高效处理语音任务

语音和文本之间的对齐一直是多模态研究的难题,而多模态模型的崛起更是让“听懂”语音成为AI研究的新热点。香港中文大学(深圳)的研究团队推出了一款名为 Soundwave 的创新模型,以更高效的训练策略和...
4天前
0580
Bobby – RockFlow 推出的金融投资 AI Agent,全球首个“投资伙伴”

Bobby – RockFlow 推出的金融投资 AI Agent,全球首个“投资伙伴”

近日,金融科技领域迎来了新的革命性变化。新加坡人工智能金融科技公司RockFlow(奇运证券)成功完成了千万元A1轮融资,融资金额达到1000万美元,此轮融资由知名互联网公司创始人领投,老股东也继续加...
4天前
0360
食神 – 老板电器新推出的首个烹饪大模型

食神 – 老板电器新推出的首个烹饪大模型

让人工智能走进千家万户,以“做最有烟火气的AI”为主题的老板电器,AI 生活”为主题盛大启幕,AI大模型、智能化注定成为各大参展企业竞相展示的焦点。在AWE2025现场展示了AI烹饪大模型“食神”,该...
4天前
0400
家作 – 淘宝推出的家装家居AI设计工具,效果媲美实拍

家作 – 淘宝推出的家装家居AI设计工具,效果媲美实拍

推出的电商行业首款 AI 设计工具“家作”全新升级。商家上传商品图,即可一键生成多种风格的场景图,并且可以选择模特做展示,自定义出图,效果如同专业级棚拍实感。据悉,家作是专注服务家装、家居、家电行业商...
4天前
0350
Multi-Agent Orchestrator – 亚马逊开源的多智能体框架,高效处理复杂任务

Multi-Agent Orchestrator – 亚马逊开源的多智能体框架,高效处理复杂任务

全球云计算领军企业亚马逊云(AWS)近日宣布开源其5级通用AI Agent框架——Multi-Agent Orchestrator。该框架利用多层级AI Agent协同高效处理复杂任务,智能分配用户请...
4天前
01250
Agent TARS – 字节跳动开源的多模态 AI Agent 框架

Agent TARS – 字节跳动开源的多模态 AI Agent 框架

Agent TARS是一款开源的多模态AI代理,它能够通过视觉解析网页内容,还适合于深度研究、操作系统功能,能够处理复杂的工作流程,通过 Agent 框架执行复杂任务,可以进行全面的规划和执行, 收集...
5天前
0610
算了么 – AI算力共享平台,自动检测闲时算力智能调度

算了么 – AI算力共享平台,自动检测闲时算力智能调度

随着人工智能算力应用的蓬勃发展,算力应用出现了在短时间内高密度的算力消耗需求,算力资源的短缺成为行业普遍面临的挑战。作为支撑人工智能算法运行和数据处理的基础设施,算力正成为人工智能技术应用落地的刚需...
5天前
0610
izdaxAi – 多功能AI应用,支持智能问答、写作辅助、绘画创作等功能

izdaxAi – 多功能AI应用,支持智能问答、写作辅助、绘画创作等功能

在人工智能与教育深度融合的新时代,新疆碧利雅电子科技公司推出了多功能人工智能应用izdaxAi 。集成了智能问答、写作辅助、学习工具、绘画创作、语音助手和多语言输入法等功能。用户可以通过语音或文字与 ...
5天前
0440
SpatialLM – 群核科技开源的空间理解多模态模型

SpatialLM – 群核科技开源的空间理解多模态模型

SpatialLM 是群核科技开源的空间理解多模态模型,该模型仅通过一段视频即可生成物理正确的3D场景布局,赋予机器人和智能系统类似人类的空间认知能力。SpatialLM突破了传统大语言模型对物理世界...
5天前
0480
GPT-4o mini TTS – OpenAI 推出的文本转语音模型,体验不同语境情感

GPT-4o mini TTS – OpenAI 推出的文本转语音模型,体验不同语境情感

OpenAI新推出的文本转语音模型“gpt-4o‑mini‑tts”不仅能产生细腻、自然的语音,且比上一代更容易“指导”,也就是说开发者可用自然语言指令指定说话风格。支持将文本内容转换为自然流畅语音的...
5天前
0420