TaoAvatar – 阿里推出的实时高清3D全身对话数字人技术,秒建分身阿里近日宣布了一项重大技术创新——TaoAvatar,这是一项旨在重塑 AR 体验的技术。TaoAvatar 采用了创新的 3D 高斯溅射(3DGS)技术,确保了高质量的实时渲染。即使在高清立体显示设...资讯1周前02290
pdf-craft – 开源 PDF 转 Markdown 工具,精准提取内容pdf-craft 是一款开源的PDF格式转换工具,专注于处理扫描书籍类PDF文件。它能智能提取正文内容,自动过滤页眉、页脚、脚注等干扰元素,输出结构清晰的Markdown或EPUB格式文件。智能处理...资讯1周前0720
Browseragent – 浏览器AI自动化工具,零代码创建和运行工作流,提高工作效率Browseragent是基于浏览器的AI自动化工具,以其独特的技术路线脱颖而出。其最大特点是能够直接在浏览器中创建和运行AI工作流,无需API费用,有效地减少了完成任务所需的开销和时间。 Brows...资讯1周前0800
Gemini 2.5 Pro – 谷歌推出的最新 AI 思考模型,卓越性能榜居第一 谷歌宣布推出全新AI模型系列——Gemini 2.5。谷歌首席科学家Jeff Dean表示,Gemini 2.5是该公司最智能的模型,具有令人印象深刻的高级推理和编码能力,其卓越的性能够处理海量数据...资讯1周前04800
推荐15个AI数字人制作工具,快速生成口播和直播视频,随着人工智能和3D技术的发展,AI数字人通过模拟人类的外貌和行为,基于AI技术提供媲美真人的交互体验,AI虚拟数字人可以实现自然对话、执行任务,甚至在某些情况下展示合理的情感反应。本文介绍了覆盖多个领...资讯1周前0370
Upheal – AI心理健康咨询平台,自动生成临床会话笔记,专业人士的新助手Upheal,一款专为心理健康专家设计的AI驱动平台,支持与现有电子病历系统、面对面提供视频会话、智能进展记录等一站式服务。其目标是减轻专家的工作负担,提升服务效率与质量。UpHeal通过对心理健康师...资讯1周前0370
Qwen2.5-VL-32B – 阿里开源的最新多模态模型,支持解决复杂问题Qwen2.5-VL-32B是阿里巴巴新开源的多模态大模型,参数规模为32B。模型在Qwen2.5-VL系列的基础上,基于强化学习优化,具备更符合人类偏好的回答风格、显著提升的数学推理能力,更强的图像...资讯1周前0660
Fluently – AI英语学习助手,评估英语水平制定专属学习方案,提升英语水平随着人工智能技术的蓬勃发展,AI 英语口语练习软件应运而生,为广大英语爱好者们开辟了一条全新且便捷的学习路径。英语口语能力无疑成为人们打开多元世界大门的一把关键钥匙。Fluently是AI英语学习小助...资讯1周前0410
Revid AI – AI视频生成工具,从脚本到视频生成一站式服务,快速生成热门短剧Revid AI是由法国公司开发的视频生成工具,专为创作者提供AI驱动的短视频自动化制作服务。其核心功能涵盖文本/图片/音乐生成视频、虚拟形象创作等。操作极为简单,只需上传对话脚本或让根据主题自动生...资讯1周前0660
瀚海智语 – 海洋垂直领域大模型,基于360 智脑和 DeepSeek 研发“瀚海智语”已顺利通过专家评审,得到与会多位院士和行业专家的高度肯定,已于近日正式发布,该模型是海洋领域首个业务化垂域大模型,具备高度专业化的AI能力。相比通用大语言模型,它在海洋领域理论知识、专业术...资讯1周前0550