人工智能 | 第3页

排序

发布更新浏览点赞

UniFluid – 谷歌联合麻省理工新推出的多模态视觉生成与理解统一自回归框架

随着AI技术的进一步发展和完善，我们可以看到更多令人惊叹的应用，如更精确的图像编辑工具、更智能的视觉内容创作辅助工具等等。也可以激发更多人探索自回归模型在视觉任务中的潜力，推动 AI 在理解和生成视觉...

资讯 # 人工智能

3周前

01140

Maestro –开源的端到端自动化测试框架

Maestro 是专为移动和 Web 应用设计的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制，解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法，无需编译快速迭代。Maes...

资讯 # 人工智能

3周前

01080

MedRAG – 精准智能补问，高效解析，南洋理工团队推出的医学诊断模型

MedRAG模型作为智能健康助手领域的一项重要突破，其核心在于将知识图谱推理技术与大型语言模型（LLM）巧妙结合。这一创新不仅提升了模型在诊断准确性上的表现，还为个性化医疗建议提供了更强大的技术支持...

资讯 # 人工智能

4周前

01080

Manus没有秘密，如何用AI总结播客音频内容，比听快10倍！

有了 AI 之后，碎片化时间有机会变成高效的学习时间。可以通过 AI 将播客做成可视化的学习资料，再从中提炼有用的信息。今天我找到了免费又高效的听播客神器，明浩老师深度解读AI Agent、Manu...

资讯 # 人工智能

3周前

01070

SVG Converter – 免费的图像转换矢量格式工具，一键秒变高清矢量图

SVG Converter是在线矢量化工具，支持将多种位图图像（如JPG、PNG、BMP等）快速转换为矢量图形（如SVG、AI、EPS、PDF等）。SVG Converter支持多种文件格式，具备高质...

资讯 # 人工智能

3周前

01070

SellerPic – AI商拍工具，一键生成不同体型和肤色模特图片，适用于多个电商.媒体’平台

在电商时尚领域，AI 模特面部重塑的应用逐渐广泛。AI 模特能够快速生成各种不同风格、肤色、年龄的模特展示图片，满足多样化的市场需求。 SellerPic是专为电商卖家设计的AI图像工具，帮助卖家轻松...

资讯 # 人工智能

4周前

01040

MT-TransformerEngine – 摩尔线程开源的高效训练与推理优化框架

MT-TransformerEngine 主要用于 Transformer 模型的训练与推理优化，通过算子融合、并行加速策略等技术，释放摩尔线程全功能 GPU 高密度计算的潜力和 memory bou...

资讯 # 人工智能

4周前

01040

UniAct – 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架

在人工智能领域，UniAct 是一个新型的具身基础模型框架，旨在解决不同机器人之间的行为异构性问题。UniAct以视觉语言模型为核心，构建了首个tokenized通用动作空间，解决了具身智能中的通用动...

资讯 # 人工智能

3周前

01030

文心大模型4.5 – 百度推出的首个原生多模态大模型

3月16日，百度正式发布文心大模型4.5及文心大模型X1，在文心一言官网即可免费使用。据介绍，文心大模型4.5是百度首个原生多模态大模型，其多模态理解、文本和逻辑推理能力显著提升。文心大模型4.5是...

资讯 # 人工智能

4周前

0980

AudioX – 港科大联合月之暗面推出的扩散变换器多模态模型，任意生成高质量音频音乐。

港科大AudioX ，堪称声音界的”万能打印机”！这个由顶尖实验室打造的AI音效引擎，只需任意输入文字/图片/视频，就能任意内容生成音频和音乐！ AudioX是什么 AudioX 是香港科技大学和月之...

资讯 # 人工智能

4周前

0970

加载更多