UniFluid – 谷歌联合麻省理工新推出的多模态视觉生成与理解统一自回归框架随着AI技术的进一步发展和完善,我们可以看到更多令人惊叹的应用,如更精确的图像编辑工具、更智能的视觉内容创作辅助工具等等。也可以激发更多人探索自回归模型在视觉任务中的潜力,推动 AI 在理解和生成视觉...资讯# 人工智能3周前01140
Maestro –开源的端到端自动化测试框架Maestro 是专为移动和 Web 应用设计的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制,解决传统测试中常见的不稳定性和等待问题。Maestro基于声明式语法,无需编译快速迭代。Maes...资讯# 人工智能3周前01080
MedRAG – 精准智能补问,高效解析,南洋理工团队推出的医学诊断模型MedRAG模型作为智能健康助手领域的一项重要突破,其核心在于将知识图谱推理技术与大型语言模型(LLM)巧妙结合。这一创新不仅提升了模型在诊断准确性上的表现,还为个性化医疗建议提供了更强大的技术支持...资讯# 人工智能4周前01080
Manus没有秘密,如何用AI总结播客音频内容,比听快10倍!有了 AI 之后,碎片化时间有机会变成高效的学习时间。可以通过 AI 将播客做成可视化的学习资料,再从中提炼有用的信息。 今天我找到了免费又高效的听播客神器,明浩老师深度解读AI Agent、Manu...资讯# 人工智能3周前01070
SVG Converter – 免费的图像转换矢量格式工具,一键秒变高清矢量图SVG Converter是在线矢量化工具,支持将多种位图图像(如JPG、PNG、BMP等)快速转换为矢量图形(如SVG、AI、EPS、PDF等)。SVG Converter支持多种文件格式,具备高质...资讯# 人工智能3周前01070
SellerPic – AI商拍工具,一键生成不同体型和肤色模特图片,适用于多个电商.媒体’平台在电商时尚领域,AI 模特面部重塑的应用逐渐广泛。AI 模特能够快速生成各种不同风格、肤色、年龄的模特展示图片,满足多样化的市场需求。 SellerPic是专为电商卖家设计的AI图像工具,帮助卖家轻松...资讯# 人工智能4周前01040
MT-TransformerEngine – 摩尔线程开源的高效训练与推理优化框架MT-TransformerEngine 主要用于 Transformer 模型的训练与推理优化,通过算子融合、并行加速策略等技术,释放摩尔线程全功能 GPU 高密度计算的潜力和 memory bou...资讯# 人工智能4周前01040
UniAct – 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架在人工智能领域,UniAct 是一个新型的具身基础模型框架,旨在解决不同机器人之间的行为异构性问题。UniAct以视觉语言模型为核心,构建了首个tokenized通用动作空间,解决了具身智能中的通用动...资讯# 人工智能3周前01030
文心大模型4.5 – 百度推出的首个原生多模态大模型3月16日,百度正式发布文心大模型4.5及文心大模型X1,在文心一言官网即可免费使用。据介绍,文心大模型4.5是百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升。 文心大模型4.5是...资讯# 人工智能4周前0980
AudioX – 港科大联合月之暗面推出的扩散变换器多模态模型,任意生成高质量音频音乐。港科大AudioX ,堪称声音界的”万能打印机”!这个由顶尖实验室打造的AI音效引擎,只需任意输入文字/图片/视频,就能任意内容生成音频和音乐! AudioX是什么 AudioX 是香港科技大学和月之...资讯# 人工智能4周前0970