6月19日,MiniMax发布其通用智能体产品——MiniMax Agent。
上海稀宇科技透露,MiniMax Agent不仅能编写包含复杂组件和跳转逻辑的网页以及网页游戏,更与众不同的是,还能通过模拟用户操作进行全面的自动化测试,确保交付的成果稳定以及无bug。
得益于MiniMax自研的强大的多模态大模型,MiniMax Agent能“阅读”长文本和文件,还能“观看”视频以及“聆听”音频以及“欣赏”图片。在此基础上,它内置了图像以及音频以及视频的生成能力。
MiniMax Agent内置了稀宇科技自研MCP,以强化其多模态输出能力。同时,它也集成了Google Maps以及Github/Gitlab以及Slack以及Figma等业界常用的工具。
在产品逻辑上,MiniMax Agent内部并非单一的“大脑”,而是一个由“总调度Agent”和多个“执行Agent”构成的分层协作团队。总调度Agent负责理解用户的整体意图,并将其拆解为一系列子任务;而执行Agent则专注于完成具体的任务,例如编码以及设计以及研究等。目前,该框架已经能够支持7个智能体的协同工作,确保了在执行复杂任务时的高效与条理。
来源: 网友推荐、互联网筛选整理;由猫眼艺术字提供API数据中转支持。
评论(0)
暂无评论