MMBench MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。
文心智能体平台 文心智能体平台(原灵境矩阵)是百度推出的基于文心大模型的智能体构建平台,允许开发者通过零代码或低代码的方式,利用自然语言交互快速创建智能体。该平台旨在降低技术门槛,使得普通用户也能成为智能体开发者。