
HuggingChat
HuggingChat是最大的开源AI社区「HuggingFace」推出的类ChatGPT在线聊天机器人,基于开源的「Open Assistant」的300亿参数模型,该聊天机器人无需注册可直接免费使用。
文章目录[隐藏]
MMBench是一个多模态基准测试,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学和浙江大学的研究人员推出。该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。






