Inworld Inworld 为人工智能虚拟角色提供了一个完全集成的平台,它在大语言模型(LLM)的基础上开发,并拓展了可配置的安全性、知识、内存、叙事控制、多模态等特性。用户可以通过该平台塑造具有独特个性和背景意识的虚拟人物,并可以无缝集成到实时应用程序中,内置规模和性能优化功能。
H2O EvalGPT H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台来了解模型在大量任务和基准测试中的性能。无论你是想使用大模型自动化工作流程或任务,H2O EvalGPT 都可以提供流行、开源、高性能大模型的详细排行榜,帮助你为项目选择最有效的模型完成具体任务。
MMBench MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。