CodeRabbit CodeRabbit是一个AI驱动的代码审查平台,通过自动化审查流程来提升代码质量,并显著减少手动审查所需的时间和精力。该平台利用人工智能技术,提供逐行的代码反馈,建议改进和修正,以增强代码的效率和健壮性。
Phind Phind是一个专为开发者设计的AI搜索引擎,利用大型语言模型(LLM)提供相关的搜索结果和动态答案。Phind特别擅长处理编程和技术问题,能够快速理解用户的查询意图,并给出精确、专业的答复。
MMBench MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。
Open LLM Leaderboard Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单,基于 Eleuther AI Language Model Evaluation Harness(Eleuther AI语言模型评估框架)封装。