MMBench MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。
Ollama Ollama是一个用于在本地计算机上运行大型语言模型的命令行工具,允许用户下载并本地运行像Llama 2、Code Llama和其他模型,并支持自定义和创建自己的模型。该免费开源的项目,目前支持macOS和Linux操作系统,未来还将支持Windows系统。
Phind Phind是一个专为开发者设计的AI搜索引擎,利用大型语言模型(LLM)提供相关的搜索结果和动态答案。Phind特别擅长处理编程和技术问题,能够快速理解用户的查询意图,并给出精确、专业的答复。
提示工程指南 提示工程指南(Prompt Engineering Guide)是由 DAIR.AI 发起的项目,旨在帮助研发和行业内相关人员了解提示工程。以传播 AI 技术和研究成果为目标,DAIR.AI 的愿景是赋能新一代 AI 领域的创新者。该项目在GitHub上已超过3万个人标星,包含了与 LLM 提示工程相关的所有最新论文、学习指南、讲座、参考资料和工具。