C-Eval C-Eval是一个适用于大语言模型的多层次多学科中文评估套件,由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5月份联合推出,包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,用以评测大模型中文理解能力。
Plandex Plandex是一个基于终端的开源 AI 编程引擎,可帮助程序员完成复杂的软件开发任务、解决不良输出并最大限度地提高生产力。该AI编程助手通过使用长期运行的智能体来完成跨越多个文件并需要多个步骤的任务,将大型任务分解为较小的子任务。