2025前收录

共 849 篇网址

2025前收录

妙办AI

妙办是一个小白秒会的专业级办公工具，无需掌握复杂操作，便可以让你零基础轻松绘制海量绘图类型。最新推出的妙办AI流程图，可以只需输入主题，便智能自动生成各种类型的流程图，如旅游攻略流程图、组织架构流程图、教资报名流程图、教学思路流程图等。

1870

印象AI

印象AI的功能不仅限于开放式写作助理，而是将深入到知识管理的各个环节，辅助实现完善信息记录、高效信息整理、智能多模态信息关联与创作内容的润色和升华，成为由GPT驱动的多模态、全能知识管理助理。用户可在「印象笔记」桌面端、「Verse」、「印象图记」、「印象时间」、「收藏家」和「扫描宝」等应用中体验印象AI的功能。

3370

PubMedQA

PubMedQA是一个生物医学研究问答数据集，包含了1K专家标注，61.2K 个未标注和 211.3K 个人工生成的QA实例，该排行榜目前已收录18个模型的医学测试得分。

1070

HELM

HELM是由斯坦福大学推出的大模型评测体系，该评测方法主要包括场景、适配、指标三个模块，每次评测的运行都需要指定一个场景，一个适配模型的提示，以及一个或多个指标。

1740

H2O EvalGPT

H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具，它提供了一个平台来了解模型在大量任务和基准测试中的性能。无论你是想使用大模型自动化工作流程或任务，H2O EvalGPT 都可以提供流行、开源、高性能大模型的详细排行榜，帮助你为项目选择最有效的模型完成具体任务。

990

MMBench

MMBench是一个多模态基准测试，该体系开发了一个综合评估流程，从感知到认知能力逐级细分评估，覆盖20项细粒度能力，从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测，循环打乱选项验证输出结果的一致性，基于ChatGPT精准匹配模型回复至选项。

3340

OpenCompass

OpenCompass是由上海人工智能实验室（上海AI实验室）于2023年8月正式推出的大模型开放评测体系，通过完整开源可复现的评测框架，支持大语言模型、多模态模型各类模型的一站式评测，并定期公布评测结果榜单。

1890

FlagEval

FlagEval（天秤）由智源研究院将联合多个高校团队打造，是一种采用“能力—任务—指标”三维评测框架的大模型评测平台，旨在提供全面、细致的评测结果。

2070

Chatbot Arena

Chatbot Arena是一个大型语言模型 (LLM) 的基准平台，以众包方式进行匿名随机对战，该项目方LMSYS Org是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织。

1200

SuperCLUE

SuperCLUE 是一个中文通用大模型综合性评测基准，从三个不同的维度评价模型的能力：基础能力、专业能力和中文特性能力。

1060

CMMLU

CMMLU是一个综合性的中文评估基准，专门用于评估语言模型在中文语境下的知识和推理能力，涵盖了从基础学科到高级专业水平的67个主题。

3050

Open LLM Leaderboard

Open LLM Leaderboard

Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单，基于 Eleuther AI Language Model Evaluation Harness（Eleuther AI语言模型评估框架）封装。

2610

MMLU

MMLU 全称 Massive Multitask Language Understanding，是一种针对大模型的语言理解能力的测评，是目前最著名的大模型语义理解测评之一，由UC Berkeley大学的研究人员在2020年9月推出。

8890

C-Eval

C-Eval是一个适用于大语言模型的多层次多学科中文评估套件，由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5月份联合推出，包含了13948个多项选择题，涵盖了52个不同的学科和四个难度级别，用以评测大模型中文理解能力。

1120

元典智库

元典智库是由华宇软件公司旗下推出的一个专为法律专业人士设计的综合性法律知识服务平台和法律知识搜索引擎，基于法律知识图谱和先进的人工智能技术，提供全面、精准的法律信息检索服务。

4560

合同嗖嗖

合同嗖嗖是一款基于人工智能技术的在线合同生成工具，由珠海必优科技有限公司开发。用户只需输入相关关键词，AI系统即可快速生成符合法律法规的合同文本，极大简化了合同的编写和审查过程。

2170

ChatLaw

ChatLaw是由北京大学团队开发的开源法律大语言模型（LLM），它通过结合法律领域特定的数据集和外部知识库，旨在提高法律问题处理的准确性和效率。

2500

得理法搜

得理法搜是一款由深圳得理科技有限公司联合中科院研发的法律智能检索系统，集成了1.3亿篇裁判文书、300万条法律法规等海量法律数据，运用自然语言处理技术，提供精准的语义检索、关键词检索和长文本检索。

2240

海瑞智法

海瑞智法是宏海智法（上海）科技软件有限责任公司开发的法律AI助手，专注于为律师和法律工作者提供专业服务。通过大模型技术，实现专业法律检索、精准案情分析以及法律文书的撰写和翻译。

2220

通义法睿

通义法睿是阿里推出的免费AI法律顾问助手，利用通义千问的大模型推理技术，提供法律智能对话、文书生成、知识检索和文本阅读等服务。

4080