老北鼻AI工具箱
  • 首页
  • 提交AI工具
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      2025前收录

      共 849 篇网址
      2025前收录
      2025前收录AI内容检测AI写作工具AI办公工具AI图像工具AI学习网站AI开发平台AI提示指令AI搜索引擎AI智能体AI智能助手AI模型评测AI法律助手AI编程工具AI视频工具AI训练模型AI设计工具AI语言翻译AI音频工具AI工具严选AI推荐
      排序
      发布浏览
      妙办AI

      妙办AI

      妙办是一个小白秒会的专业级办公工具,无需掌握复杂操作,便可以让你零基础轻松绘制海量绘图类型。最新推出的妙办AI流程图,可以只需输入主题,便智能自动生成各种类型的流程图,如旅游攻略流程图、组织架构流程图、教资报名流程图、教学思路流程图等。
      1400
      2025前收录
      印象AI

      印象AI

      印象AI的功能不仅限于开放式写作助理,而是将深入到知识管理的各个环节,辅助实现完善信息记录、高效信息整理、智能多模态信息关联与创作内容的润色和升华,成为由GPT驱动的多模态、全能知识管理助理。用户可在「印象笔记」桌面端、「Verse」、「印象图记」、「印象时间」、「收藏家」和「扫描宝」等应用中体验印象AI的功能。
      2140
      2025前收录
      PubMedQA

      PubMedQA

      PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
      570
      2025前收录
      HELM

      HELM

      HELM是由斯坦福大学推出的大模型评测体系,该评测方法主要包括场景、适配、指标三个模块,每次评测的运行都需要指定一个场景,一个适配模型的提示,以及一个或多个指标。
      1010
      2025前收录
      H2O EvalGPT

      H2O EvalGPT

      H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台来了解模型在大量任务和基准测试中的性能。无论你是想使用大模型自动化工作流程或任务,H2O EvalGPT 都可以提供流行、开源、高性能大模型的详细排行榜,帮助你为项目选择最有效的模型完成具体任务。
      620
      2025前收录
      MMBench

      MMBench

      MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。
      2010
      2025前收录
      OpenCompass

      OpenCompass

      OpenCompass是由上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。
      1380
      2025前收录
      FlagEval

      FlagEval

      FlagEval(天秤)由智源研究院将联合多个高校团队打造,是一种采用“能力—任务—指标”三维评测框架的大模型评测平台,旨在提供全面、细致的评测结果。
      1540
      2025前收录
      Chatbot Arena

      Chatbot Arena

      Chatbot Arena是一个大型语言模型 (LLM) 的基准平台,以众包方式进行匿名随机对战,该项目方LMSYS Org是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织。
      710
      2025前收录
      SuperCLUE

      SuperCLUE

      SuperCLUE 是一个中文通用大模型综合性评测基准,从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力。
      720
      2025前收录
      CMMLU

      CMMLU

      CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力,涵盖了从基础学科到高级专业水平的67个主题。
      2350
      2025前收录
      Open LLM Leaderboard

      Open LLM Leaderboard

      Open LLM Leaderboard 是最大的大模型和数据集社区 HuggingFace 推出的开源大模型排行榜单,基于 Eleuther AI Language Model Evaluation Harness(Eleuther AI语言模型评估框架)封装。
      1740
      2025前收录
      MMLU

      MMLU

      MMLU 全称 Massive Multitask Language Understanding,是一种针对大模型的语言理解能力的测评,是目前最著名的大模型语义理解测评之一,由UC Berkeley大学的研究人员在2020年9月推出。
      8050
      2025前收录
      C-Eval

      C-Eval

      C-Eval是一个适用于大语言模型的多层次多学科中文评估套件,由上海交通大学、清华大学和爱丁堡大学研究人员在2023年5月份联合推出,包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,用以评测大模型中文理解能力。
      750
      2025前收录
      元典智库

      元典智库

      元典智库是由华宇软件公司旗下推出的一个专为法律专业人士设计的综合性法律知识服务平台和法律知识搜索引擎,基于法律知识图谱和先进的人工智能技术,提供全面、精准的法律信息检索服务。
      3710
      2025前收录
      合同嗖嗖

      合同嗖嗖

      合同嗖嗖是一款基于人工智能技术的在线合同生成工具,由珠海必优科技有限公司开发。用户只需输入相关关键词,AI系统即可快速生成符合法律法规的合同文本,极大简化了合同的编写和审查过程。
      1370
      2025前收录
      ChatLaw

      ChatLaw

      ChatLaw是由北京大学团队开发的开源法律大语言模型(LLM),它通过结合法律领域特定的数据集和外部知识库,旨在提高法律问题处理的准确性和效率。
      1270
      2025前收录
      得理法搜

      得理法搜

      得理法搜是一款由深圳得理科技有限公司联合中科院研发的法律智能检索系统,集成了1.3亿篇裁判文书、300万条法律法规等海量法律数据,运用自然语言处理技术,提供精准的语义检索、关键词检索和长文本检索。
      1120
      2025前收录
      海瑞智法

      海瑞智法

      海瑞智法是宏海智法(上海)科技软件有限责任公司开发的法律AI助手,专注于为律师和法律工作者提供专业服务。通过大模型技术,实现专业法律检索、精准案情分析以及法律文书的撰写和翻译。
      1300
      2025前收录
      通义法睿

      通义法睿

      通义法睿是阿里推出的免费AI法律顾问助手,利用通义千问的大模型推理技术,提供法律智能对话、文书生成、知识检索和文本阅读等服务。
      3280
      2025前收录
      加载更多
      老北鼻AI工具箱
      老北鼻AI工具箱(LBBAI.com)是一个追踪AI工具的智能导航平台,精选国内外高质量AI应用,帮助开发者、内容创作者与企业用户高效发现合适工具。我们2025年5月正式推出首个智能排名系统 LBBAI 1.0,通过多维度推荐算法,让真正有价值的AI工具优先被发现,解决“工具太多选不过来”的难题,让每一次探索 AI 的旅程从正确的工具开始。

      友链申请 免责声明 关于我们 AI文章 网站地图 标签大全 LBBAI白皮书

      Copyright © 2025 老北鼻AI工具箱 备案号:黔ICP备2023001918号-6  贵公网安备 52010202003518号 
      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍