AI宝贝

帅气的我简直无法用语言描述!
InVideo AI

InVideo AI

InVideo AI是一款人工智能视频创作和剪辑工具,能够根据用户输入的文本自动生成视频内容。用户只需提供视频的主题或脚本,InVideo AI便可以利用其AI技术生成包含视频脚本、配音、图片、字幕和背景音乐的完整视频。
2670
GoEnhance

GoEnhance

GoEnhance AI是一款AI驱动的图像和视频编辑工具,专注于视频风格转换、图像增强和放大。利用先进的人工智能技术,GoEnhance AI能够提升视频和图片的质量,添加细节,减少模糊和像素化。
4670
CodeFuse

CodeFuse

CodeFuse 是一款为国内开发者提供智能研发服务的产品,该产品是基于蚂蚁集团自研的基础大模型进行微调的代码大模型。CodeFuse 具备代码补全、添加注释、解释代码、生成单测,以及代码优化功能,以帮助开发者更快、更轻松地编写代码。
1000
妙办AI

妙办AI

妙办是一个小白秒会的专业级办公工具,无需掌握复杂操作,便可以让你零基础轻松绘制海量绘图类型。最新推出的妙办AI流程图,可以只需输入主题,便智能自动生成各种类型的流程图,如旅游攻略流程图、组织架构流程图、教资报名流程图、教学思路流程图等。
1460
印象AI

印象AI

印象AI的功能不仅限于开放式写作助理,而是将深入到知识管理的各个环节,辅助实现完善信息记录、高效信息整理、智能多模态信息关联与创作内容的润色和升华,成为由GPT驱动的多模态、全能知识管理助理。用户可在「印象笔记」桌面端、「Verse」、「印象图记」、「印象时间」、「收藏家」和「扫描宝」等应用中体验印象AI的功能。
2340
PubMedQA

PubMedQA

PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
610
HELM

HELM

HELM是由斯坦福大学推出的大模型评测体系,该评测方法主要包括场景、适配、指标三个模块,每次评测的运行都需要指定一个场景,一个适配模型的提示,以及一个或多个指标。
1160
H2O EvalGPT

H2O EvalGPT

H2O EvalGPT 是 H2O.ai 用于评估和比较 LLM 大模型的开放工具,它提供了一个平台来了解模型在大量任务和基准测试中的性能。无论你是想使用大模型自动化工作流程或任务,H2O EvalGPT 都可以提供流行、开源、高性能大模型的详细排行榜,帮助你为项目选择最有效的模型完成具体任务。
640
MMBench

MMBench

MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。
2240
OpenCompass

OpenCompass

OpenCompass是由上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。
1480
FlagEval

FlagEval

FlagEval(天秤)由智源研究院将联合多个高校团队打造,是一种采用“能力—任务—指标”三维评测框架的大模型评测平台,旨在提供全面、细致的评测结果。
1680
Chatbot Arena

Chatbot Arena

Chatbot Arena是一个大型语言模型 (LLM) 的基准平台,以众包方式进行匿名随机对战,该项目方LMSYS Org是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织。
760