PubMedQA PubMedQA是一个专为生物医学领域设计的问答数据集,包含1,000个专家标注、61,200个未标注和211,300个人工生成的问答实例,旨在提升AI模型在医学研究问答任务中的表现。
Open LLM Leaderboard Open LLM Leaderboard是由Hugging Face推出的开源大语言模型(LLM)评估平台,提供模型排名、性能评估和社区协作功能,助力开发者和研究者了解和比较不同LLM的表现。