阿联酋Falcon 40B雄踞排行榜榜首:在开源AI模型的最新Hugging Face独立验证中全球排名第一

阿布扎比,阿拉伯联合酋长国--()--(美国商业资讯)--阿布扎比技术创新研究所(TII)上周推出的阿联酋首个大规模开源、400亿参数人工智能模型 Falcon 40B飙升至Hugging Face最新开放大型语言模型(LLM)排行榜榜首。Hugging Face是一家寻求通过开源和开放科技实现人工智能民主化的美国公司,被公认为全球权威的AI模型独立验证者。

在成功击败Meta的LLaMA(包括其65B模型)、Stability AI的StableLM和Together的 RedPajama等成熟模型后,Falcon 40B获得此梦寐以求的排名。该指数使用评估生成性语言模型的综合框架Eleuther AI Language Model Evaluation Harness的四个关键基准:AI2推理挑战(25-样本)、一组小学科学问题、对人类很容易、但对SOTA模型有难度的常识推理测试HellaSwag (10-样本)、衡量文本模型多任务准确性测试MMLU(5-样本),以及衡量语言模型在生成问题答案时是否真实的测试TruthfulQA (0-样本)。

Hugging Face的Open LLM排行榜是向AI社区开放的客观评估工具,可在发布LLM和聊天机器人时对其进行跟踪、排名和评估。

Falcon 40B采用1万亿个令牌进行训练,标志着阿联酋迈向AI领导地位的重大转折点,使该模型的权重能够广泛用于研究和商业应用。新排名证实了该模型的超凡能力,让AI更透明、更包容,并且更易于访问,为人类带来更大福祉。

凭借这一最新进展,TII成功确保阿联酋在生成性AI模型领域占有一席之地,并让该国成为致力于推动AI创新和协作的少数国家之一。

TII已经着手开发下一版本Falcon:180B AI模型。要了解有关当前开源Falcon 40B AI模型的更多信息,请访问:FalconLLM.TII.ae。有关Falcon 40B的初始公告,请参阅以下链接:阿联酋技术创新研究所推出用于研究和商业应用的开源“Falcon 40B”大型语言模型

有关更多信息,请访问www.tii.ae

*来源:AETOSWire

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

Contacts

Jennifer Dewan
沟通高级总监
jennifer.dewan@tii.ae

Contacts

Jennifer Dewan
沟通高级总监
jennifer.dewan@tii.ae