IT采购网9月12日消息,微软研究院昨日宣布推出了一款全新的预训练语言模型,名为phi-1.5,该模型包含13亿个参数,旨在适用于各种自然语言处理任务,如问答(QA)、聊天和代码生成等多个场景。
据悉,phi-1.5的训练数据来源多样,包括来自StackOverflow平台的Python相关问答内容、竞赛代码,以及合成的Python教科书等多种数据集。这一多样性的数据集有望让模型更好地理解和处理不同领域的文本信息。
微软表示,在一系列的基准测试中,phi-1.5表现卓越,尤其在常识、语言理解和逻辑推理方面表现突出。与拥有70亿参数的meta公司的llama-2模型相比,phi-1.5在AGIeval得分上超越了后者。此外,在带有LM-evalHarness的GPT4AL测试套件中,phi-1.5也展现出与70亿参数的llama-2相媲美的性能。
这一新的预训练语言模型的发布,有望为自然语言处理领域带来更强大的工具,为各种应用场景提供更高效的解决方案,进一步推动了自然语言处理技术的发展和应用前景。