IT采购网10月30日消息,百川智能今日宣布推出了全新的Baichuan2-192K大模型,开创了全球最长的上下文窗口记录。这一创新模型具有令人瞩目的上下文处理能力,其上下文窗口长度达到了惊人的192K,能够处理高达35万个汉字的文本,为用户提供了前所未有的语义信息丰富性。
据IT采购网了解,百川智能表示,Baichuan2-192K在支持长上下文窗口方面表现卓越,比目前最优秀的大模型Claude2(100K上下文窗口,实测约8万字)提高了4.4倍,并且比GPT-4(支持32K上下文窗口,实测约2.5万字)提高了14倍,这将使用户在自然语言处理领域获益匪浅。
上下文窗口长度是大型模型的核心技术之一,通过扩大上下文窗口,模型可以更好地理解文本背后的语境,提高上下文相关性和语义信息的丰富性,减少歧义,从而更准确、流畅地生成内容,提高了模型的整体性能。
Baichuan2-192K在多个评测集上表现出色,包括Dureader、NarrativeQA、LSHT、TriviaQA等10项中英文长文本问答和摘要任务,其中有7项已经达到了最佳表现。
百川智能宣布,Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户。目前,他们已启动了Baichuan2-192K的API内测,并将首先向法律、媒体、金融等行业的核心合作伙伴开放,以推动自然语言处理技术的应用和发展。这一创新将为各行各业的企业用户提供更强大的文本处理工具,帮助他们提高工作效率和数据分析的准确性。