Klear:快手语言大模型的技术探索和应用
摘要:Klear是快手公司从0到1独立自主研发的一系列语言大模型及Agent系统,包括模型的预训练、对齐、推理能力增强以及Agent系统建设等。全面专业的评测结果表明,Klear LLM模型在同等尺寸下达到了行业的先进水平。在技术探索上,我们在合成数据、形式化数学证明、Diffusion LLM等前沿方向也有创新性的成果。此外,我们正在搭建Deep Research Agent,基于端到端创新性的RL算法,在相关评测中效果有了显著的提升。

简介:张富峥博士,长期从事大模型、自然语言处理(NLP)、知识图谱(Knowledge Graph)和搜索推荐等 AI 领域的工作,在 AI 技术研发创新、产品应用落地、技术团队管理和跨团队协作等方面均拥有丰富的工作经验。目前在快手公司担任General Manager,语言大模型中心负责人,负责Klear系列大模型的技术建设及相关业务应用。在此之前,富峥于2015-2018期间在MSRA担任研究员,负责知识图谱和推荐系统相关的研究以及在小冰、Bing新闻等业务场景的应用,于2018-2021期间在美团担任技术总监,负责知识图谱、预训练和商品搜索等方向的技术研发和业务应用。此外,富峥在ACL、KDD、WWW、EMNLP等相关领域的顶级会议/顶级期刊上发表论文70余篇,谷歌引用15000+,长期担任相关学术活动的评委。连续多年入选了斯坦福大学发布的“全球前2%顶尖科学家榜单”和“人工智能全球最具影响力学者榜单AI 2000”。