B 站首次公布 AI 自研大语言模型
卡饭网 7 月 5 日消息,2024 世界人工智能大会(WAIC 2024)上,B站首次公布多项自研AI技术与AIGC创意,涵盖AI语音声库、必剪Studio和AI动态漫技术。B站大语言模型系列也首次亮相,包括开源的Index-1.9B chat和Index-1.9B character。
Index-1.9B 系列模型于 6 月开源,包含基座模型、对照组、对话模型、角色扮演模型:
Index-1.9B base : 基座模型,具有 19 亿非词嵌入参数量,在 2.8T 中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先
Index-1.9B pure : 基座模型的对照组,与 base 具有相同的参数和训练策略,不同之处在于过滤了该版本语料中所有指令相关的数据,以此来验证指令对 benchmark 的影响
Index-1.9B chat : 基于 index-1.9B base 通过 SFT 和 DPO 对齐后的对话模型
Index-1.9B character : 在 SFT 和 DPO 的基础上引入了 RAG 来实现 fewshots 角色扮演定制
Index-1.9B 系列模型开源地址:
http://github.com/bilibili/Index-1.9B