编程学习网 > IT圈内 > 哔哩哔哩技术团队开源Index-1.9B轻量模型 提供角色扮演版可以模仿B站老哥
2024
06-26

哔哩哔哩技术团队开源Index-1.9B轻量模型 提供角色扮演版可以模仿B站老哥


昨天哔哩哔哩技术团队宣布开源 Index 系列模型中的轻量版本:Index-1.9B 版,也就是包含 19 亿参数的人工智能模型。

其中 Index-1.9B 版还分成多个不同的微调版本,例如基座模型、基座模型的对照组、对话模型、可以用来定制的角色扮演模型 (目测猫娘数量要大幅度增加~)。

这些模型目前均已同时在 GitHub 和 HuggingFace 上开源,同时提供在线 Demo 供用户和开发者体验,即无需部署立即对话测试。

下面是不同版本的介绍:

Index-1.9B base 版:属于基座模型,具有 1.9B 的非词嵌入参数量,并且由哔哩哔哩技术团队在 2.8T 中英文为主的语料上进行预训练,在多个评测基准中领先于同级别的模型。

Index-1.9B pure 版:属于基座模型的对照组,与 base 版具有相同的参数和训练策略,不同之处在于严格过滤了该版本语料中与所有指令相关的数据,以此来验证指令对 benchmark 的测试影响。

Index-1.9B chat 版:基于 base 版通过 SFT 和 DPO 对齐后的对话模型,由于预训练中引入了较多定向清洗对话类语料,所以聊天的趣味性明显更强。

Index-1.9B character 版:在 SFT 和 DPO 的基础上引入了 RAG 来实现 fewshots 角色扮演定制 (注:内置的角色名为三三,自称是 B 站的站娘)。

以上就是哔哩哔哩技术团队开源Index-1.9B轻量模型 提供角色扮演版可以模仿B站老哥的详细内容,想要了解更多Python教程欢迎持续关注编程学习网。

扫码二维码 获取免费视频学习资料

Python编程学习

查 看2022高级编程视频教程免费获取