为应对 ChatGPT,谷歌在大模型方面的动作还在继续。
最新消息,其旗下专注语言大模型领域的 "蓝移团队"(Blueshift Team)宣布,正式加入 DeepMind,旨在共同提升 LLM 能力!
(资料图)
还有谷歌 5400 亿大模型 PaLM,背后也有蓝移团队成员提供建议。
综合此前消息,DeepMind 表示要在今年发布聊天机器人麻雀(Sparrow)内测版本。
如今又有擅长大模型研究的团队加入,强强联手,或许会加快谷歌应对 ChatGPT 的脚步?
这下有好戏看了。
蓝移团队是谁?
据官网介绍,蓝移团队主要关注的研究点是如何理解和改进大语言模型的能力。
他们专注于了解 Transformer 的局限性,并挑战将其能力扩展到解决数学、科学、编程、算法和规划等领域。
具体可分为如下几方面分支。
。
综合了数理化生、电子工程和计算机科学的综合考试MMLU-STEM,它的分数比以往 AI 高了20 分左右。
作者透露,让该模型参加波兰的数学高考,成绩都超过了全国平均分数。
BIG-bench 由 204 个任务组成,内容涵盖语言学、儿童发展、数学、常识推理、生物学、物理学、社会偏见、软件开发等方面的问题。
官网显示,蓝移团队目前有 4 位主要成员。
Behnam Neyshabur 现在是 DeepMind 的高级研究员。他在丰田工业大学(芝加哥)攻读了计算机博士学位,后来在纽约大学进行博士后工作,同时是普林斯顿大学高等研究理论机器学习项目组的成员。
Vinay Ramasesh在加州大学伯克利分校获得物理学博士学位,曾致力于研究基于超导量子比特的量子处理器,硕士毕业于麻省理工学院。
Ethan Dyer 博士毕业于麻省理工学院,2018 年加入谷歌工作至今。
这次蓝移团队的调动,也不免让外界猜测是否是谷歌为应对 ChatGPT 的最新举措。
ChatGPT 引爆大模型趋势后,谷歌几乎是最先打响 " 阻击战 " 的大厂。
尽管加急发布的 Bard 效果确实有失水准,但这并不意味着谷歌会就此丧失竞争力。
诚如 OpenAI 之于微软,谷歌也有 DeepMind。
DeepMind 还是上一轮 AI 浪潮的引爆者。
消息显示,DeepMind 手里也有聊天机器人。
去年 9 月,他们介绍了一个对话 AI 麻雀(Sparrow),它的原理同样是基于人类反馈的强化学习,能够依据人类偏好训练模型。
他表示,他们将会 " 谨慎地 " 发布模型,以实现模型可以开发强化学习功能,比如引用资料等——这是 ChatGPT 不具备的功能。
蓝移团队的加入公告中提到,他们是为了加速提升DeepMind 乃至谷歌的 LLM 能力,不知这一动向是否会加速该对话模型的发布。
与此同时,谷歌也没有把目光完全局限在自家开发能力上。
本月初,劈柴哥重磅宣布,斥资 3 亿美元,紧急投资 ChatGPT 竞品公司Anthropic——由GPT-3 核心成员出走创办。
1 月底,该公司内测聊天机器人 Claude,
它同 ChatGPT 一样,靠强化学习(RL)来训练偏好模型,并进行后续微调。
但又与 ChatGPT 采用的人类反馈强化学习(RLHF)不同,Claude 训练时,采用了基于偏好模型而非人工反馈的原发人工智能方法(Constitutional AI),这种方法又被称为 AI 反馈强化学习(RLAIF)。
如今,Claude 尚未作为商业产品正式发布,但已有人(如全网第一个提示工程师 Riley Goodside)拿到了内测资格。有人说效果比 ChatGPT 要好。
总而言之,谷歌虽然在 Bard 上栽了跟头,但也没把鸡蛋放在一个篮子里。接下来它在大模型上还有哪些新动作?还很有看头。
参考链接:
[ 1 ] https://twitter.com/bneyshabur/status/1629150056715816962
[ 2 ] https://research.google/teams/blueshift/
[ 3 ] https://www.deepmind.com/blog/building-safer-dialogue-agents
标签: