第39章 关于ChatGPT的一些解读中(2/2)
方法分为三个步骤: 1)有监督地调优:预训练的语言模型在少量已标注的数据上进行调优,以学习从给定的 prompt 列表生成输出的有监督的策略(SFt 模型);2)模拟人类偏好:标注者们对相对大量的 SFt 模型输出进行投票,创建一个由比较数据组成的新数据集,训练建立模型(Rm);
3)近端策略优化(ppo):使用 Rm 作为强化学习的优化目标,利用 ppo算法微调 SFt 模型。我们认为,chatGpt 的成功展示出 AI 大模型的应用潜力,新方法的引入有望加速 NLp 算法及 AI 行业发展。
3、巨头坚定投入,开启 AI 新浪潮2023 年 1 月 18 日,微软宣布将于 3 月底前在全球裁员 1 万人,约占员工总数的 5%;1 月 23 日微软在其官方博客宣布,已与 openAI 扩大合作伙伴关系,微软将向 openAI 进行一项为期多年、价值数十亿美元的投资,以加速其在人工智能领域的技术突破,此前微软已分别于 2019 年和 2021 年对openAI 进行投资1 月 20 日,谷歌母公司 Alphabet 宣布将裁员约 1.2 万人,占该公司员工总数的 6%以上,同时谷歌 cEo 表示,公司将会进一步聚焦AI 技术核心业务的研发投入。我们认为,微软、谷歌、亚马逊等全球巨头坚定投入 AI,展现出 AI 应用广阔的发展前景,AI 行业有望开启新发展浪潮。
chat-Gpt 的成功,是在前期大量坚实的工作基础上实现的,不是横空出世的技术跨越。这些进步主要来自数学层面上的优化带来的结果匹配精准度提高,而并非算法真正为 AI 带来了创造性与完整的逻辑性,也不是能够从训练的数据中学习到新的知识。它在“解锁”(unlock)和挖掘 Gpt3 学到的海量数据中的知识和能力,但这些仅通过快速地In-context 的方式较难获得。InstuctGpt 找到了一种面向主观任务来挖掘 Gpt3 强大语言能力的方式。因此从这样的底层技术逻辑出发,我们能迅速找到中短期内适合 chat-Gpt的产业化方向:一个真正全方位的智能内容生成助手。
chat-Gpt 的成功证明了两点:1)单纯扩大模型参数并非唯一出路;2)让模型再造定期开放给大众测试并收集人类反馈数据更有利于模型迭代。之前两个阶段,人工智能的进展更多体现在基于规模的技术突破,如 2015-2020 年,用于模型训练的计算量增长了 6 个数量级,同时随着规模的增大,输出结果的质量亦迎来质变,在语言文字、书写、图像识别等领域皆表现出超越人类的水平。但在使用层面,由于所需要的算力巨大,往往需要特殊的 GpU 配置,同时训练过程相对封闭,大多数人并无法使用,因此技术无法被多数人触达。而人工智能的第三个阶段,随着更新的技术、更优的算法、更大的模型出现,算力的成本越来越低,使得模型训练与运行所需成本持续下降,而算法从封闭测试到开放测试、开源的逐渐普及,亦降低了使用门槛。由此人工智能无论在经济性与可获得性上都达到了支持普及的水平。
注:(免责申明)本文仅为个人笔记,内含个股仅仅是作为分析参考,不能作为投资决策的依据,不构成任何建议,据此入市风险自担。股市有风险,投资需谨慎!
知音难觅,也是人生常态,一曲众寡,尽管少有人懂,但是我自有我的风采
见者点赞,腰缠万贯!股运长虹,感谢诸君关注.点赞.评论.转发!