人工智能(AI)

OpenAI 的历史以及 ChatGPT 如何改变世界

OpenAI 是一家旨在促进和开发“友好”人工智能的研究公司。去年的 ChatGPT 和 DALLE-2 成功地将 AI 推向了主流,现在该公司正在寻求结交一些新朋友,据报道微软计划向该业务注资 100 亿美元。

但这一切是从哪里开始的呢?人工智能的影响是什么?机器人什么时候会变得有感觉?好的,我们不知道最后一个问题的答案,但您仍然会学到很多东西。在今天的文章中,我们拨开水晶球,回顾 OpenAI 的历史及其发展方向。

什么是 OpenAI?

作为 Elon Musk、Sam Altman、Greg Brockman、Wojciech Zaremba、Ilya Sutskever 和 John Schulman 的联合倡议,OpenAI 于 2015 年问世。任务很简单但雄心勃勃——开发安全和开放的 AI 工具来增强(而不是消灭)人们的能力。

“OpenAI 的使命是确保通用人工智能 (AGI)——我们指的是在最具经济价值的工作中表现优于人类的高度自治系统——造福全人类。”

OpenAI 章程

此后,该公司推出了一系列令人印象深刻的工具,包括人工智能图像生成器 DALL·E 和为 GitHub 的编码建议工具 CoPilot 提供支持的 CodexAI。

但所有这些都只是开胃菜。 

去年,OpenAI 凭借 ChatGPT 成为科技领域最热门的品牌,ChatGPT 是一款基于公司旗舰 GPT-3 模型的强大且令人不安的类似聊天的 AI 工具。与反对者相反,它证明不仅仅是类固醇的自动完成。

那么,让我们把时间倒流,看看这一切是从哪里开始的。

OpenAI 的历史

人工智能的早期

那么,是什么造就了人工智能?

这很简单。添加一点魔法,撒上仙尘,并加入大量来自计算机科学家和工程师的咖啡因通宵。 

好的,答案比这复杂一点。

在人类历史的进程中,我们一直在尝试使物体具有动画效果并赋予它们类似人类的品质。但第一个真正推动针的人是艾伦图灵。

图灵在 20 世纪 50 年代初期的研究为现代计算机科学奠定了基础。人工智能仍然是虚构小说中的事物,但它足以吸引更多聪明才智。这群快乐的人包括 John McCarthy,他在 1956 年创造了“人工智能”一词。

Alan Turing 设计的重建“Bombe”机器。该设备使英国人在二战期间破译了德国的加密通信。图片来源:Antoine Taveneaux (2)

两年后,麦卡锡和他的同事们在麻省理工学院设立了人工智能项目。人工智能研究的未来开始变得光明,只是有点过于乐观了。

在最初的兴趣之后,人工智能泡沫破裂,资金枯竭,主要是因为结果令人失望和计算能力有限。有人称这一时期为第一个“AI 冬天”。

在 20 世纪 90 年代,机器学习和自然语言处理 (NLP) 的进步使人工智能重新成为人们关注的焦点。一些宣传噱头帮助它留在那里。

1997 年,IBM 的计算机“深蓝”在六局对决中击败了国际象棋世界冠军加里·卡斯帕罗夫。这是继另一台名为“甲骨文”的计算机战胜危险之后人工智能的第二次胜利!一年前的冠军肯·詹宁斯。

1997 年,加里·卡斯帕罗夫 (Gary Kasparov) 与 IBM 的“深蓝”国际象棋计算机比赛。
图片来源:kasparov.com (3)

2000 年代初带来了有趣的发展,例如大数据的爆炸式增长、更精细的算法和不断增强的计算能力。通往高级人工智能系统的大门敞开着。

开放人工智能入党(2015-2017)

在图灵的突破性论文发表 65 年后,人工智能系统的快速扩张引起了一些人的注意。这也让一些人担心它前进的方向。

2015 年,前Y Combinator首席执行官 Sam Altman 和商业“磁铁”Elon Musk 率先发起了一项安全和开放的 AI 开发计划。这就是 OpenAI 历史的起点。

Sam Altman 和 Elon Musk 在特斯拉工厂的谈话中。图片来源:Y Combinator (4)

甚至在创立公司之前,奥特曼和马斯克就对人工智能技术的风险和机遇表示担忧,曾一度称其为“对人类的最大威胁”。

该公司最初专注于为视频游戏和其他应用程序开发人工智能。2016 年,它发布了它的第一个工具,一个用于强化学习 (RI) OpenAI Gym 和 Universe 的开源工具包,它本质上是一个训练人工智能代理的试验台。

枢轴和增长(2017-2019)

在随后的两年里,OpenAI 专注于更通用的 AI 研发。

2018 年,该公司发布了一篇论文《Improving Language Understanding by Generative Pre-Training》——介绍了 Generative Pre-trained Transformer (GPT) 的概念。

简而言之,GPT 是神经网络——受人脑结构和功能启发的机器学习模型——在大型人类生成文本数据集上进行训练。它可以执行许多功能,例如生成和回答问题等。

它还可以写关于自己的俳句,就像这样:

ChatGPT的胸怀广阔,

答案流畅,

AI 终于开口了。

不管怎样……OpenAI 团队投入了大量资金并开发了 GPT-1,这是他们在包含 7000 多本未出版书籍的 BookCorpus 上“训练”的第一个语言模型。

该模型最终演变成 GPT-2,这是一个更强大的版本,在 800 万个网页上进行了训练,包含 15 亿个参数(使文本预测成为可能的训练值)。

左侧带有模型和解码器设置的 GPT-2 playground

那时,该公司偏离了其“开放”人工智能(双关语并非本意)的崇高目标,最初决定不向公众发布 GPT-2。 

(官方)原因? 

根据 OpenAI 博客公告,该团队担心 GPT-2 可能被用来编写诈骗电子邮件或生成假新闻。这是完全有道理的。毕竟,权力越大,责任越大(感谢彼得·帕克)。

2019 年,OpenAI 做出了另一个有争议的决定,即转型为“上限利润”组织,并成立了 OpenAI LP,“营利性和非营利性的混合体”。

DALL·E、GPT-3 和 ChatGPT (2021–)

2021 年,OpenAI 发布了 DALL-E,这是一种使用与 GPT-2 类似架构的人工智能。DALL-E——WALL-E 和西班牙超现实主义艺术家萨尔瓦多·达利 (Salvador Dalí) 的合成词——可以生成逼真的图像,而不是生成文本,似乎是凭空产生的。

DALL-E 2 艺术品插板。来源:Pinterest

2022 年,OpenAI 用 GPT-3 再次推波助澜。作为前两个模型的迭代,GPT-3 被提供了 45TB 的文本数据,这些文本数据被转换为 175B 的参数。它比我们以前见过的任何东西都更聪明、更快、更可怕。

为了实现这一目标,微软为 OpenAI 设计了一台超级计算机,其中包括 285,000 个 CPU 内核和 10,000 个 GPU。它还在 Top500 超级计算机排名中排名第 5。

GPT-3的成功催生了另一个变相的怪物。

2022 年 11 月,OpenAI 发布了 ChatGPT,这是一种建立在 GPT-3 之上的语言模型聊天机器人。

ChatGPT 最令人惊叹的方面之一是它理解上下文的能力——聊天机器人可以根据对话历史生成答案并进行调整。这意味着您可以在对话线程中“训练”ChatGPT 以获得更准确的答案。

OpenAI 的 ChatGPT 用户界面(5)

对于许多人来说,与 ChatGPT 或 DALL-E 2(DALL-E 的继任者同月发布)的互动是与 AI 的第一次(有意识的)和超现实的接触。这不完全是一见钟情。但它清楚地表明了一件事——未来是人工智能,而且它已经来了。

GPT-4 怪兽

人工智能技术的进步就像看着蹒跚学步的蹒跚学步的蹒跚学步。它既可爱又令人担忧,尤其是当您认为 OpenAI 已经在开发 GPT-4 时。与GPT-3相比,它会更像是一个少年开着从ma和pa手中抢来的700马力超跑。

好吧,这是一个可怕的比喻。所以让我们尝试一些不同的东西。

为了给你一个更好的画面,GPT-3 有 1750 亿个参数可以让它进行文本预测。ChatGPT4可能有100万亿(推测),2023年上线。

不管我们喜欢与否,精灵已经从瓶子里出来了——人工智能将在未来几年颠覆许多行业。我们只能希望 OpenAI 的最初目标仍然存在。

是什么让 OpenAI 与众不同?

思想的异花授粉

OpenAI 在行业中具有独特的地位。它拥有一系列可行的产品、游戏中最优秀的人才和出色的宣传,这在很大程度上得益于去年的 ChatGPT 和 DALL-E 2。

当您有东西要展示时,结交朋友和分享想法会容易得多。

2022 年,Greylock Partners(LinkedIn 的创始人 Reid Hoffman 是 Greylock 的合伙人之一)开始与 OpenAI 和 AdeptAI 实验室等合作,开发将“赋予人类权力”而不是接管我们工作的人工智能工具。

通过与不同行业的合作伙伴合作,OpenAI 可以扩展到医疗保健、交通和金融等新领域。此外,还有一个难以拒绝的机会来访问大量真实世界的客户数据来训练其 AI 模型。

这似乎对每个人都是双赢的,至少目前是这样。

负责任的人工智能开发

AI 中的伦理就像试图教机器人讲笑话,总是有点偏差。

AI 以完美的语调说道。 

好的,让我们认真一点。

尽管偏离了最初的目标,但 OpenAI 在强调负责任的 AI 开发问题方面做得非常出色。这不是一个我们可以一直隐瞒的讨论。

但该团队在此过程中也犯了一些错误。

DALL-E 2 推出后不久,一些艺术家注意到该工具生成的图像与他们自己的艺术作品相似。图像包含模糊签名的痕迹也无济于事,这引发了对 OpenAI 数据收集实践的完全合理的不满。

当然,不受限制地访问 ChatGPT 等工具会带来一些其他风险。 

一些教师和学者担心人工智能工具可能会损害学生的表现和信誉。有些人已经使用 ChatGPT 抓获了他们的学生在考试中作弊。

当然,安全和合乎道德地使用人工智能系统的责任在于它的创造者和最终用户。但在这一点上,它仍然是一个非常未知的领域。

独特的所有权结构

自 GPT-2 延迟发布以来,OpenAI 一直在默默地远离其开放、可访问和安全的 AI 开发的最初目标。该团队还因其财务运作缺乏透明度而受到严厉批评。

开发 AI 系统的成本高得离谱,因此 OpenAI 必须在金融稳定和使命之间取舍。当你在比赛中时,这是一个难以破解的难题。

2019 年,OpenAI 反其道而行之,重组为一家“利润封顶”的公司。此举引发了一波批评浪潮,并让许多 AI 研究人员产生了反抗情绪。

最新传言称,微软正计划进行另一项价值 100 亿美元的大规模投资,此举可能会使该公司进一步远离其开源血统。

OpenAI 的潜在好处

很难预测 OpenAI 开发的 ChatGPT 和其他工具将如何塑造世界。有一件事是肯定的——它将在未来几年颠覆许多行业。

强大的神经网络的出现是一个很好的机会,可能有助于解决人类难以单独解决的复杂问题。

人工智能系统已经在努力审查 X 射线和 CT(计算机断层扫描)扫描、分析患者记录、监督公共交通,甚至优化作物产量。 

ChatGPT 等工具可以将这些好处转移到其他领域,如教育、营销、金融服务和客户服务。当然,这些变化将伴随着相当大的风险。

不管我们喜欢与否,人工智能的未来掌握在像 OpenAI 这样的公司手中,它们将在塑造景观和定义“安全”和“有益”使用的含义方面发挥关键作用。

现在,让我们放下严肃的语气,找点乐子。

如何开始使用 OpenAI 的 ChatGPT

如果您还没有玩过 ChatGPT,您可以免费试用。

您所要做的就是转到https://chat.openai.com/chat并创建一个新帐户。

ChatGPT 看起来像任何普通的聊天应用程序,除了它是提供答案的人工智能。

这是它的工作原理。

输入提示,然后等待 ChatGPT 生成答案。您可以提出问题、开玩笑、解决数学问题或获得关系建议(使用风险自负)。

请记住,答案可能不正确或有偏见,因为直到 2021 年,ChatGPT 一直在使用从互联网收集的数据进行训练。但是谁不犯错误呢?

你要去哪里,OpenAI? 

AI 工具可以在生活和商业中提供难以置信的帮助。他们可以自动执行重复性任务,提供个性化的见解,并显着提高产品和服务的质量。只要我们承诺负责任地使用它们。

虽然 OpenAI 的 ChatGPT 与 Vinge 的“奇点”相去甚远,但微软即将到来的 100 亿美元融资可能迟早会让它到达那里。只能寄希望于掌握缰绳的人能把缰绳握得足够紧,以遏制潜在的危险。