《生成式 AI 的平行面》
原文towardsdatascience.com/the-parallels-of-generative-ai-dcbbfac194bbhttps://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/482aaf5607b2252a27bf43aeccea6441.png由Norris Niman在Unsplash上的照片当被问及“你认为 AI 将如何改变我们[人类]”时杰夫·贝索斯以一个引人深思的评论作为他答案的开头。“当前形式的大型语言模型并不是发明。它们是发现。”用他的例子来说明伽利略发明了望远镜后来发现了木星的卫星。他通过论证“[与]787[飞机]这样的工程对象不同LLMs 更像是发现。我们不断被它们的性能所震惊”将 LLMs 定位在发明-发现光谱的远端。大型语言模型——你甚至可以将它扩展到整个生成式 AI——已经在各个领域推动了令人兴奋的创新应用。它们被包装成各种形态和形式作为个性化客户服务聊天机器人、写作助手甚至嵌入到 Adobe Photoshop 等长期广泛使用的工具的新功能中。所以这确实是技术。它们是经过工程设计的工具——已经是发明了——对吧嗯有时候包装层确实太薄了。当你停下来反思贝索斯的评论¹并开始将 OpenAI 发布的每个新 GPT 版本或 Meta 发布的新最先进开源模型仅仅视为研究的结果时你会注意到实际上可能正在发生的事情——我们正变得越来越擅长将发现与产品之间的差距连接起来。在这篇文章中我反思了一个新行业如何使生成式 AI 的实施民主化以及研究和广泛可用的工具的副产品现在比以往任何时候都更接近。《平行面》生成式人工智能从未是 AI 颠覆性实施的唯一驱动力也从未是现代机器学习研究的普遍领域。恰恰相反直到 2020 年尽管深度学习论文主导了 Google Scholar 的最具影响力的出版物列表以目标检测和图像识别为中心的计算机视觉研究吸引了最多的引用而引入了 Transformers 架构的“Attention is all you need”这篇工作在那一年仅排名第 4尽管谷歌从 2019 年开始应用 BERT 模型进行搜索。然而一个事实是所有这些工作都为生成式人工智能最终成为主流铺平了道路无论是在研究还是在社交媒体中。深度学习架构的进步如生成对抗网络GANs和扩散模型随着每一次展示潜在能力的展示而激发起广泛的热情就像 OpenAI 最近展示的Sora的逼真文本到视频演示。在另一方面当我们看工具——那些作为工程产品进入公众手中的工具——时我们有 ChatGPT 之前的例子如 GitHub Copilot长期以来一直在证明通过生成技术提高生产力的潜力。但直到 OpenAI 的突出聊天机器人在 2022 年 11 月进入场景生成式人工智能的巨大能力才对公众明显。直到那时发现工具的并行路径是通过明确的边界定义的这些边界将它们区分开来实施。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/eb4b7a9aa61758c87f6f9307ea6fa804.png生成式人工智能的发现工具并行对企业级生成式人工智能的渴望如果你寻找为什么 2023 年生成式人工智能在研究和产品提供方面的进步如此疯狂的原因你可能会很难找到一个单一的答案。原因很简单——随着时间的推移越来越多的参与者加入了这个场景研究人员、公司和投资者因此更多的变量正在为这个方程式做出贡献。**采用 AI 的新理由或者至少承认你不应该忽视它**可能每天都在出现无论行业如何。无论你在价值链中的位置如何。但有一件事是不可否认的ChatGPT 激起了公司对生成式人工智能如何改变其业务的兴趣。去年 6 月麦肯锡进行的一项研究概述了 63 个生成式人工智能可以解决特定商业挑战的用例并估计仅这些用例每年可为全球经济带来高达 4.4 万亿美元的价值。当外推到可能通过技术应用于知识工作者活动中的生产力提高时影响可能达到 7.9 万亿美元²。因此将发现与工具区分开来的边界设置不能无动于衷。虽然对于已经利用机器学习的科技公司来说生成式 AI 的实施面临较少的摩擦——在资本分配、访问现代数据堆栈以及最重要的是人才招聘方面——但对于绝大多数企业来说情况并非如此。Dataiku最近的一篇出版物明确指出——大型企业中生成式 AI 潜在应用与能够构建这些系统的专家数量之间的巨大差距正在推动民主化的需求。开源生成式 AI 的爆发ChatGPT 也像对商业公司的董事会一样激起了研究社区的波澜高管们纷纷急于了解什么是生成式预训练转换器。但还有一个关键因素值得注意。不可否认开源生成式 AI 最重要的参考是 Meta 在 2023 年 2 月推出的 Llama 系列大型语言模型。Llama 本身的发布是否可以归类为开源可能足以引发一篇完整的中篇论文的讨论。尽管如此它无疑为随后出现的众多模型奠定了基础。2023 年也是开源人工智能通过 Hugging Face 和 Mistral 等公司看到大量风险投资流入的一年这表明投资者对 OpenAI 替代品的兴趣。上述结果是一个繁荣的研究场景这进一步加剧了连接实施边界所带来的紧张感这个边界将发现与产品区分开来。聚焦正如我们所见的那样。正在出现一个围绕降低生成式 AI 实施摩擦需求的全新产业。主要云服务提供商正在引入新的功能以更好地支持其数据科学和机器学习平台中的生成式 AI 工作流程例如谷歌在 2023 年 6 月宣布了Vertex AI 的生成式 AI 工作室的通用可用性以及Amazon Bedrock它作为 AWS 的一项服务在 2023 年 9 月成为通用可用性用于构建生成式 AI 应用。https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/48db32e4b3f26bbbdf776d398e80e541.png一个连接生成式 AI 发现与工具并行的全新产业IBM 提供了一个例子通过重新命名的 IBM Watson 之上的全新部门 WatsonX为公司提供了一个平台以开发并将 AI 集成到他们的业务中。但这份名单并不只是由巨头组成。一整批新的开发工具初创公司正在筹集种子资金承诺将生成式 AI 的实施变得尽可能无缝。例如Deepset 在 2018 年就预见到了这一点在那之后 Transformer 模型的第一次大规模采用之后最近筹集了 3000 万美元以扩大其专注于 LLM 的 MLOps 产品帮助行业“从 AI 实验室转向 AI 工厂”。Hugging Face 和 LangChain、Llama Index 等其他社区驱动的开源项目也在赋予独立开发者快速将基于代理的工具推向市场的能力。如 Pinecone、Chroma 和 Weaviate 这样的向量数据库迄今为止已知可以驱动推荐引擎现在已成为基于 RAG 的应用的核心组件。到 2023 年上半年该行业已经看到了投资激增这反映了它在推动生成式 AI 实施中的核心作用。量质并重但并不是所有人都认为实施便利等于更好的 AI 工具提供。一方面它使得像 Adobe Firefly 这样的优秀工具能够快速上市。另一方面急于推出“AI 赋能技术”也导致了一系列可疑产品的涌现。最近的一个例子发生在本周末一个法庭裁决支持了一名 AirCanada 顾客该顾客依赖公司聊天机器人的回复但未能在其回复中检索到退款政策的重要部分。或者那位从 2023 年 12 月开始就在 subreddits 上用梗激增的 Watsonville 客户服务 AI 助手。幻觉是一个问题以及确保 LLMs 免受恶意提示的影响并非易事这并不是什么新闻。生成式 AI 的许多其他固有风险已经为人所知一段时间了。但看到它仍然吸引着投资这又是对其利益远大于挑战的另一种肯定。结论正如杰夫·贝索斯在与 Lex Fridman 的两小时对话中所说“大型语言模型的专业实现可以成为强大的工具”。在方程式的最终平衡中看到我们在将发现工具的平行性汇聚在一起方面变得越来越擅长这是令人欣慰的。喜欢这个故事吗你可以在这里的 Medium 上关注我了解更多关于人工智能、数据科学和机器学习的文章。你也可以在我的LinkedIn和X上找到我我在那里分享这些内容的简短版本。每当 Erich Silva 发布时都会收到电子邮件。来源在本文中的超链接之外我特别推荐以下关于该主题长篇内容的来源[1] 杰夫·贝索斯亚马逊和蓝色起源 | Lex Fridman 播客第 405 集www.youtube.com/watch?vDcWqzZ3I2cY[2] 生成式 AI 的经济潜力 | 麦肯锡www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier#key-insights除非另有说明所有图片均为作者所有。