不写代码、靠“玩”ChatGPT年入百万,提示工程师正变成硅谷新宠( 二 )


29 岁的 Albert Phelps 是AI金融咨询公司 Mudano 的一位提示工程师 。他和同事们的日常就是为 OpenAI 等工具编写提示 。这些提示可以作为预设 , 保存在 OpenAI 的 Playground 中 , 供其客户使用 。Phelps 介绍 , 他们每天需要编写 5 个不同的提示 , 与 ChatGPT 进行大约 50 次交互 。
和大多数程序员不一样的是 , Phelps 并没有计算机相关背景 , 而是毕业于历史系 。事实上 , 对于提示工程师而言 , 最重要的是逻辑 。虽然编程知识和机器学习的背景对工作很有帮助 , 但却并不是必要条件 。
Anthropic 的技术人员 Matt Bell 就曾提到 , “我们最好的提示工程师是一位哲学家 。好的提示包括写出极其清晰的解释 , 并找出造成误解的原因以及如何避免误解 。”
也就是说 , 当AI模型的使用者像软件工程师Anna一样 , 一次性“说了一堆要求”时 , 可能会因为提示不清晰 , 而导致AI误解 , 给出离题的答案 。
对此 , 阿德莱德大学澳大利亚机器学习研究所 (AIML) 的高级讲师 Lingqiao Liu 指出 , 好的提示工程的关键是将一项复杂的任务分解成一组简单的任务 。
他介绍 , 如果你问这些模型一个简单的问题(称为“零样本提示”) , 它通常会以缺乏细节或结构的“普通”答案作为回应 。为了让 AI 模型给出更加符合标准的结果 , 用户可以采取以下几种方式:
第一种方法是一次性提示 , 即用户给出一对问答示例 , 让 AI 了解需求 , 并按照该模版处理后续请求 。比如 , 在咨询关于某一种动物的信息时 , 让模型根据特点、居住区域、饮食习惯等来给出信息 。
第二种是角色提示 , 例如告诉模型”我是一个妈妈 , 想要知道每天行程规划“ , 从而让模型根据”妈妈“的角色来给出具体安排 。
第三种方法是引入关键代理 。例如 , 你可以让 ChatGPT 写一个关于机器人的故事 , 然后让它根据自己的建议进行批评和改写 。
最后一种方法是思维链 , 即先让AI对回答某个问题给出具体步骤 , 然后在鼓励它依照自己给出的步骤 , 来推理更复杂的问题 。
如果一位艺术家想要使用 ChatGPT 和 Midjourney 来进行创作 , 或许可以尝试一下这一条来自 PromptHero 的高赞提示:
[我想让你充当 Midjourney 人工智能程序的提示生成器 。你的工作是提供详细的、有创意的描述 , 以激发 AI 独特而有趣的图像 。请记住 , AI 能够理解多种语言并能解释抽象概念 , 因此请尽可能发挥想象力和描述性 。例如 , 您可以描述未来城市的场景 , 或者充满奇怪生物的超现实景观 。您的描述越详细、越富有想象力 , 生成的图像就会越有趣 。这是你的第一个提示:“一望无际的野花田 , 每一个都有不同的颜色和形状 。在远处 , 一棵巨大的树耸立在风景之上 , 它的树枝像触手一样伸向天空 ”]
总之 , 对于生成文本的AI模型而言 , 如何编写出逻辑清晰的提示至关重要 。不过 , 在其他领域 , 好的提示可能需要更多元素 。
构建图像:关键词拓展想象力
随着提示工程的价值被挖掘 , 这股新鲜血液开始涌向更多场景 。图像则是其中最受关注的领域之一 。
就图像生成而言 , 创造者们认为提示的好坏与否取决于关键词 。
七个月前 , Jason Allen 凭借着下面这张在 Midjourney 上创作的一幅作品《太空歌剧院》赢得科罗拉多州的一场艺术比赛 。

不写代码、靠“玩”ChatGPT年入百万,提示工程师正变成硅谷新宠

文章插图
Jason Allen 获奖作品 《太空歌剧院》
为了这幅作品 , 他耗时约 80 小时 , 在 Midjourney 中测试不同的美学元素 , 给出不同的主题提示 , 才呈现出自己想要的图像 。
“我想创造一个电影场景 , 就像你在电影中看到的那样 , ”他说 , “所以我上网查找了所有与电影摄影相关的关键词 。基本上就是是在学习成为一名电影摄影师 。”
通常 , AI模型会从互联网上抓取大量图像及其相关文本进行训练 。例如 , 它可能会对一幅婚纱照打上”新娘“、”婚纱“、”捧花“、”微笑“等不同标签 , 并标记上不同的权重 。每个标签会给AI模型相应提示 , 产生可预测的美感 。


推荐阅读