如何使用GPT-3在10分钟内构建惊人的AI应用程序

你是否认为,构建一个基于自然语言处理(NLP)的 AI 应用程序(例如聊天机器人或翻译软件)需要大量的数据、计算机技术、并且会花费大量时间?但其实并非总是如此——使用 GPT-3,我们能够以最少的开发工作量构建一些基于 NLP 的惊人 AI 应用程序。


GPT-3 全称 Generative Pre-trained Transformer 3,是一种通过训练大量来自互联网的数据集得到的语言模型,由 OpenAI 公司开发。本质上它是一个巨大的神经网络,作为深度学习的一部分,它是人工智能的典型代表。


那么 GPT-3 模型为什么受到巨大关注?我们一起来看看:

  • GPT-3 模型包含 1750 亿个参数,而以前的版本,GPT-2 模型只有 15 亿个参数。参数是神经网络模型中的权重,该神经网络模型将输入转换为输出。
  • GPT-3 是一个生成模型,这意味着它具有生成较长单词序列的能力,可以作为连贯输出。
  • 这种最先进的语言模型几乎可以回答所有传递给它的问题,而且更加人性化。
  • 在模型训练中使用了数十亿个单词、文本和代码段,从而使其能够在多种编程语言中进行自动编码。
  • 除了英语,它的多语言文本处理功能还可以处理其它语言。
  • 最优越的地方在于,GPT-3 模型可以执行特定任务,比如充当翻译器、聊天机器人甚至作为代码构建器,而无需任何自定义设置或任何特殊调整,它只需要经过一些训练数据的训练。


在本文中,我们将向大家展示如何使用这个惊人的 API 来解决不同的基于 NLP 的 AI 用例。


获取访问权限


首先,要构建本文中涵盖的用例,需要获得 GPT-3 beta API 的访问权限。
可以通过以下链接申请访问:https://beta.openai.com

此外,为了与 GPT-3 API 交互,我将使用“gpt3-sandbox”存储库中的脚本。使用 API 文件夹中的 gpt.py 就可以访问 GPT-3 API。
gpt3-sandbox 存储库链接:https://github.com/shreyashankar/gpt3-sandbox
脚本链接:https://github.com/rsharankumar/Use-Cases-using-GPT-3


聊天机器人 chatbot


在下面的示例中,导入所需的软件包以及从“gpt3-sandbox”存储库中下载的脚本。我们将向模型传递三个参数:

  • engine:有四个选项可供选择,分别是 Davinci、ADA、Babbage、Curie。此处使用 Davinci,因为它是使用 1750 亿个参数训练的最强大引擎;
  • temperature:其范围通常在 0-1,用于控制生成输出的随机性。值为 0 时模型具有确定性,即每次执行后的输出都是相同的;值为 1 时,生成的输出将具有较高的随机性;
  • max_tokens:最大完成长度。


在下面的脚本中,需要询问的问题被传递给变量“prompt1”,然后使用 submit_request 函数传递给模型。其结果存储在“output1”变量中,如下图:

将文本转换为公式


在下面的示例中,可以基于非常少的训练即可将文本转换为公式,这一点其他预训练模型则无法实现。


如图所示,temperature 值已经增加,以使响应输出具有一定的随机性,我们还将一些预定义的示例作为训练数据集传递给模型。仅用 5 个示例,就可以训练该模型将文本转换为公式。用已知示例训练模型后,如图所示,将 “x squared plus 2 times x” 作为输入,模型成功将其转换为公式 “x^2+2x”。

翻译器(英语-法语)


此外,还可以训练模型使其充当翻译器。如下所示,仅通过三个示例来训练模型,就能将英语文本翻译为法语。

附上以上用例的视频教程 https://youtu.be/g5WhlYBx-T0,其中提供了用例实现的逐步介绍。


原文链接:https://towardsdatascience.com/how-to-build-amazing-ai-use-cases-under-10-mins-using-gpt-3-ebc51b2b2b97


【AD】BandwagonHost:$92.30/年/2核/2G内存/40G SSD/1T流量/1Gbps/香港CMI/大阪软银/洛杉矶CN2 GIA

【AD】美国洛杉矶CN2 VPS/香港CN2 VPS/日本CN2 VPS推荐,延迟低、稳定性高、免费备份_搬瓦工vps