基于OpenAI的新NLP文本编写APP—GPT-2，随时随地和你一起写作

2019-08-06 12:26:00 讀芯術

全文共3510字，预计学习时长

7分钟

图片来源：unsplash.com/@thoughtcatalog

本文将介绍一款基于OpenAI的新NLP文本编写APP——GPT-2，旨在随时随地和用户一起写作。

这是一款全新的创造性文本编辑器APP。与传统文本编辑器不同，这款APP的NLP模型可以完成用户要求的句子，并为“用机器写作”带来全新的维度。该APP基于GPT-2（OpenAI的语言模型），可以生成在语法意义上准确无误的句子和连贯的文字段落。

在GPT-2的帮助下讲故事

该演示现已在https://transformer.huggingface.co上发布。

用transformer写作就像用计算器写微积分。

这个模型是NLP最新趋势的一部分，在对特定任务进行微调时，该模型用于创建大型的语言模型，从而使各项任务圆满完成。这使得具有大量参数（GPT-2 Large或Grover的参数多达15亿个）的Transformer模型由于其重量而很难处理。

APP为用户提供两种型号：小型GPT-2和中型GPT-2。两种型号同时加载到计算机的RAM中共需2.4 GB内存。

当前存在的问题

注意：这里的方法针对无法执行批量推理的模型。对于可以进行批量推理的模型，如我们使用的模型，可能不需要显示的解决方法。

这个APP设置了一些限制，以便用户拥有愉悦的使用感。如反应时间要尽可能短，并生成足够长的句子。每次运行时，系统必须提供几种可能的结果，以便用户从中做出选择，这会使生成的数据量增加两倍之多。因此，该APP的目标是尽可能优化计算，利用GPU高度并行性的特点创建工作流程。

设置工作区

构建一个服务器端API，与前端APP连接。该API将负责处理生成句子所需的计算。因为大多数NLP模型都是现成的，所以使用Python来完成这项任务。其他低级语言（如C++或Rust）更适合以性能为导向的后端。

使用falcon（https://falconframework.org/）作为Web服务器（任何其他HTTP框架也可以使用），与gunicorn（https://gunicorn.org/）一起运行实例并平衡负载。GPT-2 Pytorch（https://github.com/huggingface/pytorch-pretrained-BERT）运行是该项目的支柱。如果你对类似的例子感兴趣，可参见示例目录（https://github.com/huggingface/pytorch-pretrained-BERT/tree/master/examples）中的一些示例。

Gunicorn可以设立独立运行APP的“workers”，有效平衡不同worker的负载。可以参见官方的Gunicorn文档（http://docs.gunicorn.org/en/stable/design.html），精确了解它们是如何工作的。

三种方式自动完成

在每次自动完成的请求中，我们都希望API可能生成三个不同的句子。这些句子将呈现给终端用户，最终用户将在三者中选择一个。这是设计的重要部分，API必须反映这一点。这三个句子应该同时出现，每次自动完成后，最好只向服务器发送一个请求。

最简单的方法是使用在后台加载模型的单个worker：

Naïve API

使用这种体系结构，每个请求都将按顺序处理，并且模型将被提示，在响应传入请求之前生成三个不同的句子。

可以通过添加更多工作人员来轻松扩展此基础架构，同时牢记：每个工作人员会根据GPU的使用情况在RAM或VRAM中加载模型。

Multi-worker naïve API

使用这种方法意味着加载模型并对其进行操作的过程，以请求生成三个不同的句子。如果模型能执行批量推理，就可以一次生成三个句子。但是，如果不能执行批量推理，则需要单独生成每个句子——从而导致三次模型迭代。因为批量推断需要一些更具设计性的方法，所以后面将考虑其无法进行的情况。

在计算自动完成的最短响应时间时，最好将这三个迭代并行化。幸运的是，Python使用户可以访问在场景中使用的几个并行化选项：

· 多线程（线程）

· 多进程（子进程或多进程）

· 不同的Web服务器作为一种多处理形式

多线程

传送门：https://docs.python.org/3/library/threading.html

Python中的多线程通常使用线程类来完成，该线程允许程序创建多个线程，每个线程都会继续执行各自的操作。多线程的问题在于Global Interpreter Lock ( GIL ) 在Python中的工作方式。

如果一个线程访问某个模型对象，那么在第一个线程完成处理之前，其他线程无法访问该对象。因为三个迭代将按顺序处理，所以这种方法类似于在执行过程中根本不使用任何线程。唯一的性能差异将是开始或者连接每个线程所花费的额外时间，不利于实现目标。

如果真的想要使用线程，可以将三个不同的模型加载到RAM中，每个单独的线程使用一个模型。但本文并没有选择那样做，下面将做出进一步解释。

多进程

多进程有两种方式：通过启动完全独立的进程并连接到它们的输入或输出（使用子进程模块）（https://docs.python.org/3/library/subprocess.html）或者生成可以继承当前Python解释器进程资源的python进程（使用多进程模块可绕过GIL问题）（https://docs.python.org/3.4/library/multiprocessing.html）。

这里，一个棘手的部分是如何确保模型不必每次计算推理时都加载到RAM中；大型模型需要很长时间才能加载到内存中。

可以选择采用另一种不同的方法。

使用gunicorn负载平衡

该方法的不同之处在于使用gunicorn worker的功能来平行工作。为此，在之前的模型中需添加另一个层。先前定义的体系结构可以接收多个请求，并在几个worker中同时处理这些请求。将此当作优势。最终模型如下。

最终有两个不同型号的Falcon或Gunicorn服务器

当请求从前端APP发送到API时，它将由第一个Web服务器处理。该Web服务器中会有一个运行API的工作程序。此API负责向第二个Web服务器发送三个相同的请求。API发送的请求包含当前上下文（文档中的前一个句子）以及一些有关参数信息（小型或中型模型，特定top_k值等等）。

第二个Web服务器中有多个worker分别处理请求。三个worker将同时分别处理从API收到的各个请求。在API中使用单独线程，以便将请求并行发送到第二个Web服务器而不是顺序发送（HTTP请求 - >没有GIL问题）。

此体系结构具有其他先前提到的方法所不具备的几个优势：

· 可以生成尽可能多的worker，只要模型的数量能适合人类记忆。如果有一个分布式系统，可以将worker分布到不同的GPU中。

· 每个worker在内存中加载一个模型。因此，与每次加载三个模型相比，可能会加载更多模型（更多的计算能力），例如线程方法。

· 作为Web服务器的worker，模型将始终保持在内存中。

· 架构中的每一步都使用了gunicorn的负载平衡。并不是要简单地产生并行运行进程，要想办法确保每个进程处理与其计算能力相关的负载。如果使用两个具有不同计算能力的GPU，而拥有较低计算能力的GPU所造成的瓶颈对另一个GPU的影响不会像在纯多进程程序中那样大。

图2显示了在初始化期间以及向API发送两个并发请求时，体系结构在内存管理方面的表现。

初始化和并发行为

结果

不出所料，与初始顺序系统相比，使用并行系统时，响应时间方面有了很大改进。对一个需要在三个模型迭代中分解的请求进行基准测试，只需三分之一的初始响应时间，实际的本地HTTP请求只需要几百微秒。

该系统特别适用于垂直扩展，因为它能适应系统的内存和计算能力。但是，它不能与可以执行批量推理的模型进行比较，因为这种方法将在内存中存储三个模型，而如果使用批量推理，则只能存储一个模型。

进一步改进

这个系统是为在机器上运行而设计的，所以没有考虑集装箱化或水平扩展。对于需要处理10万用户的完整生产系统而言，这广受欢迎，也必不可少。

另一项改进是使用TorchScript模块。由于在模型中使用了pytorch，所以可以看到它的torchscript版本，在任何编程语言中进行推理。因此，如果想得到最大限度优化，可以用一种非常低级的语言优化一个更好的、更合适的Web服务器。

这个系统已经证明其价值，因为它在4-GPU(K80)机器上运行时，一周之内处理了超过100,000个不同的请求。

我们一起分享AI学习与发展的干货

分享到:

閱讀更多 讀芯術 的文章

關鍵字: 电脑 GPU 设计

App Store推荐的像素编辑器首次限免！

App Store再现疑似涉黄应用苹果涉黄应用并不少见？

App Store违规应用为何屡禁不止？

App Store无法登录和连接，该如何解决？

苹果允许 App 推送促销信息，营销通知推送之后会因此变多吗？

App Store现在在更多国家

我向苹果公司投诉了VIPKid App

苹果 App Store 公布最严新规：禁止一切非官方新冠病毒 App 上架

苹果 App Store 更新规则：不允许游戏娱乐 App 以 COVID-19 疫情为主题

苹果封杀非官方新冠病毒疫情 App

03.06 苹果封杀非官方新冠病毒疫情 App

ofo变身电商导购平台？App Store网友评论已经炸锅

01.09 苹果新闻月活达1亿，App Store假期消费额超14亿美元

12.02 App Store活动：免费领取腾讯视频VIP

11.24 华为应用商店下架微软OneNote App，原因未知

销量超15亿台，APP Store如何上热搜？

App Store上有哪些冷门但逆天的 App？

10.22 App Store终结App黄金时代？

10.18 App store里那些相见恨晚的神器

“APP”是什么？

佰迁易行APP登录IOS App Store

佰迁易行APP重磅登录IOS App Store

音乐App音遇估值超2亿美元，App Store社交榜排第一

“交管12123”APP，最权威的违章查询

拼多多惨遭下架，App Store中其或存在刷榜

09.15 「翼网科技」App Store总是连不上解决方法

苹果终于出手！App Store下架大批违法彩票和赌博类应用

App Store（苹果应用商店）中国区下架大量博彩类App

只用腾讯做的 App，我能活过一周吗？

「干货！」App 优化及海外运营推广要关注哪些核心数据？

苹果公司移动应用商店十周年，App Store成长发展史！

App Store十周年了，你还记得下载的第一个应用吗？

App Store上线十周年，全球游戏收入第一名已经赚了260亿

App Store十年回顾：这些年霸榜下载和畅销榜游戏和应用有哪些

App Store十年里竟赚了你们这么多钱？

App Store十周岁了，腾讯成最大赢家

07.03 APP Store历史上最火的应用都是谁

App Store累计下载量最高的国产应用是它

06.22 App Store被控涉嫌垄断iOS设备应用安装市场

06.08 App Store新增免费试用功能！

06.06 喜大普奔！App Store的付费 App 能免费试用了！

06.03 App Annie：去年2875个iOS应用年营收超100万美元

App Store十周年，2857款应用年营收超过100万美元

06.01 App Store自2010年至今总收入达1300亿美元

App Store自2010年来的总收入达1300亿美元

05.28 App Store应用已下架？教你下回来

登顶 APP store社交APP下载量第一的APP随后又被急速下架是为何？

小米太无耻了。

小米高管不只口嗨了，在国内拳打友商，在国外却开始下跪了。下一步，我猜小米会喊，高通爸爸，人家爱死你了，人家已经五体投地了哟。

蹭热点！说说我理解的手机包装盒事件。

今早醒来刷头条，发现大批米系自媒体铺天盖地发文嘲讽华为系自媒体，忍不住好奇了解了一下情况，原来是刚发布的一加8 海外版手机的手机包装盒上面印了一句话:with easy access to the Google apps you use most.而这句话也印在前段时间发布的小

苹果公司正式发布iPhone SE二代手机

新品名为“iPhoneSE”，拥有跟iPhone 8相似的外观，搭载了苹果当前最新的A13仿生芯片，具备IP67级别防水防尘能力，配备4.7英寸LCD材质屏幕，支持原彩显示，配备了Touch ID指纹识别。

华为河图、麒麟芯片和鸿蒙OS三驾马车并行？华为生态建设布局深远

至于受很多人关注的华为河图全面落地问题，官方有消息称，2020年第二季度会提供100个华为河图测试点，测试点到第四季度会增加至1000个，测试覆盖空间包括智慧园区、旅游景点、高铁站和机场等。

小米高管表示，四千毫安时 5G 手机，和三千多毫安时 4G 手机一样

小米科技高管卢伟冰在近日表示，5G旗舰手机如果5G网络全开，功耗会比4G手机高20%，4000mAh的5G手机大约等于4G手机的3200mAH；今年Redmi坚持把5G手机的容量控制在4500mAh以上，也是考虑到5G网络耗电大的原因，今年很多5G智能手机均采用大电池的设计。

5G画风变了：麒麟985落地首跑，荣耀坐上开往高端的「地铁」

荣耀30Pro/30 Pro+同时搭载麒麟990 5G SoC，相应的其它配置更高：Wi-Fi6+，支持红外遥控，USB 3.0 Type-C接口。

旗舰手机标配Wifi 6 换Wifi 6路由器的时机到了吗？

现在，家庭宽带都在500M左右，大部分手机也不支持Wifi6标准，换Wifi 6无线路由器有点早，因为换了Wifi 6无线路由器网速也不会变快。

2020年5G手机卖不动？继苹果砍单25%之后，华为小米纷纷跟砍？

都说苹果手机卖不动了，可我看想买iPhone手机的人还是那么多，不然之前苹果公司怎么会限购？数据显示，3月份在国内的 iPhone 销量比 2 月份激增 416%，达到约 250 万部。

干翻华为P40系列荣耀30也玩中

而今天的华为发布会上，荣耀30、30 Pro、30 Pro +3个版本中、大、特大杯齐亮相，又一片全新5G SOC，麒麟985也要登场。

程序员辞互联网工作，跨行传统上市公司，上班第1天就蒙了

原来男子是从事互联网工作，后面觉得是互联网寒冬来了，就坚决辞去互联网工作，跨行选择了一个教育传统上市公司，可是第1天上班就蒙了，公司让做的活儿太死板了，没有发挥空间，同事一点都不友善，领导不放权，而且管理线超级单一，氛围一点都不一样，所以想离职。

苹果发布新款iPhoneSE，3299元起售

北京时间4月15日晚，苹果正式发布了新款iPhone SE，搭载了A13仿生芯片，支持最新的iOS 13系统，支持 18W快充，也支持Qi无线充电。SE机型苹果到目前为止只发布了两款，这是iPhone产品体系里小屏和低价的典型机器。

我很纠结：我究竟适不适合做亚马逊电商？看了这三条你就知道了

请仔细阅读，关于跨境电商你想知道的都在这儿

政府对于跨境电商行业的大力支持给咱们广大跨境电商卖家吃了一颗“定心丸”。我们所做的跨境电商事业在一定程度上不再是为个人谋利益，而是成为了中国产品走向世界，为国家赚取外汇的主力军。

骗子手段太“精明”：商家赔了货物又赔款，亚马逊平台骗术大揭秘

在开始文章的干货分享之前，先给大家讲一个商家被用户勒索的案例。有一位朋友刚刚加入亚马逊跨境电商平台两个多月，在这期间有位美国用户在他店铺里面购买了一个毛巾架。

做跨境电商这么多年，今天才知道给国外客户发文件原来这么简单

做过跨境电商朋友肯定知道，很多国外客户对于有些商品看不懂说明书，想索要商品使用视频教程，毕竟视频信息量大，容易理解和快速上手。

值得收藏！三类卖家三种选品方案，总有适合你的一个……

网上很多所谓的“大佬”喜欢吹嘘用某某工具就可以迅速选品效率，迅速取得很高效率等等，其实这类人就是在卖软件，收培训费用…

万万没想到！亚马逊平台上面卖床单竟营收一个亿！你还在等什么？

做店铺这么多年，今天才知道我的listing突然被封，竟是因为……

亚马逊小白看过来！请采纳这些：亚马逊选品和运营的小建议

亚马逊卖家如何爆单？跨境精细化运营攻略必看

不收保证金、入住费、年费，还免三个月佣金，我也想入驻这个平台

咱们今天不说主打欧美市场的亚马逊，只谈一下以东南亚市场为主的Shopee。好多人都听说过，但是没有真正了解过，好多人想加入Shopee但是顾虑重重，今天我来给大家普及一下关于Shopee小秘密。

马云终于要辞职了，留下的话句句触动人心

去年，在教师节这天，阿里巴巴集团创始人马云今天公开信宣布：一年后的阿里巴巴20周年之际，即2019年9月10日，也就是今天，他将不再担任集团董事局主席，却留下句句触动心灵的话！！

等等，明年5G手机将迎来大降价

11月26日下午，联发科技（MediaTek）在深圳举办“联发科技 5G方案发布暨全球合作伙伴大会”，正式发布了全新的5G新芯片品牌——“天玑”，同时带来了首款集成式旗舰级5G移动平台——天玑1000。

微信公开课PRO版2019正在进行时，往届各自都有什么黑科技

微信公开课pro版2019，为期两天微信大会正在广州火热进行中，本次会议主题为：同行WITHUS。微信这一款超级应用，已经深入到我们生活的方方面面，所以这48小时的未来盛宴必将吸引无数眼球。

推出「信任分」升级「闪购」，美团本地生活这盘棋有多大？

小海按：美团的超级App梦想更近了？Tech星球文 | 马微冰陈桥辉头图 | IC Photo王兴曾说，“太多人关注边界，而不关注核心。”

5G我们超越了6G我们也将领先! 美国为什么会害怕失去5G领导地位呢

而且在我们国内和美企中，有相当一部分觉得我们研发不了5G，更特说超越他们了。由于，我们在科技领域一直是，装备一代，研发一代，探索一代。

界读｜华为：帮助英国共渡疫情难关，无端批评令英国蒙受损失

前段时间，英国首相呼吁员工在家办公的第二天，英国网络就出现大面积崩溃现象，不仅无法正常上网，而且电话也不能打、短信也不能发，给用户造成了很大的困扰。

为什么华为今天可以傲视群雄，在世界上立于不败之地？

为什么华为今天可以傲视群雄，在世界上立于不败之地？因为五年内没有人能超过整个5G领域，所以美国人无法超越，为什么？

血战「在线办公」，阿里、腾讯、字节、华为的底牌与大杀器

小海按：前端杀手级应用，后端云服务，在线办公「四小龙」之战开启。本来，在线办公更多的是阿里巴巴的主场。

2020年最强拍照旗舰来了华为P40系列多项业界首创香！

原来华为P40Pro+在上一代P30 Pro潜望式镜头横置长焦镜头模组和感光器件基础之上，进一步采用全新的多反射潜望式光路折叠技术，实现5次反射光路，光程比上一代潜望式长焦提升178%。

今天聊一聊直播

今天聊一聊直播突然谈到这个话题，是因为后知后觉的我，突然发现几乎所有大互联网公司都进军了网络直播行业，或者正在准备进军直播领域。

通过直播赚钱不容易，既要豁得出去，又要端得起来

今天咱们继续聊一聊直播吧当下，像头条、网易、百度等公司，看上去和直播八竿子打不着的公司，也开始涉足直播了。

AI和自动化技术联手，最终会让60%的工人失去现有的饭碗。

并非危言耸听，AI和自动化结合，势必会把数十亿人类踢出劳动力市场，数量巨大的失业工人，将会构成一个规模庞大的新阶级。AI最终会让60%的工人失去现有的饭碗。

这个网还能不能好好上了？今日全球IPv4地址正式耗尽

长期以来，一直令人担心的IPv4地址耗尽的问题，今天这一刻终于发生——所有43亿个IPv4地址已分配完毕，这意味着没有更多的IPv4地址可以分配给ISP和其他大型网络基础设施提供商。

12306系统不行？内行人告诉你它有多牛，阿里腾讯高手去了也膜拜

很多人认为12306系统很不好，之前我也是这么认为的，因为我觉得像双十一这么大流量，阿里都能承受住，为什么12306不行，这其实是误解，12306拥有着神一般的架构设计，平时的压力比淘宝大的多。

有内幕？美国防部授与微软百亿云合同，亚马逊不满发起诉讼

据路透社消息，10月25日，美国防部将高达100亿美元的十年期战略合同授予微软公司，这一举动引起亚马逊的不满。

未来之芯--RISC-V总部从美国迁往瑞士，华为、阿里是其成员

北京时间26日消息，国际开源芯片技术组织RISC-V基金会周一宣布，由于担心美国的贸易限制，计划将总部从美国特拉华州迁往瑞士。该基金会首席执行官卡利丝塔-雷蒙德（Calista Redmond）表示，希望确保美国以外的大学、政府和企业能够帮助开发其开源技术。

神话还能继续吗？几度过山车，比特币半年来首次跌破7000美元

比特币价格今年如同坐上过山车，年初的3000美元到最高13861.9美元，今天跌破7000美元，算是这半年来的最低点了。说起比特币，给人印象最深刻的，莫过于2017年末到2018年初的暴涨了吧。

刘强东卸任后，突然宣布一个“好消息”，让马云措手不及！

苹果的疯狂其实从未停止，AirPower或将重新启航

可是，苹果事实上一直都在推动终端产品进入全面无线时代，所以他们是不太可能在真正意义上放弃这款产品。有外媒称，苹果目前正准备重新启动AirPower项目。

曾保护近4亿中国人的电脑，却因得罪阿里、腾讯，惨遭市场淘汰

曾保护近4亿中国人的电脑，却因得罪阿里、腾讯，惨遭市场淘汰随着网络的不断发展，如何确保网络信息安全成为人们十分重视的问题。

互联网流量需求增大希腊民众“宅生活”考验网速

英国咨询公司Tech4i2报告指出，在疫情期间，希腊的互联网流量需求至少增长50%，但网速仅下降1.2%，而在大多数欧洲国家，网速平均下降了5%-7%。

互联网科技企业，传统办公模式该走向何处?

　　纽约，处于美国疫情震中的城市，工作模式大多是使用公司发放的电脑进行远程办公，而在这之前，部分互联网企业本来默认每周三为在家办公日，所以大家对在线办公可以说驾轻就熟。

微信又悄悄上线一新功能～网友却开始担心

备注后的群聊名称仅自己可见往后再也不用为分清乱糟糟的微信群聊而困扰不过从目前来看只有iOS端上线了这一新功能安卓用户还需要再等等并且此次更新为后台更新无需到AppStore更新即可看到这个新功能该功能上线后网友们纷纷站队但也有网友视野开阔担心起另一件事对于微信新功能群备注你觉得实

正式确认！孙正义退出市值5959亿阿里，20年与马云成就彼此

文：小娜说到孙正义这个名字，我们很多人都知道他是日本软银集团的创始人兼总裁，但他除此之外也有另外的身份，那就是阿里巴巴最大的董事之一。阿里之所以成为今天的阿里，与孙正义的投资是分不开的。当时，马云和孙正义仅仅交谈了五分钟，孙正义当即就决定投资阿里，而且一下就投资2000万美元。

科技添柴“非接触经济”升温

新华社记者王全超摄中国同拉美和加勒比国家举行视频工作会议，就新冠肺炎疫情防控开展交流。亚历山大·培尼亚摄在中国科学技术大学附属第一医院，乘客用“无接触电梯按钮”操作电梯。

好像在哪见过？华为nova7官宣余承东:何必只有一点点

全新iPhoneSE根据此前爆料，此次华为nova7系列将有nova7 SE、nova7和nova7 Pro三个版本，可能会采用“麒麟985+麒麟990”或“麒麟820+麒麟985+麒麟990”两种芯片组合。

行业红利、资本涌入，疫情后的在线教育聚师网如何“涅槃”

2018年，线下培训机构受到了相关部门政策的影响，整体发展势头趋降，然而市场上对于教育的需求却在不断增加，于是，大量学员开始把需求放到了线上，其中，职业教育在这方面的变化尤其明显。

数字货币真的来了？首吃螃蟹者传出，碰一碰功能露脸

苏州相城区政府相关人士对此未予置评，区金融局人士表示“不便答复”，其他多个当地机关单位称尚不知情，央行苏州市中心支行表示“以总行口径为准”，央行总行方面未予确认。新京报记者程维妙陈鹏编辑岳彩周校对薛京宁

实例 | 200 SMART运动控制基本指令详解

C_Dir:表示电机的当前方向信号状态，0 = 正向 1 = 反向。 START:触发开始发脉冲信号，必须要在运动轴空闲时发送一次信号，必须用边沿触发。