中文啦

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

openai:从“会聊天的机器人”到改变世界的公司(第3页)

这些数据从哪来?主要有三个渠道:

- 公开的网站:比如维基百科、百度百科、各种新闻网站、博客(只要是没加密、能公开看的文字,都会被收集);

- 书籍和论文:比如图书馆里的经典书籍、学术数据库里的论文(当然,会避开有版权的内容,或者跟版权方合作);

本小章还未完,请点击下一页继续阅读后面精彩内容!

- 对话数据:比如以前人们和其他AI聊天的记录、公开的论坛对话(比如 Reddit 上的帖子),用来教AI“怎么聊天”。

收集来的数据有多少?说出来你可能不信:训练GPT-3(ChatGPT的前一代)时,用了大概45TB的数据——相当于把10万部电影的文字内容,或者1000亿页小说,全部塞进AI的“大脑”里。

但这些数据不是“直接用”的,还得“洗菜”:比如去掉脏话、错误信息(比如“地球是平的”这种谣言)、重复内容(比如网上反复转载的同一篇文章),不然AI学了坏东西,就会“说胡话”。这一步很枯燥,但很重要——就像你买菜回来,得把烂叶子摘掉、把泥土洗干净,不然做出来的饭会难吃。

第二步:“做饭”——用超级电脑“炒”出AI模型

食材准备好,接下来就是“做饭”——这一步是OpenAI最核心的技术,也是最烧钱的地方。

这里的“锅”,就是“超级电脑”:OpenAI用的是微软Azure的云服务器,里面有上万颗“GPU芯片”(相当于电脑的“大脑”)。这些芯片同时工作,才能处理几十TB的数据——你可以理解成“用1000口锅同时炒菜”,速度快,但电费和硬件费也贵得吓人。

这里的“菜谱”,就是“算法”:简单说,就是告诉AI“怎么从数据里学知识”。比如,AI看到“猫”这个词,算法会让它记住“猫有四条腿、会喵喵叫、喜欢吃鱼”;看到“今天天气很好,我想去公园”这句话,算法会让它明白“‘天气好’是‘去公园’的原因”——相当于教AI“怎么理解文字的意思,怎么组织语言”。

这个“做饭”的过程,叫“训练模型”。训练一次GPT-3,大概要花几个星期,电费就得几千万美金;训练GPT-4,成本更高,有人估算得几亿美金——这也是为啥只有微软这样的大公司,才能撑得起OpenAI的研发。

而且“做饭”不是一次就能成功的:比如第一次训练出来的AI,可能会“答非所问”(你问“今天吃啥”,它答“地球是圆的”),这时候工程师就得调整“菜谱”(改算法),再重新“炒一次”(重新训练),有时候得反复几十次,才能让AI“说话正常”。

第三步:“试吃”——让人类教AI“怎么说话更得体”

饭做好了,得有人试吃,看看咸不咸、辣不辣;AI训练好了,也得有人“试聊”,教它“怎么说话更得体”——这一步叫“人类反馈强化学习(RLHF)”,说穿了就是“让人类当AI的老师”。

具体怎么做?OpenAI会找一群“标注员”(普通人也能做,只要通过考核),让他们跟AI聊天,然后给AI的回答打分:

- 如果AI回答得好(比如你问“怎么缓解焦虑”,AI说“可以试试深呼吸、听音乐,要是严重的话建议看医生”),就给高分;

- 如果AI回答得不好(比如你问“怎么缓解焦虑”,AI说“别焦虑,焦虑没用”),就给低分,还得告诉AI“为啥不好,应该怎么改”。

然后OpenAI会把这些“打分数据”再喂给AI,让AI学习“什么样的回答更受欢迎”——相当于你试吃后说“太咸了,下次少放盐”,厨师下次就会调整。

热门小说推荐
所有大佬我都渣过

所有大佬我都渣过

花潮做任务的时候浪过了头,由于被渣的男主们怨念太深,花潮完成任务后被强大的怨念强制拉回了原来的世界。 浪过头的花潮瑟瑟发抖。 直到他面对一个个令他生不如死痛不欲生的修罗场时这才后知后觉 ——这些世界里的每一个大佬他都渣过!!! 这是怎样一种令人绝望的体验!!! 1.世界一欺师灭祖的孽徒(已完成): 师尊尊提着剑非常温柔的说道:“乖徒儿,把眼睛闭上。” 花潮被吓得声音都抖了,他结结巴巴道:“闭...闭眼做什么?” 师尊温温柔柔:闭上眼睛的话不会太疼。 花潮膝盖一软:师...师尊要干什么? 霜华剑半截剑身出鞘,闻寄语还是温温柔柔的笑着:“自然是毁掉徒儿的脸,助徒儿了却这一段段情缘啊。” 花潮:“.....” 2.世界二逢男拉瓜的明星(已完成): 被影帝逼到墙角,笼罩在他阴影里的小明星在他的逼迫下湿了眼眶。 影帝在他的额头上落下一吻,眼眸是不正常的赤红,脸上是怜惜与疯狂交织。 他在花潮耳边轻轻说道:“弟弟如果逃,哥哥就会打断你的腿,然后养弟弟一辈子。” 花潮:我当时害怕极了! 3.祸乱宫闱的男妃(已完成): 4.骑驴找马的绿茶(已完成): 机关算尽的狐妖 蛇蝎心肠的白莲 两面三刀的表砸 又怂又浪的小攻×偏执阴鸷的小受 每天下午晚9:00更新~ ps:①每篇文风格都不太可能一样,若是触及雷点请及时点叉,有女装攻、双性攻预警 ②古代世界都很凶险,小攻不死也要脱层皮 ③有虐攻身虐受心的情节,当然虐受身的情节也不会少。 ④超级超级容易心软掉泪的男孩子和女孩子看文之前记得拿好小手帕,害怕的时候记得蒙上眼睛 ⑤炮灰非常多,小攻一方的炮灰超级多,小受一方的炮灰也很多。 ⑥人物性格不代表作者性格,请大家不要人参攻击,作者菌是社会主义好青年...

94年代工程师

94年代工程师

重回1994年,李耀雨站在沪市机械制造总厂办公楼前。在“欢迎高级知识分子进厂”的条幅下,留退休的老干部们已经开始载歌载舞、敲锣打鼓的欢迎新职工。很多职工家属也来凑热闹,这可是挑选女婿的好机会。在这批新职工中,气质斐然的李耀雨成了大姨大妈们的重点关注目标。此刻,他脑海中浮现出系统面板:主线任务:1、入职:成功入职沪市机械制造总厂成功奖励:1、十倍薪资2、对异性吸引小幅增加3、技能:ERP企业资源计划倒计时间:1天已获福利:薪资1.0倍加成天赋:工艺编制技能:网络计划技术...

万族唯尊

万族唯尊

(不后宫,不套路,不无敌,不系统,脑洞文,爽不爽看作者智商┐( ̄ヮ ̄)┌)有人说,大道艰难,关关险阻,且行且停…夏闲来,人间无路,天阶可铸,大道无阻!天地间有道,人世间无路,就让这经验主义世界感受感受现代人带来的震撼!天赋不够好?那就是功法有问题!看我读万卷书,自创科学功法!战力不够高?万族各有天赋异能?那就拿来吧......

小翻译讨薪记

小翻译讨薪记

毕业即失业,最惨的是还被骗了稿费。 文佳轩从此踏上漫漫讨薪路,原以为能追回血汗钱,却未曾想沦为了大魔头的贴身奴隶。 - 文佳轩:还钱! 武泽昊:要钱?先干活。 文佳轩:老板,我活干完了。 武泽昊:乖,去暖床。 文佳轩:? - 一句话简介: 憨憨天然撩人不自知,主编强势出手教做人 - 雅痞/工作狂/主编x憨憨/打工仔/翻译 1v1,he,日更 小受真的很憨,不吃的人莫要勉强...

到第九区去

到第九区去

到第九区去情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的都市言情小说,到第九区去-宙火-小说旗免费提供到第九区去最新清爽干净的文字章节在线阅读和TXT下载。...

恶女她哪来的良心

恶女她哪来的良心

恶女她哪来的良心情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,恶女她哪来的良心-行令-小说旗免费提供恶女她哪来的良心最新清爽干净的文字章节在线阅读和TXT下载。...