中文啦

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

大语言模型(llm):ai“读懂”语言的核心(第11页)

2018年是大语言模型发展的重要一年,Google和OpenAI分别提出了BERT - 1和GPT - 1模型,开启了预训练语言模型时代。BERT是一种双向、3.4亿参数的模型,通过自监督学习对各种非结构化数据进行预训练,能有效理解单词之间的关系,迅速成为自然语言处理任务的首选工具;GPT - 1则基于Transformer架构,通过生成式预训练方式,展现出一定的语言生成能力 。

此后,模型的参数量和性能不断提升。2019年,OpenAI发布GPT - 2,参数量达到15亿;同年,Google发布参数规模为110亿的T5模型。2020年,OpenAI将语言模型参数量扩展到1750亿,发布了GPT - 3,它在多种自然语言处理任务上表现出色,无需针对特定任务进行大量训练,就能完成文本生成、翻译、问答等任务,引发了学术界和工业界的广泛关注 。

(三)能力探索与爆发期:应用拓展与快速发展

从2019年到2022年,研究人员开始深入探索如何在不针对单一任务进行微调的情况下,充分发挥大规模语言模型的能力。2019年,Radford等人使用GPT - 2模型研究了大规模语言模型在零样本情况下的任务处理能力;Brown等人在GPT - 3模型上研究了通过语境学习进行少样本学习的方法,并推出指令微调方案,将大量各类型任务统一为生成式自然语言理解框架,并构造训练语料进行微调 。

2022年,Ouyang等人提出了使用“有监督微调+强化学习”的InstructGPT算法,进一步提升了模型对人类指令的理解和执行能力。同年11月,ChatGPT发布,它通过简单对话框,就能实现问题回答、文稿撰写、代码生成、数学解题等多种功能,让大语言模型真正走进大众视野,引发全球关注和广泛应用。

这章没有结束,请点击下一页继续阅读!

2023年3月,GPT - 4发布,相较于ChatGPT又有明显进步,具备多模态理解能力,在多种基准考试测试上的得分高于88%的应试者。从2022年开始,大模型呈现爆发式增长,各大公司和研究机构纷纷发布自己的大语言模型系统,如Google推出的Bard、百度的文心一言、科大讯飞的星火大模型、智谱ChatGLM、复旦大学MOSS等,在不同领域和场景中得到应用和验证 。

2024年3月18日,马斯克的AI创企xAI正式发布大模型Grok - 1,其参数量达到了3140亿,远超OpenAI GPT - 3.5的1750亿,成为迄今参数量最大的开源大语言模型,遵照Apache 2.0协议开放模型权重和架构,为大语言模型的发展注入新的活力,也推动了开源社区的发展和创新 。

五、大语言模型面临的挑战:前进路上的绊脚石

尽管大语言模型取得了巨大的进展,但在实际应用中,仍然面临着诸多挑战,这些挑战限制了模型的性能和应用范围,也是当前研究人员努力攻克的方向。

(一)“幻觉”问题:生成内容与事实不符

“幻觉”是大语言模型最常见的问题之一,指模型生成的内容看似合理,但与事实不符。比如,当被问到“爱因斯坦获得过几次诺贝尔文学奖”时,模型如果回答“1次”,就出现了“幻觉”,因为爱因斯坦是物理学家,获得的是诺贝尔物理学奖,与文学奖毫无关系 。

这种问题的产生,主要是因为模型基于训练数据中的模式和统计规律生成文本,而非真正理解语义和事实。如果训练数据存在偏差、错误或不完整,模型就可能学到错误的信息,从而在生成文本时产生“幻觉”。此外,模型在处理复杂问题或需要精确知识的场景时,也容易出现“幻觉”,因为它难以准确判断哪些信息是可靠的,哪些是不可靠的 。

(二)逻辑推理能力不足:复杂逻辑判断易出错

虽然大语言模型在语言生成和理解方面表现出色,但在处理复杂逻辑推理问题时,仍然存在明显不足。例如,对于一些需要多步推理、因果关系分析或数学证明的问题,模型可能会得出错误的结论。比如,在解决数学问题“一个数加上5等于10,这个数是多少”时,模型可能会正确回答“5”,但对于更复杂的问题,如“有一个数列,前三个数分别是1、3、6,请问第五个数是多少(该数列规律为相邻两项差值依次为2、3、4……)”,模型可能就无法准确推理出答案“15” 。

这是因为逻辑推理需要对问题进行深入分析、理解和运用规则,而目前的大语言模型主要是基于数据驱动的学习方式,缺乏对逻辑规则的显式表达和推理能力。它们更多地依赖于记忆和模式匹配,而不是真正的逻辑思考,因此在面对复杂逻辑问题时容易出错 。

(三)数据质量与隐私问题:数据是“双刃剑”

大语言模型的训练依赖于海量数据,数据的质量和隐私问题成为不容忽视的挑战。一方面,低质量的数据,如包含错误信息、偏见、重复内容的数据,会影响模型的学习效果,导致模型学到错误的知识或产生偏见。例如,如果训练数据中存在大量对某个特定群体的负面描述,模型可能会学习到这种偏见,并在生成文本时表现出来 。

另一方面,数据隐私也是一个重要问题。训练数据中可能包含用户的个人信息、敏感数据等,如果这些数据在收集、存储和使用过程中没有得到妥善保护,就可能导致数据泄露,侵犯用户隐私。此外,一些数据可能受到版权保护,未经授权使用这些数据进行模型训练,还可能引发法律纠纷 。

(四)计算资源需求巨大:训练成本高昂

热门小说推荐
所有大佬我都渣过

所有大佬我都渣过

花潮做任务的时候浪过了头,由于被渣的男主们怨念太深,花潮完成任务后被强大的怨念强制拉回了原来的世界。 浪过头的花潮瑟瑟发抖。 直到他面对一个个令他生不如死痛不欲生的修罗场时这才后知后觉 ——这些世界里的每一个大佬他都渣过!!! 这是怎样一种令人绝望的体验!!! 1.世界一欺师灭祖的孽徒(已完成): 师尊尊提着剑非常温柔的说道:“乖徒儿,把眼睛闭上。” 花潮被吓得声音都抖了,他结结巴巴道:“闭...闭眼做什么?” 师尊温温柔柔:闭上眼睛的话不会太疼。 花潮膝盖一软:师...师尊要干什么? 霜华剑半截剑身出鞘,闻寄语还是温温柔柔的笑着:“自然是毁掉徒儿的脸,助徒儿了却这一段段情缘啊。” 花潮:“.....” 2.世界二逢男拉瓜的明星(已完成): 被影帝逼到墙角,笼罩在他阴影里的小明星在他的逼迫下湿了眼眶。 影帝在他的额头上落下一吻,眼眸是不正常的赤红,脸上是怜惜与疯狂交织。 他在花潮耳边轻轻说道:“弟弟如果逃,哥哥就会打断你的腿,然后养弟弟一辈子。” 花潮:我当时害怕极了! 3.祸乱宫闱的男妃(已完成): 4.骑驴找马的绿茶(已完成): 机关算尽的狐妖 蛇蝎心肠的白莲 两面三刀的表砸 又怂又浪的小攻×偏执阴鸷的小受 每天下午晚9:00更新~ ps:①每篇文风格都不太可能一样,若是触及雷点请及时点叉,有女装攻、双性攻预警 ②古代世界都很凶险,小攻不死也要脱层皮 ③有虐攻身虐受心的情节,当然虐受身的情节也不会少。 ④超级超级容易心软掉泪的男孩子和女孩子看文之前记得拿好小手帕,害怕的时候记得蒙上眼睛 ⑤炮灰非常多,小攻一方的炮灰超级多,小受一方的炮灰也很多。 ⑥人物性格不代表作者性格,请大家不要人参攻击,作者菌是社会主义好青年...

94年代工程师

94年代工程师

重回1994年,李耀雨站在沪市机械制造总厂办公楼前。在“欢迎高级知识分子进厂”的条幅下,留退休的老干部们已经开始载歌载舞、敲锣打鼓的欢迎新职工。很多职工家属也来凑热闹,这可是挑选女婿的好机会。在这批新职工中,气质斐然的李耀雨成了大姨大妈们的重点关注目标。此刻,他脑海中浮现出系统面板:主线任务:1、入职:成功入职沪市机械制造总厂成功奖励:1、十倍薪资2、对异性吸引小幅增加3、技能:ERP企业资源计划倒计时间:1天已获福利:薪资1.0倍加成天赋:工艺编制技能:网络计划技术...

万族唯尊

万族唯尊

(不后宫,不套路,不无敌,不系统,脑洞文,爽不爽看作者智商┐( ̄ヮ ̄)┌)有人说,大道艰难,关关险阻,且行且停…夏闲来,人间无路,天阶可铸,大道无阻!天地间有道,人世间无路,就让这经验主义世界感受感受现代人带来的震撼!天赋不够好?那就是功法有问题!看我读万卷书,自创科学功法!战力不够高?万族各有天赋异能?那就拿来吧......

小翻译讨薪记

小翻译讨薪记

毕业即失业,最惨的是还被骗了稿费。 文佳轩从此踏上漫漫讨薪路,原以为能追回血汗钱,却未曾想沦为了大魔头的贴身奴隶。 - 文佳轩:还钱! 武泽昊:要钱?先干活。 文佳轩:老板,我活干完了。 武泽昊:乖,去暖床。 文佳轩:? - 一句话简介: 憨憨天然撩人不自知,主编强势出手教做人 - 雅痞/工作狂/主编x憨憨/打工仔/翻译 1v1,he,日更 小受真的很憨,不吃的人莫要勉强...

到第九区去

到第九区去

到第九区去情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的都市言情小说,到第九区去-宙火-小说旗免费提供到第九区去最新清爽干净的文字章节在线阅读和TXT下载。...

恶女她哪来的良心

恶女她哪来的良心

恶女她哪来的良心情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,恶女她哪来的良心-行令-小说旗免费提供恶女她哪来的良心最新清爽干净的文字章节在线阅读和TXT下载。...