大语言模型中的涌现现象是不是伪科学?_通讯
Datawhale干货
作者:平凡@知乎,诺桑比亚大学,在读博士
今天晚上,花了一点儿时间看了两篇文章:
【资料图】
《Emergent Abilities of Large Language Models》[1]
《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]
这两篇讲的都是emergent behavior,即涌现现象。
大规模神经网络下的涌现现象在机器学习中使用大规模神经网络时,由于增加了参数数量、训练数据或训练步骤等因素,出现了定性上的新能力和性质,这些能力和性质在小规模神经网络中往往是不存在的。
第一篇文章举了这个例子,每个图都可以理解为一个任务,横轴是神经网络的规模,而纵轴是准确率,可以理解为模型的性能。
我们拿图一来看,在10的22次方前,这些模型基本上的性能基本上都很稳定在0附近,而在10的22以后,突然在10的24次方上获得了很大的性能提升,在其他的几个任务上都表现出类似的特征。
意想不到的效果第二篇文章更是有趣,我直接把推特一位博主的评论引用在这里:
作者发现,当我们训练用网络计算同余加法 a+b = ? (mod c) 时,网络在某个时间突然获得了 100% 准确率。分析发现,神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法!这个算法可以证明是正确的, 反人类直觉的。
从这俩例子里面我的感受是,只要数据量足够且真实,且模型没有硬错误的前提下,不断的训练说不定真的能够产生一些意想不到的效果。
还有就是我觉得人类现在积累的知识并不少,但是系统的少,零星的多,如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话,我觉得有很大概率会让它涌现出意想不到的能力。
甚至可能把人类的生产力解放提前很多。
参考
1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf标签:
大语言模型中的涌现现象是不是伪科学?_通讯
2023-04-08
今年底石家庄市将实现紧密型县域医共体全覆盖
2023-04-08
外交部:美国的网络窃密行径是对全球网络空间的最大威胁 天天即时看
2023-04-07
海汽集团:2022年归母净利润3923.89万元,同比扭亏,完成客运量下降33.37%
2023-04-07
远达环保首个新能源参股项目实现全容量并网
2023-04-07
网贷通不过怎么借款?
2023-04-07
到2030年,北海石油产量可能下降80%
2023-04-07
新竹高于旧竹枝全凭老干为扶持类似诗句_新竹高于旧竹枝全凭老干为扶持
2023-04-07
美国研究生材料工程专业大学排名(前20):MIT位居榜首!
2023-04-07
如何从聚酯上去除丝印_送女朋友礼物选什么好-世界时快讯
2023-04-07
今年底石家庄市将实现紧密型县域医共体全覆盖
外交部:美国的网络窃密行径是对全球网络空间的最大威胁 天天即时看
海汽集团:2022年归母净利润3923.89万元,同比扭亏,完成客运量下降33.37%
远达环保首个新能源参股项目实现全容量并网
网贷通不过怎么借款?
到2030年,北海石油产量可能下降80%
新竹高于旧竹枝全凭老干为扶持类似诗句_新竹高于旧竹枝全凭老干为扶持
美国研究生材料工程专业大学排名(前20):MIT位居榜首!
如何从聚酯上去除丝印_送女朋友礼物选什么好-世界时快讯
微资讯!天津养老保险关系转移接续有哪些新的变化?
锌下游需求弱复苏 镍低库存尚有支撑 全球观热点
【全球新视野】正安县中观镇21户农户土地流转费有着落
前沿热点:你知道葛译鸿吗?有关葛译鸿的相关内容介绍
前沿热点:火影动画和漫画的矛盾,宇智波富岳人有力量后,还会坐以待毙吗?
宋代临济禅发展演变
世界观点:台州2023年度国有建设用地供应计划总量约1.18万亩 宅地占50.3%
世界关注:现在是启动“五月卖出”市场策略的时候吗?
实时:微信朋友圈如何发送链接?微信朋友圈发链接图文操作步骤
4月6日国泰君安创新医药混合发起净值上涨0.44%
融创中国2023年前3个月实现合同销售金额约292.7亿元
重磅!特斯拉Model 3/Y将换装75kWh铁电池 世界百事通
每日热讯!不执行政府定价和政府指导价 北京通州“孝安堂”被处罚
环球滚动:2022中级经济师(补考)《经济基础》各章节知识点
甲基丙烯酸异冰片酯商品报价动态(2023-04-06)
斯诺克世锦赛资格赛:中国选手首轮无人过关 5人出战第二轮
视讯!高惠美喜欢谁_高惠美
每日热点:四川省总工会称员工怒怼领导事发去年,相关部门在调查
曾铭宗:缺蛋两年多 陈吉仲应该滚蛋|观焦点
焦点速递!贵州毕节百里杜鹃次第开 繁花似锦醉游人
- 金融服务方便边远地区农牧民
- “大手牵小手”,助力中小企业数字化 世界最新
- 山花烂漫吕梁山
- 当前热讯:自知之明的意思解释_自知之明的意思是什么
- 属羊今年什么多少岁了,属马多少岁今年2022
- 七夕节该送儿童什么礼物
- 做大增量加快创新 银行竞逐绿色金融赛道
- 每日观察!4月06日00时海南屯昌疫情新增确诊数及屯昌最近疫情最新消息数据
- 心愿
- 动视暴雪面临美国司法部关于电竞薪酬的反垄断诉讼,寻求达成和解
- ChatGPT概念股爆炒要结束了? 热议
- 鸿路钢构:一季度新签销售合同额同比增长20% 焦点热讯
- 蒙蒂:沙梅特的作用不仅仅是投三分 他的防守能力也是球队所需_天天快消息
- 陈鹤一个人资料身高(陈鹤一个人资料) 看点
- 焦点热讯:临安到萧山机场大巴需要多长时间-临安到萧山机场大巴时刻表
- 全球短讯!记者回访问题点位 整治较好效果明显
- 4月4日基金净值:华夏蓝筹混合(LOF)A最新净值1.613,跌2.54%
- 青海先心病患儿游览南京
- 女的处对象送啥-天天观察
- 苹果天气崩了一天了,您的恢复了吗?-环球新视野
- 世界今日报丨人参果怎么种植?
- 西城街道:“党建红”引领“环境绿” 聚力共建现代社区 世界快播报
- 万事利(301066.SZ)终止向不特定对象发行可转债事项_天天热头条
- 天天精选!官方回应田间地头安装大电视具体详细内容是什么
- 每日报道:火影:五句平凡的话却蕴藏泪点,这就是火影的魅力!
- 便捷可及!上海打造15分钟养老服务圈_天天观天下
- 杭温铁路建设忙 前沿热点
- 中国留学生警惕!两地大使馆紧急发文
- 【世界快播报】西媒:西甲4月19日将召开特别会议,审查巴萨裁判门事件
- 谁才是真正的懂生活?看天朗长安就行了|环球即时
- 守护碧水展新姿②|岳游岳有味:江豚湾的蝶变
- 世界讯息:王诗龄换新发型美翻天!穿学院风变校花脸,王岳伦也终于变帅了
- 世界热头条丨商界领袖联名呼吁暂停ChatGPT等强大人工智能的开发速度
- 春季天气为何复杂多变?-全球看热讯
- 世界观天下!俄逮捕一名圣彼得堡咖啡馆爆炸案嫌疑人
- 大连航标处辖区2023春季换标作业正式启动_热点
- 天天快资讯丨过敏性鼻炎可以彻底根治吗?治疗原则都有哪些?
- Bard还考不上哈佛?谷歌CEO劈柴预告它即将开挂,数学逻辑能力飙升
- 美国前总统特朗普已抵达纽约曼哈顿-全球要闻
- 全球微头条丨俏妃卫生巾专卖店_俏妃卫生巾
- 没有前途的工作,会让自己变平庸,遇到这四种工作,要学会远离_天天速看
- 全球最资讯丨中国男篮主帅乔尔杰维奇现场观战辽宁vs广州
- 拖欠工资、门店关闭 网红品牌虎头局疑似破产冲上热搜
- 清明前后,是养生“黄金时节”!做到这三点,很重要→_今日播报
- 讯息:国家京剧院解全国院团武戏之困,“全国京剧武戏人才培养班”四部大戏结业汇报
- 爱情电影《不能错过的只有你》热映中,现实困境引发强烈共鸣
- 全球要闻:意甲综合 | AC米兰大胜那不勒斯 升至积分榜第三
- 天天新资讯:晋祠胜境 春色正好
- 狂烧20小时!“仍未被完全扑灭”_世界热推荐
- 期货挂单有效时间_期货中的挂单什么意思