网站首页 生活 > 正文
微软的一个人工智能研究人员小组报告称,该公司的 Orca-Math 小语言模型在标准化数学测试中优于其他较大的模型。该小组在arXiv预印本服务器上发表了一篇论文,描述了他们在小学数学 8K (GSM8K) 基准上对 Orca-Math 的测试,以及与知名法学硕士相比的表现。
许多受欢迎的法学硕士(例如 ChatGPT)以其令人印象深刻的会话能力而闻名,但鲜为人知的是,他们中的大多数还可以解决数学应用题。AI 研究人员通过将他们与 GSM8K 进行比较来测试他们执行此类任务的能力,GSM8K 是一个包含 8,500 个小学数学应用题的数据集,需要多步推理才能解决,并附有正确答案。
在这项新研究中,微软的研究团队测试了 Orca-Math,这是微软另一个团队开发的人工智能应用程序,专门用于解决数学应用题,并将结果与更大的人工智能模型进行了比较。
微软在其研究博客文章中指出,ChatGPT 和 Orca-Math 等流行的法学硕士之间存在重大差异。前者是大语言模型,后者是小语言模型——区别在于使用的参数数量;SLM 通常使用数千或几百万,而不是法学硕士使用的数十亿或数万亿。另一个区别是,正如其名称所示,Orca-Math 是专门为解决数学问题而设计的;因此,它不能用于进行对话或回答随机问题。
版权说明: 本文由用户上传,如有侵权请联系删除!
- 上一篇: 一种基于物理的预测工具 可加速电池和超导体研究
- 下一篇: 最后一页
猜你喜欢:
- 2024-03-11 一种基于物理的预测工具 可加速电池和超导体研究
- 2024-03-09 评估缺血性卒中长期溶栓治疗的结果
- 2024-03-08 阻塞性睡眠呼吸暂停与膀胱疼痛/间质性膀胱炎有关
- 2024-03-08 科学家发现遗传性焦虑开关
- 2024-03-07 研究发现许多患有镰状细胞性贫血的孩子缺乏预防护理
- 2024-03-07 放射引导手术可以检测 切除新诊断的前列腺癌患者的转移淋巴结
- 2024-03-06 研究发现机器人辅助胆囊癌手术与传统手术一样有效
- 2024-03-06 利用质谱和深度学习绘制大脑的分子肖像
最新文章:
- 2024-03-11 一种基于物理的预测工具 可加速电池和超导体研究
- 2024-03-11 在英国出售的法拉利 458 有两个方向盘 没有发动机
- 2024-03-11 Rivian 推出了新的电池组
- 2024-03-11 丰田兰德酷路泽普拉多 250 在中国开始生产
- 2024-03-11 备受推崇的车型道奇挑战者已经变得更便宜了
- 2024-03-11 长安经济型轿车迈向新高度
- 2024-03-11 Newtown 住宅凭借优越的地理位置提供奢华生活
- 2024-03-11 租金负担能力跌至有记录以来最差水平
- 2024-03-11 悉尼拍卖:买家为翻新房屋支付更多费用
- 2024-03-11 价值超过 100 万美元的 Frankston 拍卖火爆
- 2024-03-11 随着积极迹象的出现 维多利亚州房地产市场有望在复活节前强劲增长
- 2024-03-10 龙珠创作者鸟山明去世享年68岁留下丰富的游戏遗产
- 2024-03-10 Rivian已收到68,000份R2预订
- 2024-03-10 星际公民团队在Alpha3.23中引入了FPS战斗改进
- 2024-03-10 泄露的iPhone16Pro设计文件显示更大的操作按钮新的拍摄按钮等