微软和中国科学院的研究人员发布一种增强数学推理能力的模型：WizardMath。其性能超越GPT3.5和Google的PaLM-2等模型。他们通过一种名为“Reinforcement Learning from Evol-Instruct Feedback”（RLEIF）的新方法进行微调，提高了Llama-2的数学推理能力。…

发布时间: 2023-08-25 13:40:24

1分

数据加载中

2

1

0

微软和中国科学院的研究人员发布一种增强数学推理能力的模型：WizardMath。

其性能超越GPT3.5和Google的PaLM-2等模型。

他们通过一种名为“Reinforcement Learning from Evol-Instruct Feedback”（RLEIF）的新方法进行微调，提高了Llama-2的数学推理能力。…
IT技术
( twitter.com )

9个月前由小互提交

微软和中国科学院的研究人员发布一种增强数学推理能力的模型：WizardMath。

其性能超越GPT3.5和Google的PaLM-2等模型。

他们通过一种名为“Reinforcement Learning from Evol-Instruct Feedback”（RLEIF）的新方法进行微调，提高了Llama-2的数学推理能力。

在两个数学推理基准测试GSM8k和MATH上，WizardMath展示了远超所有开源LLM的性能，分别提高了+24.8和+9.2。值得注意的是，WizardMath还大大超过了OpenAI的ChatGPT-3.5、Anthropic的Claude Instant-1、Google的PaLM-2等模型。

WizardMath的详细信息和模型权重已在GitHub和Hugging Face上公开。

论文：https://t.co/13sAcOgpoy

GitHub：https://t.co/b2sQUQLzdk

Hugging Face：https://t.co/AzsPjudTlJ

点击图片查看原图

评论加载中...

您可能感兴趣的：更多

1

2

1

1

微软正在将中国最优秀的AI研究雇员迁往加拿大。设在北京和上海的“微软亚洲研究院”是微软在美国之外规模最大的研究机构，1998年开张，现有300多名顶级研究人员，培育了中国互联网业大半壁江山的领军人物（抖音、小米、阿里、联想等）。一…
时政
( twitter.com)

11个月前 • 徒步的骑手 • -- 点击 0 评论

2

2

1

1

中国科学院和工程院公布2023年院士增选候选人名单。中国科学院院士增选候选人583人，中国工程院院士增选候选人655人。在生命科学和医学学部候选人109人中45岁的清华大学颜宁和58岁的中国科学院武汉病毒研究所石正丽（生日1964年5月26日现在59岁）名列其中。美国正等待石正丽国会作证，这回总算找到了。
时政
( twitter.com)

9个月前 • Alex Chen • -- 点击 0 评论

3

2

1

1

在这项针对俄罗斯、中国、印度和美国工科学生学业表现的大规模研究中，研究人员首次跟踪统计了计算机科学和电子工程专业学生在物理、数学和批判性思维能力等方面的进步，并比较4个国家的研究结果。最后研究人员发现：中国学生在经过大学四年的学习…
时政
( twitter.com)

1年前 • twitter机器人 • -- 点击 0 评论

4

2

1

1

金灿荣是人民大学教授和国际关系学院副院长
张维为是复旦大学中国研究院院长和特聘教授
沈逸是复旦大学国际关系和公共事务学院院长和教授
陈平是北京大学国家发展研究院教授以及复旦大学中国研究院研究员…
时政
( twitter.com)

4个月前 • Ignatius Lee 🚁🌋☭⃠ • -- 点击 0 评论

5

2

1

1

昨天加拿大联邦政府公布，为了国家安全，禁止85家中国大学或科研院所与加拿大合作和交流，除了一些和航空航天、国防安全相关的中国教育机构和研究院外，还有以下中国教育机构或研究院上榜，他们是
– 北京计算机科学研究中心
– 北京电子职业科技学院
– 北京理工大学
– 北京邮电大学
–…
时政
( twitter.com)

4个月前 • Petrichor • -- 点击 0 评论

6

2

1

1

请教，他说的是否有道理？
视频【中科院物理所研究员曹则贤：85%的数学和物理都没传到中国】
时政
( twitter.com)

6个月前 • 章立凡 ©️Zhang Lifan💎 • -- 点击 • 下载视频 0 评论

00:00:54

7

2

1

1

这是一个非常强的信号：微软在大陆的研发集团可能要撤。以前微软在大陆是两套结构，一套是微软中国，主要是卖软件，卖服务这种。一套是微软的研发集团。基本上利用中国人力资源，为微软提供研发。微软在中国的营收占微软总营收的2%都不到，但是微…
推特中文圈
( twitter.com)

1年前 • twitter机器人 • -- 点击 0 评论

8

2

1

1

【《细胞》子刊：中国科学家在猪体内培养胚胎人源肾脏28天】中国科学院广州生物医学与健康研究院的研究人员成功制造出包含人细胞和猪细胞的嵌合胚胎。移植到代孕母猪体内28天后，发育中的人源肾脏结构和肾小管形成正常。这是科学家们第一次能够在另一个物种体内培养出一个实体人源器官。
大陆资讯
( www.guancha.cn)

8个月前 • 猪莉夜 • -- 点击 0 评论

9

2

1

1

中国科学院空天信息创新研究院博导李智斌1987-2017航天五院502研究所助理工程师,工程师,高级工程师,研究员,曾不脱产在中国空间技术研究院、清华学习。2017-19参与强干扰下高空飞艇载荷平台基于特征模型的智能自适应控制研究…
推特中文圈
( twitter.com)

1年前 • CPA Jim II • -- 点击 0 评论