微软推出了一个专门用于评估大语言模型的整合性工具库：PromptBench提供了一系列工具，包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击（即测试模型对恶意输入的抵抗力）等。以支持研究人员从不同方面对LLMs进行评估和分析。主要特点和功能：…

发布时间: 2023-12-26 17:40:24

1分

数据加载中

2

1

0

微软推出了一个专门用于评估大语言模型的整合性工具库：PromptBench
提供了一系列工具，包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击（即测试模型对恶意输入的抵抗力）等。
以支持研究人员从不同方面对LLMs进行评估和分析。
主要特点和功能：…
IT技术
( twitter.com )

4个月前由小互提交

微软推出了一个专门用于评估大语言模型的整合性工具库：PromptBench

提供了一系列工具，包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击（即测试模型对恶意输入的抵抗力）等。

以支持研究人员从不同方面对LLMs进行评估和分析。

主要特点和功能：

1、支持多种模型和任务：能够评估多种不同的大语言模型，如GPT-4，以及多种任务，比如情感分析、语法检查等。

2、多种评估方式：提供标准评估、动态评估和语义评估等不同的评估方法，以全面测试模型的性能。

3、提示工程：实现了多种提示工程方法，例如：少量样本的思维链（Few-shot Chain-of-Thought）、情感提示（Emotion Prompt）、专家提示（Expert Prompting）等。

4、对抗性测试：集成了多种对抗性测试方法，用于检测模型对于恶意输入的反应和抵抗力。

5、分析工具：包括用于解释评估结果的分析工具，如可视化分析和词频分析。

6、易于使用：提供了一个界面，允许快速构建模型、加载数据集，并评估模型性能。可以通过简单的命令安装和使用，方便研究人员构建和运行评估管道。

7、支持的数据集和模型：支持多种数据集和模型，包括GLUE、MMLU、SQuAD V2、IWSLT 2017等。

8、支持的模型：

google/flan-t5-large
databricks/dolly-v1-6b
Llama2 series
vicuna-13b, vicuna-13b-v1.3
Cerebras/Cerebras-GPT-13B
EleutherAI/gpt-neox-20b
Google/flan-ul2
PaLM 2
ChatGPT
GPT-4
phi-1.5, phi-2
Gemini Pro

GitHub：https://t.co/PjvVBUe1a2
论文：https://t.co/8FoEq0ul6T

点击图片查看原图

评论加载中...

您可能感兴趣的：更多

1

2

1

1

LLaMA-Factory：羊驼工厂，简化大语言模型的微调
通过提供一个易于操作的Web界面，LLaMA-Factory允许用户在浏览器中直接进行模型的训练、评估和推理，无需复杂的命令行操作。
LLaMA-Factory预集成了多种流行的大型语言模型，包括LLaMA、BLOOM、Mistral、Baichuan、Qwen和ChatGLM。…
IT技术
( twitter.com)

6个月前 • 小互 • -- 点击 • 下载视频 0 评论

00:02:38

2

2

1

1

Google提出AudioPaLM：一个可以说话和听的大型语言模型。

论文页面：

我们介绍了AudioPaLM，这是一个用于语音理解和生成的大型语言模型。AudioPaLM将基于文…
IT技术
( twitter.com)

10个月前 • 宝玉 • -- 点击 0 评论

3

2

1

1

终于有人做这个事情了，专门用来生成Midjourney提示词的语言模型。

老哥收集了很多提示词微调了一个开源语言模型用来生成提示词。原推有试用链接。
我自己试了一下，要求是生成一张龙与地下城风格的照片。左边是没有优化的提示词，右…
推特中文圈
( twitter.com)

1年前 • 歸藏 • -- 点击 0 评论

4

2

1

1

大语言模型微调之道1——介绍

#大语言模型微调之道

欢迎来到由Sharon Zhou主讲的《大语言模型微调之道》课程。这门课程将教你如何在自己的数据上进一步训练开源LLM。

虽然你可能已经知道如何提示一个大语言模型，但这门课程会深入讲解另一个重要工具：微调。…
IT技术
( twitter.com)

8个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:02:59

5

2

1

1

推荐阅读：《深入了解大语言模型运维 (LLMOps) [译]》
这篇文章 5 月份的，但并没有过时，对于大语言模型的运维(LLMOps)讲的非常系统。
随着大语言模型的普及，未来的 Ops 肯定离不开 LLMOps ，甚至于需要专门的团队做 LLMOps。
文章中把 LLMOps 分成了几个关键步骤：
第 1 步：选择基础模型…
IT技术
( twitter.com)

4个月前 • 宝玉 • -- 点击 0 评论

6

2

1

1

大语言模型微调之道2——为什么要微调

#大语言模型微调之道

欢迎来到由Sharon Zhou主讲的《大语言模型微调之道》课程。这门课程将教你如何在自己的数据上进一步训练开源LLM。

这视频中，我们探讨了为什么要微调大语言模型（LLM）。…
IT技术
( twitter.com)

8个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:14:35

7

2

1

1

微软刚刚发布了多模态大语言模型的论文：Language Is Not All You Need

模型命名为：MOSMOS-1

论文地址：
图片
( arxiv.org)

1年前 • Jiayuan • -- 点击 0 评论

8

2

1

1

这下模型训练没有了版权和训练数据顾虑了🤓
微软研究团队最新成果：他们已经开始使用【合成数据】来训练AI模型了。
微软使用大语言模型生成了近100种语言、数十万个文本嵌入任务的“模拟”文本数据，然后用这些数据来训练 AI 。
这大幅度降低了训练成本，提高了效率，同时还减少了模型的偏见。…
IT技术
( twitter.com)

4个月前 • 小互 • -- 点击 0 评论

9

2

1

1

太牛逼了 !! 这份微调过的中文法律大语言模型，在普法同时，是份绝佳的 ChatGLM 微调指南
你可以看到完整的数据集准备，一步步喂给 ChatGLM 作出更专业的模型来。
是的，AI 写文，专业的微调 (fine tuning),
IT技术
( github.com)

25天前 • 黄赟 • -- 点击 0 评论