Nemotron-4-340B-Instruct

Nemotron-4-340B-Instruct

大型语言模型
对话系统
国外精选

Nemotron-4-340B-Instruct是由NVIDIA开发的大型语言模型(LLM),专为英文单轮和多轮对话场景优化。该模型支持4096个token的上下文长度,经过监督式微调(SFT)、直接偏好优化(DPO)和奖励感知偏好优化(RPO)等额外的对齐步骤。模型在约20K人工标注数据的基础上,通过合成数据生成管道合成了超过98%的用于监督微调和偏好微调的数据。这使得模型在人类对话偏好、数学推理、编码和指令遵循方面表现良好,并且能够为多种用例生成高质量的合成数据。

需求人群:

"Nemotron-4-340B-Instruct模型面向需要构建或定制大型语言模型的开发者和企业。它特别适合于那些需要在英文对话、数学推理、编程指导等领域应用AI技术的用户。"

使用场景示例:

用于生成训练数据,帮助开发者训练定制化的对话系统。

在数学问题解答领域,提供准确的逻辑推理和解答生成。

辅助编程人员快速理解代码逻辑,提供编程指导和代码生成。

浏览量:11

s1785318098921236

打开站点

类似应用