在使用Bedrock的时候,有三个参数:
Temperature、Top P(Nucleus Sampling)、Top K 是生成式 AI 模型(如 GPT)在生成文本时常用的采样策略参数,它们用于控制生成的输出文本的多样性和创造性。
这些参数可以帮助模型在生成时的输出,在确定性(生成相同结果的可能性)和随机性(生成更多样的输出)的平衡之间做出选择。
Temperature 参数控制模型生成文本时的随机性。它通过调整生成过程中每个可能的下一个词的概率分布,影响输出的多样化程度。
低温度(接近 0):使生成更加确定,模型更可能选择概率最高的词。也就是说,模型会输出更加保守和常规的内容,随机性较低,创意较少。
高温度:使生成更加随机,模型可能会选择概率较低的词,输出的内容更具创造性和多样性,但也可能更不连贯或“冒险”。
示例:
总结:
Top K 是控制模型生成时只在概率前 K 个最高的候选词中进行采样,而忽略其他较小概率的词。这样可以防止模型选择到一些极端不可能的词,同时保留一定的随机性。
总结:
Top P(又叫 Nucleus Sampling,核采样)是一个更动态的采样策略,它不是固定地选择前 K 个候选词,而是选择累计概率达到 P 的候选词。
相比于 Top K,Top P 更加动态,能够根据每个场景的不同概率分布来确定候选集的大小。它在概率分布非常偏向某些词时,可以收窄采样范围,而在更分散的分布中,允许更多的候选词。
总结:
Temperature = 1 是默认的设置,较为均衡。如果你想要更加确定的输出,可以将其设置为低于 1(例如 0.7);如果你想要更多创造性和多样性的输出,可以将其设置为高于 1(例如 1.2)。
Top K 和 Top P 一般不同时使用,你可以根据需求选择其中一个:
Temperature:
Top K:
Top P:
在调整这些参数时,可以根据生成任务的需求选择不同的组合,以在确定性和随机性之间找到最合适的平衡。
注意:调整这些参数,不会影响模型的延迟性能