AI模型为什么越来越大?聊聊规模法则 Scaling Laws (Chinchilla)

Поделиться
HTML-код
  • Опубликовано: 25 окт 2024
  • 论文1:Scaling Laws for Neural Language Models
    论文2:Training Compute-Optimal Large Language Models

Комментарии • 2

  • @hankdonald7812
    @hankdonald7812 3 месяца назад

    现在的LLM已经这么大了,怎么我还是觉得LLM的输出错误百出,各种Hallucination

    • @ML_tired
      @ML_tired  3 месяца назад

      感觉现有LLM对应于人脑的直觉(比较底层),其实已经远超人类这部分智能了。但,人脑应该还有更高层的智能设计,来应对rarely happened events