标签：得罪

苹果论文引发大模型争议：质疑Transformer推理能力，LLM前景堪忧

划重点 01苹果研究者发现无论是OpenAI GPT-4o和o1，还是Llama、Phi、Gemma和Mistral等开源模型，均未被发现任何形式推理的证据，而更像是复杂的模式匹配器。 02为此，苹果研究者开发了一个名为GSM-Symbolic的数据集，用于客观评价LLM的数学能力极限。 03实验...