不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyun ......
调研180多篇论文,这篇综述终于把大模型做算法设计理清了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyun ......
研究人员阐明语言模型在不同算术场景中的泛化机制,可指导大模型训练优化
尽管大语言模型已经在许多任务中表现出色,但它们在超出训练集分布泛化方面的能力仍然未被充分理解。例如,在自然语言处理中,大语言模型在某些泛化任务中的确表现优异,但在其他任务中可能会产生事实性错误或误导性信息。近日,上海人工智能实验室徐兴成研究员与包括上 ......
解释器模型首创!Tilde打破提示工程局限,让AI推理更精准
新智元报道编辑:静音【新智元导读】一家总部位于美国加州的初创公司Tilde,正在构建解释器模型,解读模型的推理过程,并通过引导采样动态调整生成策略,提升大语言模型的推理能力和生成精度。相比直接优化提示的提示工程,这一方法展现出更灵活高效的潜力,有望重塑AI ......
马修·杰克逊:面对AI,没有什么工作是永远安全的
自从2016年,人工智能围棋机器人“阿尔法狗” (AlphaGo) 打败围棋世界冠军李世石之后,AI是否会取代人类的追问此起彼伏。一种比较有代表性的否定观点认为,这些无情的机器,永远无法像人一样理解人的情感。但在2024年,多项科学实验表明,事实可能并非如此。研究大语言 ......