Python LLM - 搜索 News

12 天

LLM-in-Sandbox：给大模型一台电脑，激发通用智能体能力

LLM-in-Sandbox 提出了一个简洁而有效的范式：通过给大模型提供一台虚拟电脑，让其自由探索来完成任务。实验表明，这一范式能够显著提升模型在非代码领域的表现，且无需额外训练。研究者认为， LLM-in-Sandbox 应当成为大模型的默认部署范式，取代纯 LLM 推理。当沙盒可以带来显著的性能提升，并且部署成本几乎可以忽略不计时，为什么还要用纯 LLM？

腾讯网

用 PyTorch 实现 LLM-JEPA：不预测 token，预测嵌入

点击上方“Deephub Imba”,关注公众号,好文章不错过 !这篇文章从头实现 LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Architectures。需要说明的是，这里写的是一个简洁的最小化训练脚本，目标是了解 JEPA 的本质：对同一文本创建两个视图，预测被遮蔽片段的嵌入，用表示对齐损失来训练。本文的目标是 ...

腾讯网

从零开始200行python代码实现LLM

大语言模型（LLM）很火，讨论的文章铺天盖地，但对于没有机器学习背景的人来说，看多了只是粗浅了解了一堆概念，疑惑只增不减。本文尝试从零开始，用python实现一个极简但完整的大语言模型，在过程中把各种概念“具象化”，让大家亲眼看到、亲手写出 ...

36氪

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

让LLM能够通过模仿图灵机的方式解决算术问题、掌握运算符的计算逻辑。本文来自南京大学计算机学院软件研究所，聚焦于 ...

10 天

你的 AI 编程助手太贵太慢？这篇 ShortCoder 论文给出了代码生成“瘦身 ...

这意味着在推理阶段，用户只需要提供问题描述，不需要任何关于简化规则的额外提示，模型就能自动生成既正确又简洁的代码。特别值得注意的是：ShortCoder的pass@100得分（0.967）超越了当前最先进的DeepSeek-Coder-6… ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果