我要投稿

Karpathy 再次语出惊人：LLM 时代，PyTorch 之流的软件抽象都将成为历史

发布日期：2024-10-07 14:54:50 浏览次数： 2480

作者：AI寒武纪

微信搜一搜，关注“AI寒武纪”

Andrej Karpathy，这位 OpenAI 创始成员、特斯拉前 AI 总监、斯坦福大学 CS231n 讲师，最近在 GPU MODE 研讨会上发表了一场主题为 “llm.c” 的演讲，再次语出惊人：LLM 时代，Python/PyTorch 之类的软件抽象都将成为历史！ ?

llm.c 是什么？

llm.c 是 Karpathy 用 C 语言（外加一点点 C++）从零开始写的一个 Transformer 训练框架

为什么要写 llm.c？

事情是这样的：一年前，Karpathy 想在他的视频系列（Karpathy非常喜欢分享AI技术）中添加一个关于 LLM 训练的视频，于是他开始用 PyTorch 写代码。结果，他被 PyTorch 的各种抽象概念搞得晕头转向，什么设备、数据类型、编译、分布式…… 各种问题层出不穷，代码出了 bug 都找不到原因！ ?

Karpathy 被折磨得不行，一怒之下决定： “老子自己写一个！” 于是，llm.c 就诞生了！

llm.c 的开发过程：

抛弃 PyTorch 的抽象，直面底层： Karpathy 决定抛弃 PyTorch 提供的各种便捷功能，例如自动微分、设备管理、数据类型转换等等，直接用 C 语言操作数组和指针

逐层移植，确保正确性： Karpathy 首先用 Python 写出每一层的 forward 和 backward 函数，然后将其移植到 C 语言，并与 PyTorch 的实现进行比较，确保结果一致

预先规划内存，提高效率： llm.c 会在程序开始时一次性分配所有内存，避免了动态内存分配的开销，从而提高了运行效率

单文件，无依赖，极致简洁： llm.c 只有一个 C 文件，没有任何外部依赖，编译和运行速度极快，甚至可以在非常低端的硬件上运行

GPU 加速，性能更上一层楼： Karpathy 将 llm.c 移植到了 GPU 上，并使用 cuBLAS 和 cuDNN 等库进行了优化，性能比 PyTorch 还要好！

分布式训练，支持多 GPU 和多节点： llm.c 还支持多 GPU 和多节点训练，可以处理更大规模的数据和模型

开源协作，吸引各路大神： llm.c 采用 MIT 开源协议，吸引了来自世界各地的开发者贡献代码和优化方案

llm.c 的性能：

在 8 张 H100 GPU 的单节点上，llm.c 可以在 24 小时内完成 GPT-2 (16 亿参数) 的训练，成本约为 672 美元

与 PyTorch 相比，llm.c 的内存占用减少了 29%，训练速度提高了 19%，编译和运行速度也更快

Karpathy 的思考：软件抽象的本质

Karpathy 认为， Python、PyTorch 等软件抽象的存在，是因为人类的知识、智力和注意力都是有限的。

随着 AI 能力的不断提升，LLM 或许可以直接为任何应用生成定制的二进制文件（就像 llm.c 一样），从而打破并重构所有软件抽象！

这意味着，未来的软件开发模式可能会发生根本性的改变！ 程序员将不再需要编写 Python 或 C++ 代码，而是直接用 LLM 来生成可执行文件！ ?

Karpathy 的 llm.c 项目，或许就是 AI 驱动软件开发的未来！ ?

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-14

多轮 Agent 场景下，滴滴的 EAGLE-3 训推加速实践

2026-05-06

谁说 Mac 只能写代码？Google 官宣：M 芯片本地微调 Gemma 4 时代开启！

2026-04-20

用 Unsloth 微调 Embedding 模型，让你的 RAG 检索不再答非所问

2026-04-15

ComfyUI v0.19.0 更新：大量新节点、新模型、新修复与性能优化全面落地，工作流与训练能力再升级

2026-04-13

Agent 持续学习落地路径：先做 Traces，再做 Context，最后才微调模型 | Jinqiu Select

2026-03-23

养死四只龙虾的小白有感

2026-03-22

Mistral Forge 的真正意义：企业AI从“租用”走向“拥有”

2026-03-21

马斯克再次站台Kimi，扒掉了Cursor 500亿估值的底裤

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

MiniMax M2.7 炸场！自己训自己，8 项基准硬刚 GPT-5 和 Opus 4.6

2026-03-19

ComfyUI v0.19.0 更新：大量新节点、新模型、新修复与性能优化全面落地，工作流与训练能力再升级

2026-04-15

马斯克再次站台Kimi，扒掉了Cursor 500亿估值的底裤

2026-03-21

罕见！Meta、OpenAI、xAI联合分享了用生产环境提升LLM的最佳实践！

2026-03-03

养死四只龙虾的小白有感

2026-03-23

Mistral Forge 的真正意义：企业AI从“租用”走向“拥有”

2026-03-22

【淘宝直播数字人互动LLM】告别AI感：基于真人ASR数据的拟人化探索

2026-03-17

Agent 持续学习落地路径：先做 Traces，再做 Context，最后才微调模型 | Jinqiu Select

2026-04-13

用 Unsloth 微调 Embedding 模型，让你的 RAG 检索不再答非所问

2026-04-20

谁说 Mac 只能写代码？Google 官宣：M 芯片本地微调 Gemma 4 时代开启！

2026-05-06

大家都在问

DeepSeek 发布新论文，提出全新 MHC 架构，有何创新与应用前景？

2026-01-02

LoAR做Fine-Tuning微调原理到底是什么？

2025-11-19

如何将 AI 代码采纳率从30%提升到80%？

2025-09-25

大模型微调，为什么99%的企业都不应该碰这个坑？

2025-06-20

万不得已，不要对 LLM 进行微调？

2025-06-17

可以将任何符合OpenAPI规范的接口转 MCP Server吗？

2025-05-21

OpenAI发布GPT-4.1系列模型，对行业最大吸引力是什么？

2025-05-17

私有部署大模型需要多少显存？

2025-05-14

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部