微信扫码
添加专属顾问
我要投稿
WebLLM 是一款高性能的浏览器内 LLM 推理引擎,它通过硬件加速将语言模型推理直接引入 Web 浏览器。一切都在浏览器内部运行,无需服务器支持,并通过 WebGPU 加速。
WebLLM与OpenAI API完全兼容。 也就是说,您可以在本地对任何开源模型使用相同的 OpenAI API ,其功能包括 json-mode、函数调用、流式传输等。
我们可以带来很多有趣的机会,为每个人构建 AI 助手,并在享受 GPU 加速的同时保护隐私。
您可以使用 WebLLM 作为基础npm 包,并按照文档和查看入门指南在其上构建自己的 Web 应用程序。该项目是MLC LLM的配套项目,可实现 LLM 在硬件环境中的通用部署。
github:https://github.com/mlc-ai/web-llm
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-18
端侧AI革命!Android App上可直接集成Gemini大模型了!
2025-12-18
突发!ChatGPT版应用商店正式发布,第三方开发者新入口!
2025-12-18
实测豆包1.8后,我终于明白字节为什么要推豆包手机了。
2025-12-18
通用Agent模型Seed1.8正式发布
2025-12-18
谷歌发布Gemini 3 Flash,口述即原型,速度堪比搜索引擎
2025-12-18
2026 开年AI对谈:the year of R | 对谈真格基金戴雨森
2025-12-18
再论Skill:Agent 落地第一性原理
2025-12-18
Gemini 3 Flash闪电来袭:智力竟反超Pro!速度快3倍,全球免费
2025-10-26
2025-10-02
2025-09-29
2025-10-07
2025-09-30
2025-11-19
2025-10-20
2025-11-13
2025-10-02
2025-10-18
2025-12-16
2025-12-15
2025-12-14
2025-12-12
2025-12-12
2025-12-11
2025-12-09
2025-12-08