微信扫码
添加专属顾问
我要投稿
告别服务器繁忙,享受极速大模型推理体验。 核心内容: 1. 基于Termux在手机上部署Phi-3模型的局限性 2. MNN Chat应用的优势:本地运行、CPU优化、多模态支持 3. 广泛的模型兼容性和官网资源链接
在Phi-3大模型发布之际,我们基于Termux应用,在我的小米手机部署了Phi-3模型:
Termux应用是一个终端模拟器,它允许我们安装 Linux 操作系统,然后在 Linux 操作系统中安装 Ollama,最后基于 Ollama 下载和推理大模型,虽然方法可行,但是存在一些局限:
DeepSeek R1 很火爆,导致在使用 DeepSeek R1 时,老牛同学经常会遇到“服务器繁忙,请稍后重试。”的问题:
今天老牛同学推荐一款更加先进的应用:MNN Chat,它是由阿里巴巴开源的全功能多模态模型应用。
官网地址:https://www.mnn.zone
GitHub 源码地址:https://github.com/alibaba/MNN
接下来,我们在手机上部署试用一下,老牛同学的手机配置如下:
对于 Android 手机,我们可以直接下载和安装最新版本:下载地址
或者,我们也可以按照以下步骤,自己编译 Android 和 iOS 应用:
git clone https://github.com/alibaba/MNN.gitcd project/androidmkdir build_64../build_64.sh "-DMNN_LOW_MEMORY=true -DMNN_CPU_WEIGHT_DEQUANT_GEMM=true -DMNN_BUILD_LLM=true -DMNN_SUPPORT_TRANSFORMER_FUSE=true -DMNN_ARM82=true -DMNN_USE_LOGCAT=true -DMNN_OPENCL=true -DLLM_SUPPORT_VISION=true -DMNN_BUILD_OPENCV=true -DMNN_IMGCODECS=true -DLLM_SUPPORT_AUDIO=true -DMNN_BUILD_AUDIO=true -DMNN_BUILD_DIFFUSION=ON -DMNN_SEP_BUILD=ON"
mkdir -p ../../../apps/Android/MnnLlmChat/app/src/main/jniLibs/arm64-v8afind . -name "*.so" -exec cp {} ../../../apps/Android/MnnLlmChat/app/src/main/jniLibs/arm64-v8a \;cd ../../../apps/Android/MnnLlmChat./gradlew installDebug
git clone https://github.com/alibaba/MNN.gitcd MNN/sh package_scripts/ios/buildiOS.sh "-DMNN_ARM82=true -DMNN_LOW_MEMORY=true -DMNN_SUPPORT_TRANSFORMER_FUSE=true -DMNN_BUILD_LLM=true -DMNN_CPU_WEIGHT_DEQUANT_GEMM=true-DMNN_METAL=ON-DMNN_BUILD_DIFFUSION=ON-DMNN_BUILD_OPENCV=ON-DMNN_IMGCODECS=ON-DMNN_OPENCL=OFF-DMNN_SEP_BUILD=OFF-DMNN_SUPPORT_TRANSFORMER_FUSE=ON"
mv MNN-iOS-CPU-GPU/Static/MNN.framework /apps/iOS/MNNLLMChat/MNN.framework
确保 Link Binary With Libraried 中包含 MNN.framework,和其他三个 Framework:
如果没有包含,可以手动添加 MNN.framework:
cd /apps/iOS/MNNLLMChatopen MNNLLMiOS.xcodeproj
在 Xcode 项目属性中 Signing & Capabilities > Team 输入自己的账号和 Bundle Identifier:
等待 Swift Package 下载完成之后,进行编译使用。
手机上安装好MNN Chat应用之后,我们打开应用,就可以看到它所兼容的模型列表,包括文本、音频、图像等:
点击即可下载,老牛同学想体验一下文本和图片识别,下载了DeepSeek-R1-7B-Qwen-MNN和Qwen2-VL-2B-Instruct-MNN这 2 个大模型,等待下载完成。
先试用一下DeepSeek-R1-7B-Qwen-MNN文本模型,输入提示词:
同样是一年,为什么阳历固定12个月,而阴历却有闰月?
DeepSeek R1 开始思考,分析阳历和阴历的计算方法,最终得出结论:
从手机的推理速率来看,总体还算不错,比通过Termux应用的方式推理效率高多了。
接下来,看看Qwen2-VL-2B-Instruct-MNN图片多模态大模型,老牛同学让它进行车牌识别:
可以看到,识别的结果是很不错的!
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-12-17
语音交互技术:让你的 AI 助手开始说话
2025-12-17
面向业务落地的AI产品评测体系设计与平台实现
2025-12-17
声画俱全,一镜入戏 | Seedance 1.5 pro 音视频创作模型正式发布
2025-12-17
OpenAI 发布 GPT Image 1.5:全面升级
2025-12-16
AI导演来了!UniVA:你的全能视频创作智能体
2025-12-15
万字拆解UI-TARS 2.0,看懂豆包手机背后的核心技术
2025-12-14
秒杀传统 TTS?!Gemini 原生中文 TTS 体验 + 提示词模板
2025-12-14
别被“多模态”骗了:用一本200页的教材,我测出了GPT-5.2和Gemini的物种代差
2025-11-10
2025-12-06
2025-10-31
2025-10-22
2025-09-25
2025-12-07
2025-11-03
2025-11-19
2025-12-11
2025-12-15
2025-08-04
2025-05-26
2025-05-13
2025-04-08
2025-04-05
2025-03-30
2025-03-26
2025-03-05