微信扫码
添加专属顾问
我要投稿
微软开源LLMLingua,解决大模型提示词过长问题,20倍压缩比显著降低成本与延迟! 核心内容: 1. LLMLingua的三层压缩框架与20倍压缩比技术原理 2. 针对长文档优化的LongLLMLingua动态压缩策略 3. LLMLingua-2突破性采用机器学习分类器实现智能压缩
什么是 LLMLingua
LLMLingua系列技术演进
使用方法及效果
pip install llmlingua
from llmlingua import PromptCompressor# Initialize the compressorllm_lingua = PromptCompressor()# Compress the promptprompt = "Sam bought a dozen boxes, each with 30 highlighter pens inside, for $10 each box..."compressed_prompt = llm_lingua.compress_prompt(prompt, instruction="", question="", target_token=200)print(compressed_prompt)
{ 'compressed_prompt': 'Question: Sam bought a dozen boxes each with 30 highlighter pens...', 'origin_tokens': 2365, 'compressed_tokens': 211, 'ratio': '11.2x', 'saving': 'Saving $0.1 in GPT-4.'}# Use a more powerful compression modelllm_lingua = PromptCompressor("microsoft/phi-2")# Or use a quantized model for GPUs with limited memory# Requires: pip install optimum auto-gptqllm_lingua = PromptCompressor("TheBloke/Llama-2-7b-Chat-GPTQ", model_config={"revision": "main"})小结
END
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-02-04
Agent Skills 终极指南:从零到精通
2026-02-04
AI 原生研发范式:从“代码中心”到“文档驱动”的演进
2026-02-03
一文看懂 现在最火的Agent Skills:自动化的提示词工程
2026-02-03
Agent Skills Framework:2026年AI代理的核心框架
2026-01-30
Skills 元年,一人公司的时代要来了:速通 Anthropic 通识课
2026-01-30
Claude Skills 背后的原理解析
2026-01-30
实测 Skills:用planning-with-files 做技术预研助手
2026-01-30
[Claude] Prompt Caching原理介绍
2025-11-20
2026-01-04
2026-01-13
2025-11-15
2025-11-15
2025-12-02
2025-11-12
2025-11-15
2025-11-16
2026-01-10
2026-01-23
2026-01-19
2026-01-19
2026-01-15
2026-01-05
2025-12-30
2025-12-26
2025-12-15