微信扫码
添加专属顾问
 
                        我要投稿
全网首发!本地私有化部署Dify工作流,Nano Banana提示词助力高效AI交互。 核心内容: 1. 工作流编排全览与基础设置详解 2. HTTP请求节点与OpenRouter API对接方案 3. Python+FastAPI服务端核心代码解析
 
                                
使用的是本地私有化部署的Dify
效果展示:
工作流编排全览
基础设置
开场白中编写便捷用户体验的谷歌官方Nano Banana提示词。
1. 开始节点
接收用户的输入和上传的图片。
2. 列表操作
操作用户上传的文件,这里取用户上传的最后一张图片。
3.HTTP请求节点
使用form-data的方式向服务端发送用户选择的图片和提示词。
理论上,也可以使用Dify内置的代码节点直接向openrouter api 接口发起请求。
服务端采用的是Python + FastAPI的方式,给Dify提供API接口。
核心代码如下,采用openrouter提供的Nana Banana API接口。
@app.post("/upload")
async def upload_chat(prompt: str = Form(...), image: Optional[UploadFile] = File(None)):
    """处理 form-data 方式上传的图片和 prompt,单轮对话"""
    print(f"[upload-chat] 收到请求 - prompt长度: {len(prompt)}, 是否有图片: {image is not None}")
    print(f"[upload-chat] prompt内容: {prompt[:100]}{'...' if len(prompt) > 100 else ''}")
    
    if not OPENROUTER_API_KEY:
        print("[upload-chat] 错误: OPENROUTER_API_KEY 未配置")
        raise HTTPException(status_code=500, detail="OPENROUTER_API_KEY 未配置")
    
    # 构造消息内容
    content = [{"type": "text", "text": prompt}]
    print(f"[upload-chat] 初始消息内容构造完成")
    
    # 如果有图片,处理图片数据
    if image and image.filename:
        print(f"[upload-chat] 开始处理图片 - 文件名: {image.filename}, 类型: {image.content_type}")
        try:
            # 读取图片数据
            image_data = await image.read()
            print(f"[upload-chat] 图片读取完成 - 大小: {len(image_data)} bytes")
            
            # 转换为 base64
            image_b64 = base64.b64encode(image_data).decode('utf-8')
            print(f"[upload-chat] base64转换完成 - 长度: {len(image_b64)}")
            
            # 获取文件类型
            content_type = image.content_type or "image/jpeg"
            print(f"[upload-chat] 文件类型: {content_type}")
            
            # 构造 data URL
            data_url = f"data:{content_type};base64,{image_b64}"
            
            # 添加图片到消息内容
            content.append({
                "type": "image_url",
                "image_url": {"url": data_url}
            })
            print(f"[upload-chat] 图片添加到消息内容完成")
        except Exception as e:
            print(f"[upload-chat] 图片处理错误: {str(e)}")
            raise HTTPException(status_code=400, detail=f"图片处理错误: {str(e)}")
    else:
        print("[upload-chat] 无图片上传,仅处理文本")
    
    # 构造符合 Gemini 格式的消息
    messages = [{
        "role": "user",
        "content": content
    }]
    print(f"[upload-chat] 消息格式构造完成 - 内容项数: {len(content)}")
    
    payload: dict[str, Any] = {
        "model": "google/gemini-2.5-flash-image-preview",
        "messages": messages,
        "modalities": ["image", "text"]  # 明确要求返回图片和文本
    }
    print(f"[upload-chat] API请求载荷构造完成")
    
    headers = {
        "Authorization": f"Bearer {OPENROUTER_API_KEY}",
        "Content-Type": "application/json",
    }
    
    url = "https://openrouter.ai/api/v1/chat/completions"
    print(f"[upload-chat] 开始请求API: {url}")
    
    try:
        resp = requests.post(url, headers=headers, json=payload, timeout=120)
        print(f"[upload-chat] API响应状态码: {resp.status_code}")
        
        if resp.status_code >= 400:
            print(f"[upload-chat] API错误响应: {resp.text[:200]}...")
            # 将上游错误信息透传给前端
            raise HTTPException(status_code=resp.status_code, detail=resp.text)
        
        response_data = resp.json()
        print(f"[upload-chat] API请求成功,响应数据长度: {len(str(response_data))}")
        
        # 打印响应的基本信息
        if 'choices' in response_data and len(response_data['choices']) > 0:
            choice = response_data['choices'][0]
            if 'message' in choice:
                message_content = choice['message'].get('content', '')
                print(f"[upload-chat] 响应消息长度: {len(str(message_content))}")
        
        return response_data
    except requests.RequestException as e:
        print(f"[upload-chat] 网络请求异常: {str(e)}")
        raise HTTPException(status_code=502, detail=f"上游网络错误: {str(e)}")4.条件分支节点
判断上一个HTTP请求点,返回的status code状态码是否为200,200代表请求成功。
5.代码节点
解析Nano Banana API返回的数据,获取content(文字回复)和image_url(生成的图片,是base64字符串格式)。
6.Base64转图片节点
7.最终回复节点
给用户展示Nano Banana生成的文字回复和生成的图片。
注意
由于Nano Banana返回的结果较长,超过了本地Dify的限制,所以我们需要修改Dify的.env环境配置文件,加入如下设置:
HTTP_REQUEST_NODE_MAX_BINARY_SIZE=10485760
HTTP_REQUEST_NODE_MAX_TEXT_SIZE=10485760
CODE_MAX_STRING_LENGTH=8000000
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-10-30
Dify流程暂停与人工干预:3种实现方案+避坑指南
2025-10-16
告别升级噩梦:Dify 二次开发的无缝适配策略与实战案例(基于 v1.9.1)
2025-10-13
用Dify搭建企业知识库:5个实战技巧提升检索准确率90%
2025-10-13
Dify接口调用实战指南:从入门到精通的避坑手册,收藏了!
2025-10-12
Dify1.6.0升级1.9.1步骤及踩坑记
2025-10-10
用 Dify 零代码搭建 AI 用研助理,5分钟完成100个虚拟用户调研
2025-09-30
重大消息,刚刚Dify 1.9.1发布了!我们聊聊带来了哪些吸引人的功能特性?
2025-09-26
内网环境下Dify1.9.0版本镜像构建过程记录
 
            2025-10-13
2025-09-03
2025-09-16
2025-09-06
2025-08-19
2025-09-23
2025-09-02
2025-08-18
2025-09-04
2025-10-12
2025-09-30
2025-09-23
2025-09-06
2025-09-05
2025-08-29
2025-08-18
2025-08-02
2025-07-30