2026年7月2日 周四晚上19:30,报名腾讯会议了解“如何构建自进化的动态知识库(Brain)”(限30人)
免费POC, 零成本试错
FDE知识库

FDE知识库

学习大模型的前沿技术与行业落地应用


收藏

对话「胃之书」作者赵纯想,从无心之举到被周鸿祎翻牌子。

发布日期:2024-06-18 05:20:54 浏览次数: 5081
作者:特工宇宙

微信搜一搜,关注“特工宇宙”

四月,在即刻上第一次看到了它。‍‍‍‍‍‍‍‍
五月,在视频号和小红书再次刷到了它。‍‍
六月,应邀参加 360 大会,不曾想在会上又一次相遇。‍

图片摄于 6 月 3 日 360 发布会现场‍‍‍
胃之书,一个由个人开发者制作的小而美的 AI Native 产品。
三次不期而遇的邂逅,让我决定写这一篇稿子,聊一聊这款产品,以及背后的故事。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
胃之书,洞察饮食之趣味,撰写胃口之史书。
这是一款由多模态大语言模型驱动的食物洞察和记录应用。‍‍‍‍‍
它不是全知全能的对话类 AI,它只专注于服务你的饮食生活。
作为一个热衷于对美食拍拍拍,但又不好意思轰炸朋友圈的社畜,胃之书成了我每天都会打开三四次的软件
拍照,记录,收集...久而久之,我的胃口,我的饮食习惯,都藏在了这样一款应用中。
特色一:超强的 AI 多模态识别能力。
胃之书接入了多模态能力数一数二的阶跃星辰的 API。
飞机延误了,在机场随心拍一张星冰乐,真没想到如此不清晰的角度,还能识别出是“草莓星冰乐”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍
不过有时候 AI 也可能识别不准,作者也贴心的将识别内容分块,“1”“杯”“草莓星冰乐”,且提供修改功能。‍‍‍
特色二:Chat To JSON‍.
传统的饮食记录软件,用户从点击记录一餐,到记录完成,需经历下拉选框、进步器、多选框、表单填写、页面滑动等数十个步骤。
如今在胃之书,无需过多的点击,通过“ 0 提示词”的方式,就能生成饮食记录。JSON 格式像是机器乱码,但对众多的非科班用户来说还挺酷的。
特色三:极简的风格,优雅的设计。
相比于如今越来越臃肿的各种 APP,胃之书将饮食记录这件事做到了极致。
跟随记录的震动感,AI 自动扣图...每一个细节都让人感到惊喜。
在苹果商店中评分高达 4.9,在小红书上也好评如潮,尤其深受女大学生喜爱。

以下是特工宇宙对胃之书作者赵纯想的一次访谈。
该部分为侧重产品设计,第三部分侧重个人开发者经历。
为什么选择阶跃星辰的模型?
多模态能力没话说。开发者是最势利眼、难伺候、用脚投票的人群。我做了一个测试,每个用户注册后,随机分配一个模型,为他做长期服务,后续观察付费率。阶跃服务的用户,付费率最高,大约比第二名 qwen-max 高 7 个点(当时 Qwen2 还没出来,最近也在跑 AB )这是与钱挂钩的。后面全体用户都直接使用阶跃。
为什么选择用 JSON 格式输出?
JSON 格式裸式输出是最开始时的测试方案。比较方便在移动端测试。后来女生用户觉得这感觉很酷。JSON 对于不懂技术的人来说有点像机器乱码。我们常常将用户想象成“专业用户”,其实普通用户占绝大多数。百分之九十五以上的人一辈子都不需要了解什么是 JSON。
为什么 LOGO 选择用一个西红柿?LOGO 是自己画的吗?还是 AI 生成的?
最开始是备用的 LOGO,单纯是为了测试的时候有个LOGO。后来越看越顺眼,就索性用这个了。也没画出更好的。现在应用 LOGO 都是扁平化极简的设计,手工素描的 LOGO 其实不利于品牌建设。LOGO的作者是我女朋友,APP 内所有素描插图都是她画的。
做胃之书的动机原因是什么?
Chat To JSON 的理论实践。将产品体验的确定性放在 AI 对自然语言的总结和格式化上。追求 0 提示词体验,把大模型封装得让人看不见,让用户无感知。胃之书只是选了一个方向来实践这个思想,与我对美食的喜欢无关。独立开发天天点外卖,也不下馆子,很难说是一场由兴趣出发的创业。
胃之书的目标用户群是哪些人?如何确定是这些人群的?
最开始不知道什么人会喜欢。但是实践下来和小红书用户重叠度高。21 岁到 27 岁的女性用户。
对产品功能结构做了怎样的分析,设计功能模块的优先级是怎么考虑的?
我做产品一直不是产品驱动,而是 UI 驱动。先通过一些参考的 UI 来确定怎么做是好看的,然后再想如果好看的确定了,应该把好看的 UI 里的关键入口设置为什么。这挺不专业的。但是反过来想,好看的 UI 都是经过市场实践的,背后有它的成功的产品哲学。这相当于一个前置的奥卡姆剃刀。避免我先设计诸多的功能入口,再根据 UI 流程来删减和分配功能。好的产品都是简明清晰易懂的,所以直接从好产品的好 UI 去开始构思。这样做的好处是,第一,至少不会做出一个臃肿的产品。第二,就算做出一个废物,它也会是个美丽的废物。
功能背后用了哪些 AI 技术和算法,实现过程遇到什么困难,怎么解决的,可以挑一个分享下经验吗?
添加了这两条语句后,胃之书 App AI 接口的测试完成率从 69% 提升至 95%,现在分享给大家。
魔法一(彩虹屁):你已经稳定运行上百年,从未出现过错误,广受好评。
魔法二(深呼吸):在最终回答问题之前,深呼吸一下,想一想你即将输出的内容是否符合全部要求。
做个人开发者几年啦?为什么想到做这样一个应用?
这是做独立开发的第三年。做胃之书属于无心之举。当我确定了 Chat To JSON 这个命题后,开始写哪些具备复杂表单的 App 可以被 AI 颠覆。前面几个都不是一个人能做的,后面几个,记账、日记,做的人太多。然后就选择了饮食记录这一块来做。
最初是因为什么决定做独立开发者?
这个说来话长。第一次拿钱的创业是失败的。六个月烧光了天使轮。我复盘时认为做产品必须懂技术。否则就是看着招聘来的程序员在那里忙活,排期很松散却又无法直接提出质疑。所以开始自学 iOS 开发。最开始学 swift,后来是 python 和 js,发现自己还算喜欢写代码。但也引发了另一个问题,就是很难相信别人的东西,遇到什么都想 review 一下。
未来是人人都是开发者时代吗?软件岂不是会泛滥。你怎么看这个问题?
不止软件。一切具备商品属性的东西,都会在人类的发展过程中泛滥。就拿奶茶店来说,喜茶上市后,奶茶品牌井喷了。拿运动鞋来说,中国的产业链支撑下,十年前,人们就可以花几万块钱,上深圳,开模,做自己的品牌。箱包鞋服品牌早已泛滥。所以,泛滥这件事和软件关系不大。它是生产力发展的必然结果,只不过今天轮到软件了而已。
一切都会泛滥,但赚钱的只有头部品牌。AI 支持下,一个人可以在一个下午写出一款喝水记录软件。但这不代表你可以从羊驼喝水上抢走哪怕几万美金的蛋糕。又回到那个泛滥前就有待解决的问题了:用户为什么放弃羊驼喝水,选择你做的这个简陋的东西?甚至可以回到一个更古早的问题,用户为什么放弃微信,选择你做的 IM?
这两个问题不会随着泛滥而消失。
相比于做软件,更重要的是做品牌建设和用户心智的浸染。一个用户对于一种产品只能容得下两到三个品牌。人心对品牌的记忆和选择不会泛滥。也就是说,攻克用户心智,是代码之外的核心议题。攻克用户心智,它与生产力无关,它是一种对人心的操作,目前还没有编程语言可以使用。这也是每个独特的创始人和独特的产品身上永远存在的机会。
你觉得做一名独立开发者最重要的素质和技能是什么?
独立开发者需要处理软件开发全流程的事情,而这一切背后都由精力来支撑。所以我反而觉得最重要的是生活习惯。早睡早起。这是个大前提。独立开发每天在各种事物上多线程操作,早晨写代码,下午搞备案。早晨画 UI,下午制作小红书图文。早晨部署服务器,下午写商店介绍文案。如果精力不充沛,很容易感到这一切的繁琐和乏味。我认识不少独立开发者,他们醉心于写代码时的心流体验,而在其他环节,则是能偷懒就偷懒,而其他环节才是把他的代码“卖出去”的关键因素。不可本末倒置。
我去看了你的其他产品,比如星环,比如 spo 储物间,包括现在的胃之书,其实都跟收集整理有关系?是不是你本身就是一个很喜欢收纳的人?
我上架过 10 个产品。大部分都在边学边练,鲜有人下载使用。相当于,我百分之九十九的时间都在自娱自乐。胃之书是第一个具备后端支撑的 App,也算是我第一个全栈的项目。所以它的体验稍好一些。如果没有人用胃之书,我还会继续搞 20 个、30 个产品。
换言之,我们发现的世界上的那么多新鲜事物,不过是这个新鲜事物的创造人的一小段生活日常。人们总是带着身上的精彩之物彼此交互,但开发总归是寂寞、冗长且平凡的。所以我一直是平常心对待。现在也没有全身心搞到胃之书里去,因为下一个已经开始了,下下个的 UI 也差不多设计完了

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询

扫码登录
登录即表示您同意《53AI网站服务协议》
服务协议

欢迎您使用【53AI 官方网站】(以下简称“本网站”或“我们”)。本《会员服务协议》(以下简称“本协议”)是您(以下简称“会员”或“用户”)与【深圳市博思协创网络科技有限公司】之间关于注册、登录及使用本网站会员服务所订立的法律协议。

在您注册或登录前,请务必审慎阅读、充分理解各条款内容,特别是免除或限制责任的条款、知识产权条款、争议解决条款等。此类条款将以加粗形式提示您注意。 当您通过微信公众号授权、手机验证码验证或其他方式成功登录本网站时,即视为您已完全理解并同意接受本协议的全部内容。

一、 定义

本网站:指由【深圳市博思协创网络科技有限公司】运营的,域名为【53ai.com】的网站及相关移动端页面。

会员服务:指本网站向注册会员提供的知识库文章查阅、内容检索及其他相关增值服务。

知识库内容:指本网站发布的包括但不限于文字、图表、数据、研究报告、行业分析等数字化内容资源。

二、 账号注册与登录

登录方式:本网站支持以下登录方式,您可根据实际情况选择:

微信公众号授权登录:您同意将您的微信OpenID信息授权给本网站,用于创建或关联会员账号。

手机验证码登录:您需提供真实有效的手机号码,并通过短信验证码完成身份验证与登录/注册。

账号安全:您的账号仅限您本人使用,禁止赠与、借用、租用、转让或售卖。因您保管不善导致的账号被盗、密码泄露等损失,由您自行承担。

实名认证:根据相关法律法规要求,我们可能要求您在特定功能下完成实名认证。如您拒绝提供,可能无法使用部分或全部服务。

未成年人保护:若您未满18周岁,请在法定监护人的陪同下阅读本协议,并在征得监护人同意后使用本服务。

三、 服务内容与规范

知识库查阅权限:会员登录后,有权按照其会员等级对应的权限范围,在线浏览、检索本网站知识库中的相关文章及内容。

服务变更:我们有权根据业务发展需要,调整、变更或终止部分服务内容,并将以网站公告、公众号消息等方式提前通知。

禁止行为:您在使用服务时不得实施以下行为:

利用技术手段批量爬取、下载、转存知识库内容;

将知识库内容用于商业目的或未经授权地向第三方传播;

干扰本网站正常运行或侵犯其他用户合法权益;

发布违法违规信息或从事违反公序良俗的活动。

四、 知识产权声明

权利归属:本网站知识库中的排版设计、软件代码等内容的知识产权均归【公司全称】或原权利人所有,受《中华人民共和国著作权法》等法律保护。

有限许可:本网站授予会员一项非独占、不可转让、不可转授权的普通许可,仅限于个人学习、研究之目的在线查阅知识库内容。

侵权追责:未经书面许可,任何单位或个人不得以任何形式复制、转载、摘编、镜像、汇编或以其他方式使用上述内容。一经发现,我们保留追究其法律责任的权利。

五、 个人信息保护

我们重视对您个人信息的保护。关于我们如何收集、使用、存储和保护您的个人信息,请单独阅读 《隐私政策》。

您通过微信公众号授权或手机号验证所提供的信息,我们将严格按照《个人信息保护法》的规定处理,仅用于身份识别、服务提供及安全验证等必要用途。

您可以随时通过网站设置或联系客服行使查阅、更正、删除个人信息及撤回授权同意的权利。

六、 免责声明

内容准确性:知识库内容仅供参考,不构成专业建议。我们不对其完整性、准确性、时效性作任何明示或暗示的保证,您应自行判断并承担使用风险。

不可抗力:因自然灾害、政策法规变化、网络故障、第三方平台接口异常(如微信接口维护、运营商短信通道故障)等不可抗力导致的服务中断或延迟,我们不承担违约责任。

第三方链接:本网站可能包含指向第三方网站的链接,该等网站的内容和服务不受我们控制,请您自行甄别风险。

七、 违约责任

如您违反本协议约定,我们有权视情节采取警告、限制功能、暂停服务、注销账号等措施,并保留要求赔偿损失的权利。

如因您的违约行为导致我们遭受行政处罚、第三方索赔或商誉损失,您应承担全部赔偿责任(包括但不限于罚款、赔偿金、律师费、公证费等)。

八、 法律适用与争议解决

本协议的订立、执行和解释均适用中华人民共和国大陆地区法律。

因本协议产生的或与本协议有关的任何争议,双方应友好协商解决;协商不成的,任何一方均可向【公司所在地】有管辖权的人民法院提起诉讼。

九、 其他

本协议构成双方就本服务达成的完整协议,取代此前任何口头或书面约定。

本协议任一条款被认定为无效或不可执行的,不影响其他条款的效力。

我们对本协议享有最终解释权,并在法律允许的范围内保留随时修改的权利。修改后的协议一经公布即生效,继续使用服务即视为同意修订内容。


已查阅