开发一款ai驱动的去中心化的图片管理系统的构想

一款ai驱动的去中心化的图片管理系统的构想

概述

  • 灵感来源于开源项目https://github.com/photoprism/photoprism

  • photoprism核心特性为:

    • ai驱动的照片分类,自动标记和分类照片。

    • 去中心化存储,服务部署在用户自己的设备上。

    • 强大的搜索功能,得益于其AI分类系统。可以按日期、地点、人物、物体进行搜索。

    • 可以根据时间地点或者主题自动创建相册。

    • 跨平台支持,其基于docker进行服务构建,基于web进行用户交互,提供了良好的跨平台支持

    • 使用webdav技术进行照片的同步以及跨设备访问。

  • 缺点

    • 使用不够简单,我所构想的图片管理系统,应该基于对象存储的理念,只需要指定一个文件夹,即可对图片进行管理,这并不需要在设备上额外部署一个服务。

  • 需要思考的内容

    • 是否除了图片本身,其他的功能支持都应该放在服务上?包括图片的索引建立、分类、标记以及元数据信息?

    • 通过哪种方式组织用户的交互界面?暂时考虑浏览器插件的形式。最好的模式应该是C/S模式,同时提供windows客户端、android/IOS app、mac客户端等。但个人技术栈还没这些东西。

    • 多设备同步问题使用第三方软件syncthing即可

    • ai对图片的处理用多模态大模型还是有其他专门的图片机器学习模型可以使用?优先考虑大模型吧。顺便研究下dify的使用、考虑国内的coze也行。

  • 核心逻辑

    • 通过ai将图片转化为文本进行处理。所有的文本信息存储在服务器数据库里。

    • 用户永远不需要考虑服务部署的问题,开箱即用才是最好的。

  • 第一步

    • 确定图片的元数据哪些是需要ai生成的。(class、tags、description)

    • 走通ai高效、准确的生成这些数据。

  • 第二步

    • 搭建合适的语义检索体系

  • 第三步

    • 服务的搭建以及用户交互界面的开发