|
|
EditThinker是一个能让图片编辑工具“越改越好”的智能项目,就像给图片编辑配了个“会思考的小助手”,核心是通过“反复检查、优化要求、重新编辑”的循环,让图片编辑结果更符合我们的需求,以下是项目关键信息的详细总结:
## 一、项目核心目标
解决普通图片编辑工具的“小缺点”——平时用工具按要求改图,常出现改得不够好的情况(比如让画里的小船变灯塔,结果灯塔尺寸不对)。EditThinker要让编辑工具像人一样“边改边想”,一步步优化,直到改出满意的图片。
## 二、核心工作原理:“边想边改”循环
就像我们画画改错题一样,分三步反复做,直到达标:
1. **第一次编辑**:先给图片编辑工具发原始要求(比如“把右边的帆船换成灯塔”)和原图,工具先改出一张图;
2. **检查与优化**:把改好的图交给EditThinker(这个“小助手”),它会做三件事:
- 打分:给这次编辑打个分(比如尺寸不对就低分);
- 找问题:说明哪里没改好(比如“灯塔尺寸太小了”);
- 改要求:把原始要求优化得更明确(比如加上“灯塔要和原来帆船差不多大”);
3. **反复优化**:如果分数没达标,就用优化后的新要求,让编辑工具再改一次,然后重复“检查-优化”步骤,直到分数合格,得到满意的图片。
## 三、项目关键成果
1. **让现有编辑工具变厉害**:给3个常用图片编辑工具(FLUX.1 Kontext、OmniGen2、Qwen-Image-Edit)加了EditThinker后,在4个图片编辑测试标准(ImgEdit-Bench、GEdit-Bench等)里,编辑效果都明显变好,比如有的工具改图合格率从50%左右提升到70%以上;
2. **专门的训练数据**:为了让EditThinker会“思考”,团队做了一个叫“ThinkEdit-140K”的数据集,里面有大量改图案例,还用“强化学习”(就像练技能一样,做得好给奖励,让它越来越会优化)训练EditThinker。
## 四、项目进度与计划
1. **已完成**:2025年12月8日发布了项目相关的研究论文,还展示了改图过程的动画演示,能直观看到“反复优化”的效果;
2. **即将做**:计划一周内公开项目的代码、训练好的模型(比如EditThinker-8B)和ThinkEdit-140K数据集,让更多人能用到这个“改图小助手”。
## 五、其他重要信息
如果有研究者或开发者想用这个项目的成果做研究,需要按照项目提供的“引用格式”,标注这个项目的贡献(就像写作文引用资料要注明出处一样)。
|
|