机械自动化
学术插图新神器!万字材料秒出SVG西湖大学出品
日期:2026-03-02 20:15

  测验考试用Nano banana生个图,颜值拉满但逻辑全错,以至还自带“克苏鲁”气概的恍惚字符;^好不容易调好了Prompt,成果想改一个小图标,却发觉AI给你的只是一张无从下手的“死图”。现正在,你能够把大段的间接塞给AutoFigure,西湖大学团队推出的全新智能体画图框架。更沉磅的是,其优化版本AutoFigure-Edit实现了从“像素”到“矢量”的逾越:生成的插图不再是古板的图片png,而是细节可编纂的SVG文件(现正在你能够正在PPT里间接编纂了)。目前,该工做已入选ICLR 2026。代码、数据集、Web交互界面全数开源,并同步上线了可一键利用的正在线网坐。1。 End-to-end派(如GPT-Image):审美正在线,但逻辑经常“蹦迪”,文字更是沉灾区,充满了莫明其妙的字符。2。 Text-to-code派(如TikZ/SVG生成):逻辑却是严密,但视觉结果往往丑得像上个世纪的教科书,缺乏现代论文的高级感。AutoFigure提出了“推理式衬着”(Reasoned Rendering)范式:将“脑子(逻辑结构)”和“手(美化衬着)”完全分隔。AI读入你长达万词的,从动提取实体和关系,生成一个粗拙但布局准确的结构(SVG/HTML代码)正在最终美化阶段,AutoFigure起首将结构衬着为一张精彩的图片。随后,为领会决现正在AIGC生图文字变形的问题,图片中文字的准确性,AutoFigure引入了特地的“擦除-批改”策略:用OCR识别恍惚字符,把它们“抠掉”,再从头笼盖上清晰的矢量文本。正在最新版本AutoFigure-Edit中,西湖大学团队更进一步,引入了SAM3从动抠图手艺,包罗:最终,改字、换色的动态画布,可以或许按照你的设法对图片细节进行更改。为了验证AutoFigure的结果,团队建立了全球首个大规模科学插图基准——FigureBench。规模弘大:涵盖3,300高质量文本-图片对,逾越论文、综述、手艺博客、教科书等四种科学文本。降维冲击:正在逻辑清晰度和精确度上,AutoFigure的劣势极大,正在教科书类使命中胜率以至高达97。5%。更具力的是人类专家盲测:10位论文一做对生成的图片进行评审,成果显示66。7%的专家认为AutoFigure生成的图曾经达到了Camera-ready(出书级)尺度。本项目供给了可一键利用的正在线网坐。列位研究者先珍藏,最少绘图该当不会那么仓皇了。所有学者均可免费体验demo,有期刊需求的伴侣不消担忧,Nature气概、Science气概等多样气概一键生成功能也将很快上线。本项目由西湖大学张岳尝试室全面开源。西湖大学天然言语处置尝试室(WestlakeNLP)成立于2018年9月,由张岳传授带领。张岳传授结业于大学,获博士学位,现任西湖大学工程学院副院长。他著有剑桥大学出书社出书的《天然言语处置》一书,并担任过EMNLP 2022等多个NLP会议的法式委员会。本项目焦点团队包罗翁诣轩*、林圳、朱敏郡、谢秋婕、卢攀忠、孙启耀等人。尝试室过往包罗Cycle Researcher、DeepReview、DeepScientist(两个月刷新三个前沿使命SoTA的人工智能科学家项目)等工做。欢送感乐趣的同窗插手到从动化科学发觉研究,成心向申请持久练习、博士生、研究帮理者可联系张岳传授邮箱(。



888集团官网正版官方微信

子公司网址