学术插图新神器！万字材料秒出SVG西湖大学出品-888集团官网正版

机械自动化

学术插图新神器！万字材料秒出SVG西湖大学出品

日期：2026-03-02 20:15

　　测验考试用Nano banana生个图，颜值拉满但逻辑全错，以至还自带“克苏鲁”气概的恍惚字符；^好不容易调好了Prompt，成果想改一个小图标，却发觉AI给你的只是一张无从下手的“死图”。现正在，你能够把大段的间接塞给AutoFigure，西湖大学团队推出的全新智能体画图框架。更沉磅的是，其优化版本AutoFigure-Edit实现了从“像素”到“矢量”的逾越：生成的插图不再是古板的图片png，而是细节可编纂的SVG文件（现正在你能够正在PPT里间接编纂了）。目前，该工做已入选ICLR 2026。代码、数据集、Web交互界面全数开源，并同步上线了可一键利用的正在线网坐。1。 End-to-end派（如GPT-Image）：审美正在线，但逻辑经常“蹦迪”，文字更是沉灾区，充满了莫明其妙的字符。2。 Text-to-code派（如TikZ/SVG生成）：逻辑却是严密，但视觉结果往往丑得像上个世纪的教科书，缺乏现代论文的高级感。AutoFigure提出了“推理式衬着”（Reasoned Rendering）范式：将“脑子（逻辑结构）”和“手（美化衬着）”完全分隔。AI读入你长达万词的，从动提取实体和关系，生成一个粗拙但布局准确的结构（SVG/HTML代码）正在最终美化阶段，AutoFigure起首将结构衬着为一张精彩的图片。随后，为领会决现正在AIGC生图文字变形的问题，图片中文字的准确性，AutoFigure引入了特地的“擦除-批改”策略：用OCR识别恍惚字符，把它们“抠掉”，再从头笼盖上清晰的矢量文本。正在最新版本AutoFigure-Edit中，西湖大学团队更进一步，引入了SAM3从动抠图手艺，包罗：最终，改字、换色的动态画布，可以或许按照你的设法对图片细节进行更改。为了验证AutoFigure的结果，团队建立了全球首个大规模科学插图基准——FigureBench。规模弘大：涵盖3，300高质量文本-图片对，逾越论文、综述、手艺博客、教科书等四种科学文本。降维冲击：正在逻辑清晰度和精确度上，AutoFigure的劣势极大，正在教科书类使命中胜率以至高达97。5%。更具力的是人类专家盲测：10位论文一做对生成的图片进行评审，成果显示66。7%的专家认为AutoFigure生成的图曾经达到了Camera-ready（出书级）尺度。本项目供给了可一键利用的正在线网坐。列位研究者先珍藏，最少绘图该当不会那么仓皇了。所有学者均可免费体验demo，有期刊需求的伴侣不消担忧，Nature气概、Science气概等多样气概一键生成功能也将很快上线。本项目由西湖大学张岳尝试室全面开源。西湖大学天然言语处置尝试室（WestlakeNLP）成立于2018年9月，由张岳传授带领。张岳传授结业于大学，获博士学位，现任西湖大学工程学院副院长。他著有剑桥大学出书社出书的《天然言语处置》一书，并担任过EMNLP 2022等多个NLP会议的法式委员会。本项目焦点团队包罗翁诣轩*、林圳、朱敏郡、谢秋婕、卢攀忠、孙启耀等人。尝试室过往包罗Cycle Researcher、DeepReview、DeepScientist（两个月刷新三个前沿使命SoTA的人工智能科学家项目）等工做。欢送感乐趣的同窗插手到从动化科学发觉研究，成心向申请持久练习、博士生、研究帮理者可联系张岳传授邮箱（。

上一篇：近代物理所赴帮扶村小学开展“点燃科学星火情

下一篇：2026年波兰波兹南国际木匠机械、东西及家具配件

返回列表

888集团官网正版官方微信

子公司网址