PaperBanana: Автоматизация академических иллюстраций для ИИ-ученых Документ представляет PaperBanana, агентскую структуру, разработанную для автоматизации создания академических иллюстраций, готовых к публикации, для ИИ-ученых. Она решает текущую проблему, заключающуюся в том, что создание высококачественных диаграмм и статистических графиков остается трудоемкой задачей, несмотря на достижения в области автономного ИИ. PaperBanana использует передовые визуально-языковые модели (VLM) и модели генерации изображений для организации работы специализированных агентов. Эти агенты выполняют такие задачи, как получение ссылок, планирование контента и стиля, рендеринг изображений и итеративное уточнение посредством самокритики. Для оценки производительности авторы разработали PaperBananaBench, комплексный бенчмарк, включающий 292 тестовых случая методологических диаграмм из публикаций NeurIPS 2025. Эксперименты показывают, что PaperBanana значительно превосходит ведущие базовые модели по ключевым показателям, таким как точность, краткость, читабельность и эстетика. Универсальность фреймворка подчеркивается его эффективным расширением на создание высококачественных статистических графиков. Подход PaperBanana обещает оптимизировать визуальную коммуникацию научных открытий, автоматизируя критически важный шаг в исследовательском рабочем процессе. документ — https://arxiv.org/abs/2601.23265
подписаться — https://t.me/arxivpaperu
отправить донаты:
USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7
BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr
ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7
SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e
создано с помощью NotebookLM arXiv.org (https://arxiv.org/abs/2601.23265)







































