TL;DR
- چکیده: نمودارها در ادبیات علمیو مالی برای ارائه دادههای ساختاریافته همه جا حاضر هستند.
- با این حال،.
- استدلال نمودار برای مدلهای زبان بزرگ چندوجهی (MLLM) به دلیل فقدان دادههای آموزشی با کیفیت بالا،.
چه اتفاقی افتاد
چکیده: نمودارها در ادبیات علمیو مالی برای ارائه دادههای ساختاریافته همه جا حاضر هستند. با این حال،.
استدلال نمودار برای مدلهای زبان بزرگ چندوجهی (MLLM) به دلیل فقدان دادههای آموزشی با کیفیت بالا،. و همچنین نیاز به زمینبندی بصری دقیق و محاسبات عددی دقیق،.
چالشبرانگیز است. برای پرداختن به این چالشها،.
ابتدا DuoChart را پیشنهاد میکنیم،. یک خط لوله داده با منبع دوگانه مقیاسپذیر که نمودارهای سنتز شده را با نمودارهای دنیای واقعی ترکیب.
میکند تا دادههای آموزشی نموداری متنوع و با کیفیت بالا ایجاد کند. سپس CharTool را معرفی میکنیم که MLLMها را به ابزارهای خارجی مجهز میکند،.
از جمله برش تصویر برای درک بصری محلی و محاسبات مبتنی بر کد برای استدلال عددی دقیق. از طریق یادگیری تقویتی عاملی در DuoChart، CharTool استدلال یکپارچه ابزار مبتنی بر محتوای نمودار را میآموزد.
آزمایشهای گسترده بر روی شش معیارهای نمودار نشان میدهد که روش ما بهطور مداوم نسبت به. خطوط پایه MLLM قوی در مقیاسهای مدل بهبود مییابد.
شایان ذکر است، CharTool-7B عملکرد بهتری نسبت به مدل پایه **+8. 0%** در CharXiv (Reasoning) و **+9.
78%** در ChartQAPro دارد، در حالی که عملکرد رقابتی با مدلهای بسیار بزرگتر یا اختصاصی به دست میآورد. علاوه بر این، CharTool تعمیم مثبت به معیارهای استدلال ریاضی بصری خارج از دامنه را نشان میدهد.
هوش مصنوعی (cs. AI) استناد بهعنوان: (یا v1 [cs.
AI] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Situo Zhang [مشاهده ایمیل] [v1] جمعه،. 3 آوریل 2026،.
07:. 02:.
13 UTC (3,. 277 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
