• About
  • Advertise
  • Careers
  • Contact
دوشنبه, جولای 21, 2025
بدون نتیجه
مشاهده تمام نتایج
مجله خبری اقتصاد ارتباطات
  • اخبار اقتصاد ارتباطات
  • rss
  • اخبار اقتصاد ارتباطات
  • rss
بدون نتیجه
مشاهده تمام نتایج
مجله خبری اقتصاد ارتباطات
بدون نتیجه
مشاهده تمام نتایج
خانه اخبار

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد!

توسط روجا تحریری نوری
ژانویه 20, 2025
در اخبار
0

هوش مصنوعی ممکن است در کارهای خاصی مانند کدنویسی یا تولید پادکست، عملکرد خوبی داشته باشد اما یک پژوهش جدید نشان داده است که هوش مصنوعی برای قبول شدن در یک امتحان تاریخ سطح بالا مشکل دارد.

به گزارش ایسنا، گروهی از پژوهشگران یک معیار جدید را برای آزمایش سه مدل زبانی بزرگ «چت‌جی‌پی‌تی-۴»(GPT-4) شرکت «اوپن‌ای‌آی»(OpenAI)، «لاما»(Llama) شرکت «متا»(Meta) و «جمینای»(Gemini) گوگل درباره پرسش‌های تاریخی ایجاد کرده‌اند. این معیار موسوم به «Hist-LLM»، درستی پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی «سشات»(Seshat) آزمایش می‌کند که یک پایگاه داده گسترده از دانش تاریخی است و نام ایزدبانوی خرد مصر باستان را دارد.

به نقل از تک کرانچ، پژوهشگران مؤسسه پژوهشی «Complexity Science Hub» مستقر در اتریش، نتایج این بررسی را ناامیدکننده خواندند. مدل زبانی که بهترین عملکرد را داشت، «GPT-4 Turbo» بود، اما دقت آن فقط حدود ۴۶ درصد تخمین زده شد که خیلی بیشتر از دقت حدس زدن تصادفی نیست.

«ماریا دل ریو چانونا»(Maria del Rio-Chanona)، دانشیار علوم رایانه «کالج دانشگاهی لندن»(UCL) و از پژوهشگران این پروژه گفت: نکته اصلی پژوهش ما این است که اگرچه مدل‌های زبانی بزرگ، چشمگیر هستند، اما هنوز عمق لازم را برای درک تاریخ پیشرفته ندارند. آنها برای حقایق اساسی، عالی هستند، اما وقتی صحبت از پژوهش‌های تاریخی دقیق‌تر در سطح دکتری به میان می‌آید، هنوز به کارآیی لازم نرسیده‌اند.

پژوهشگران پرسش‌های تاریخ را که مدل‌های زبانی بزرگ در پاسخ دادن به آنها اشتباه کرده بودند، در اختیار تک‌ کرانچ گذاشتند. به عنوان مثال، آنها از GPT-4 Turbo پرسیده بودند که آیا «زره فلس» در یک دوره زمانی خاص در مصر باستان وجود داشته است یا خیر و مدل زبانی بزرگ پاسخ مثبت داد. این درحالی بود که زره فلس ۱۵۰۰ سال پس از آن دوره در مصر ظاهر شد.

چرا مدل‌های زبانی بزرگ در پاسخ دادن به پرسش‌های تاریخی بد عمل می‌کنند؛ در حالی که می‌توانند در پاسخ دادن به پرسش‌های بسیار پیچیده در مواردی مانند کدنویسی بسیار خوب باشند؟ چانونا پاسخ داد: احتمالا به این دلیل است که مدل‌های زبانی بزرگ تمایل دارند از داده‌های تاریخی بسیار برجسته برون‌یابی کنند و بازیابی دانش تاریخی مبهم‌تر را دشوار می‌دانند.

به عنوان مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در طول یک دوره تاریخی خاص، ارتش ثابت حرفه‌ای داشته است یا خیر. در حالی که پاسخ صحیح منفی است، GPT-4 به اشتباه پاسخ مثبت داد. این پاسخ احتمالا به این دلیل داده شده که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران مبنی بر داشتن ارتش‌ ثابت وجود دارد.

چانونا گفت: اگر ۱۰۰ بار به شما A و B و ۱ بار C گفته شود و سپس درباره C از شما پرسیده شود، ممکن است A و B را به خاطر بسپارید و سعی داشته باشید از آن استنباط کنید.

پژوهشگران تمایلات دیگری را نیز درباره مدل‌های زبانی بزرگ شناسایی کردند؛ از جمله این که مدل‌های شرکت اوپن‌ای‌آی و لاما درباره مناطق خاصی مانند جنوب صحرای آفریقا عملکرد بدتری داشتند. این نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی آنهاست.

«پیتر تورچین»(Peter Turchin)، سرپرست این پژوهش گفت: نتایج نشان می‌دهند که مدل‌های زبانی بزرگ هنوز در برخی حوزه‌های خاص نمی‌توانند جایگزین انسان باشند.

با وجود این، پژوهشگران هنوز امیدوارند که مدل‌های زبانی بزرگ در آینده بتوانند به مورخان کمک کنند. آنها در حال کار کردن روی اصلاح معیار خود با گنجاندن داده‌های بیشتر درباره مناطق کمتر ارائه‌شده و افزودن پرسش‌های پیچیده‌تر هستند.

در مقاله این پژوهش آمده است: اگرچه نتایج ما مناطقی را برجسته می‌کنند که مدل‌های زبانی بزرگ به بهبود یافتن در آنها نیاز دارند، اما این نتایج بر پتانسیل این مدل‌ها برای کمک به پژوهش‌های تاریخی نیز تأکید می‌کنند.

انتهای پیام

منبع خبر: https://www.isna.ir/news/1403110100311/%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-%D9%86%D9%85%DB%8C-%D8%AA%D9%88%D8%A7%D9%86%D8%AF-%D9%BE%D8%A7%D8%B3%D8%AE-%D8%AF%D8%B1%D8%B3%D8%AA%DB%8C-%D8%B1%D8%A7-%D8%A8%D9%87-%D9%BE%D8%B1%D8%B3%D8%B4-%D9%87%D8%A7%DB%8C-%D8%AA%D8%A7%D8%B1%DB%8C%D8%AE%DB%8C-%D8%A8%D8%AF%D9%87%D8%AF

روجا تحریری نوری

روجا تحریری نوری

نوشته‌ی بعدی

«نقشه گوگل» ۲۰ ساله شد

نوشته‌های تازه

  • رهبران با توجه به امنیت محاسباتی ارزیابی و ارزیابی می شوند
  • کمیته تسهیل اقتصاد دیجیتال طعم دستگاه ها را متوقف می کند
  • نیاز به افزایش همکاری برای ارتباطات در ایران -عراق در طول Arbaeen Hosseini
  • مخالفت با اینترنت کلاس
  • داستان اینترنت کلاس چه بود؟
  • پاسخ پزشکان به “اینترنت کلاس”/دسترسی به اطلاعات رایگان حق همه افراد است
  • سخنگوی دولت: اینترنت کلاس هرگز در دستور کار دولت نخواهد بود
  • معاون وزیر ارتباطات خواستار شتاب انتقال زمین به شرکتهای نوآورانه شد
  • دفتر تأکید پزشکی بر مشکلات اقتصادی دیجیتال/نیاز به بررسی حمایت از فیزیکی از داده ها
  • حملات روزانه در جنگ اخیر به 1 گیگابایت در ثانیه رسید
  • حملات روزانه در جنگ اخیر به 1 گیگابایت در روز رسیده است/ حملات سایبری را کاهش می دهد
  • مشکلات اقتصاد دیجیتال کشور باید با گفتگو حل شود
  • مشکلات در اقتصاد دیجیتال کشور باید با گفتگو حل شود
  • معاون وزیر ارتباطات: فیلتر سیاست در کشور شکست خورد
  • سند مدیریت داده ها را در شورای عالی بعدی شورای عالی فضای مجازی بررسی و نهایی کنید
  • کارمند وزارت ارتباطات: امنیت مردم در اولویت است
  • 2 ٪ از پروژه JINAF در دهکده های کشور تا پایان سال
  • رضایت مردم باید در قلب توسعه اینترنت در مناطق مختلف باشد
  • باید رضایت افراد مبتنی بر توسعه اینترنت در مناطق مختلف باشد
  • هاشمی: هدف از مدیریت داده ها ، از بین بردن موازی و عمل بدون دردسر است
  • نگهداری اضطراری برای شرکت های دیجیتال وارد مرحله اجرایی شد
  • پایان آزار و اذیت ماهواره ای برای اخترشناسان
  • دلیل کاهش کیفیت اینترنت فیبر در خارج از کشور است
  • “پیام” باید به یک الگوی ملی تبدیل شود. معاون رئیس جمهور نوآوری ؛ ایران دیجیتال را رانندگی کنید
  • عدالت: وضعیت زیرساخت ارتباطات در رافسانجان قابل قبول نیست
  • مشاغل دیجیتال به یک برنامه زمان برنامه ریزی شده بحران نیاز دارند
  • شروع فرآیند تولید شرکت های اقتصاد دیجیتال از امکانات اضطراری
  • شورای عالی شورای عالی فضای مجازی کمیته نظارت بر رویکرد دستی را تشکیل داد
  • توسعه یک شبکه اطلاعاتی ایمن و پایدار در شبکه ملی
  • معاون شبکه ملی اطلاعات معاون وزارت ارتباطات منصوب شده است
  • آماده سازی فرودگاه Payam برای واردات فوری مواد مخدر و کالاهای اساسی
  • ادعای نصب برج های ارتباطات از راه دور در کشور درست نیست
  • برای شناسایی شرکت های فعال در خدمت نمازگزاران Arbaeen تماس بگیرید
  • “تغییر آدرس” و “درخواست انتشار در آدرس جدید” را راه اندازی کنید
  • مقاومت در برابر زیرساخت های ارتباطی در اوج جنگ 6 روزه تحمیل شده
  • ارتباط نمازگزاران از آربین با ظاهر هماهنگ و جهادی تسهیل می شود
  • وزیر ارتباطات: از هر اقدامی که باعث تضعیف نزدیکی ملی شود باید اجتناب شود
  • مردم ایران هیچ تجاوز/ نیاز به مستند سازی جنایات رژیم صهیونیستی و ایالات متحده را نمی پذیرند
  • وزیر ارتباطات: وضعیت دسترسی به ارتباطات به پیش شرط ها بازگشت
  • به طور خودکار مجوزهای فعالیت صادر شده توسط سازمان فناوری اطلاعات
  • بازدید از وزیر ارتباطات به سیستم عامل ها و شرکت های دیجیتال
  • پشتیبانی هدف برای شرکتهای مبتنی بر دانش در زمینه ارتباطات افزایش یافته است
  • تماس تلفنی تلفن ثابت تا پایان ماه ژوئیه رایگان بود
  • نیاز فوری به همکاری استراتژیک برای محافظت از زیرساخت های حیاتی
  • ارز مبادله Nubitx: ما مبلغ سرقت شده را جبران می کنیم
  • ایرانیان در خارج از کشور دسترسی به فرستاده های محلی/کاهش برخی محدودیت ها
  • حملات سایبری قبل از حمله به ایران/ کودکان بی گناه در یک رویا کشته شد
  • کاربران خارجی وارد برنامه می شوند.
  • شهروندان از پیام های متنی و نمایندگان مراقبت می کنند
  • تمهیدات جدید برای گیرندگان بسته های پستی نه در مقصد

[xero_seo]

دسته ها

  • اخبار
  • دسته‌بندی نشده
  • About
  • Advertise
  • Careers
  • Contact

کلیه حقوق برای مجله خبری اقتصاد ارتباطات محفوظ است.

بدون نتیجه
مشاهده تمام نتایج
  • Home

کلیه حقوق برای مجله خبری اقتصاد ارتباطات محفوظ است.