• About
  • Advertise
  • Careers
  • Contact
دوشنبه, می 19, 2025
بدون نتیجه
مشاهده تمام نتایج
مجله خبری اقتصاد ارتباطات
  • اخبار اقتصاد ارتباطات
  • rss
  • اخبار اقتصاد ارتباطات
  • rss
بدون نتیجه
مشاهده تمام نتایج
مجله خبری اقتصاد ارتباطات
بدون نتیجه
مشاهده تمام نتایج
خانه اخبار

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد!

توسط روجا تحریری نوری
ژانویه 20, 2025
در اخبار
0

هوش مصنوعی ممکن است در کارهای خاصی مانند کدنویسی یا تولید پادکست، عملکرد خوبی داشته باشد اما یک پژوهش جدید نشان داده است که هوش مصنوعی برای قبول شدن در یک امتحان تاریخ سطح بالا مشکل دارد.

به گزارش ایسنا، گروهی از پژوهشگران یک معیار جدید را برای آزمایش سه مدل زبانی بزرگ «چت‌جی‌پی‌تی-۴»(GPT-4) شرکت «اوپن‌ای‌آی»(OpenAI)، «لاما»(Llama) شرکت «متا»(Meta) و «جمینای»(Gemini) گوگل درباره پرسش‌های تاریخی ایجاد کرده‌اند. این معیار موسوم به «Hist-LLM»، درستی پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی «سشات»(Seshat) آزمایش می‌کند که یک پایگاه داده گسترده از دانش تاریخی است و نام ایزدبانوی خرد مصر باستان را دارد.

به نقل از تک کرانچ، پژوهشگران مؤسسه پژوهشی «Complexity Science Hub» مستقر در اتریش، نتایج این بررسی را ناامیدکننده خواندند. مدل زبانی که بهترین عملکرد را داشت، «GPT-4 Turbo» بود، اما دقت آن فقط حدود ۴۶ درصد تخمین زده شد که خیلی بیشتر از دقت حدس زدن تصادفی نیست.

«ماریا دل ریو چانونا»(Maria del Rio-Chanona)، دانشیار علوم رایانه «کالج دانشگاهی لندن»(UCL) و از پژوهشگران این پروژه گفت: نکته اصلی پژوهش ما این است که اگرچه مدل‌های زبانی بزرگ، چشمگیر هستند، اما هنوز عمق لازم را برای درک تاریخ پیشرفته ندارند. آنها برای حقایق اساسی، عالی هستند، اما وقتی صحبت از پژوهش‌های تاریخی دقیق‌تر در سطح دکتری به میان می‌آید، هنوز به کارآیی لازم نرسیده‌اند.

پژوهشگران پرسش‌های تاریخ را که مدل‌های زبانی بزرگ در پاسخ دادن به آنها اشتباه کرده بودند، در اختیار تک‌ کرانچ گذاشتند. به عنوان مثال، آنها از GPT-4 Turbo پرسیده بودند که آیا «زره فلس» در یک دوره زمانی خاص در مصر باستان وجود داشته است یا خیر و مدل زبانی بزرگ پاسخ مثبت داد. این درحالی بود که زره فلس ۱۵۰۰ سال پس از آن دوره در مصر ظاهر شد.

چرا مدل‌های زبانی بزرگ در پاسخ دادن به پرسش‌های تاریخی بد عمل می‌کنند؛ در حالی که می‌توانند در پاسخ دادن به پرسش‌های بسیار پیچیده در مواردی مانند کدنویسی بسیار خوب باشند؟ چانونا پاسخ داد: احتمالا به این دلیل است که مدل‌های زبانی بزرگ تمایل دارند از داده‌های تاریخی بسیار برجسته برون‌یابی کنند و بازیابی دانش تاریخی مبهم‌تر را دشوار می‌دانند.

به عنوان مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در طول یک دوره تاریخی خاص، ارتش ثابت حرفه‌ای داشته است یا خیر. در حالی که پاسخ صحیح منفی است، GPT-4 به اشتباه پاسخ مثبت داد. این پاسخ احتمالا به این دلیل داده شده که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران مبنی بر داشتن ارتش‌ ثابت وجود دارد.

چانونا گفت: اگر ۱۰۰ بار به شما A و B و ۱ بار C گفته شود و سپس درباره C از شما پرسیده شود، ممکن است A و B را به خاطر بسپارید و سعی داشته باشید از آن استنباط کنید.

پژوهشگران تمایلات دیگری را نیز درباره مدل‌های زبانی بزرگ شناسایی کردند؛ از جمله این که مدل‌های شرکت اوپن‌ای‌آی و لاما درباره مناطق خاصی مانند جنوب صحرای آفریقا عملکرد بدتری داشتند. این نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی آنهاست.

«پیتر تورچین»(Peter Turchin)، سرپرست این پژوهش گفت: نتایج نشان می‌دهند که مدل‌های زبانی بزرگ هنوز در برخی حوزه‌های خاص نمی‌توانند جایگزین انسان باشند.

با وجود این، پژوهشگران هنوز امیدوارند که مدل‌های زبانی بزرگ در آینده بتوانند به مورخان کمک کنند. آنها در حال کار کردن روی اصلاح معیار خود با گنجاندن داده‌های بیشتر درباره مناطق کمتر ارائه‌شده و افزودن پرسش‌های پیچیده‌تر هستند.

در مقاله این پژوهش آمده است: اگرچه نتایج ما مناطقی را برجسته می‌کنند که مدل‌های زبانی بزرگ به بهبود یافتن در آنها نیاز دارند، اما این نتایج بر پتانسیل این مدل‌ها برای کمک به پژوهش‌های تاریخی نیز تأکید می‌کنند.

انتهای پیام

منبع خبر: https://www.isna.ir/news/1403110100311/%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-%D9%86%D9%85%DB%8C-%D8%AA%D9%88%D8%A7%D9%86%D8%AF-%D9%BE%D8%A7%D8%B3%D8%AE-%D8%AF%D8%B1%D8%B3%D8%AA%DB%8C-%D8%B1%D8%A7-%D8%A8%D9%87-%D9%BE%D8%B1%D8%B3%D8%B4-%D9%87%D8%A7%DB%8C-%D8%AA%D8%A7%D8%B1%DB%8C%D8%AE%DB%8C-%D8%A8%D8%AF%D9%87%D8%AF

روجا تحریری نوری

روجا تحریری نوری

نوشته‌ی بعدی

«نقشه گوگل» ۲۰ ساله شد

نوشته‌های تازه

  • آیا فصل جدید مدیریت فناوری در ایران توسط برنامه ملی هوش مصنوعی شکل گرفته است/ آیا سازمان ملی هوش مصنوعی است؟
  • 5 ٪ افزایش در تعداد کاربران ملی خدمات دولت هوشمند
  • الزام برای به دست آوردن مجوز وزارت بهداشت برای برنامه های خدمات آزمایشگاهی
  • ما مخالف حل مجوز تاکسی های اینترنتی شهرداری ها هستیم
  • اتفاقی که برای جلسه سخنگوی دولت با سخنگوی دولت افتاد
  • برنامه وزارت ارتباطات برای جذب مشارکت در بخش خصوصی در پروژه های ملی
  • قیمت طلا در بازار تهران سقوط می کند
  • ارسال پیام کوتاه و اخطار ممنوع است
  • تولید محتوای گسترده از میراث تاریخی و مذهبی با هوش مصنوعی
  • ما باید دانش آموزان را برای ابزارهای هوش مصنوعی آماده کنیم
  • بحران هویت انسانی در دوران هوش مصنوعی به ایده های جدید نیاز دارد
  • پشتیبانی تأیید شده از تولید بزرگ در فضای مجازی/ محتوای تشکیل شده در کشور
  • تعداد مشترکین ثابت و تلفن همراه برای اتصال باند پهن چقدر است؟
  • تأثیر ملموس از هوش مصنوعی در بهبود بخش فرهنگی و رسانه ای/کاهش هزینه های تولید با استفاده از هوش مصنوعی
  • یک مشکل غیر منتظره در فولاد قانونگذاری
  • ثبت نام 2 میلیون رومینگ تماس ملی
  • AREF: قوانین سنتی را نمی توان به فضای مجازی گسترش داد
  • AREF: قوانین سنتی را نمی توان به فضای مجازی گسترش داد
  • نقش اصلی فن آوری های ارتباطی در شکل دادن به آینده هوشمند
  • 2 ٪ سهم ارتباطات ثابت از شکایات ثبت شده در سیستم 1
  • طراحی 2 پروژه هوش مصنوعی کلانشهر برای کمک به تسکین انرژی
  • مشترکین پهنای باند موبایل از 5 میلیون کاربر فراتر رفتند
  • توزیع دو بسته 6 تریلیون تومانی برای حمایت از شرکت ها بر اساس دانش
  • آخرین وضعیت وب سایت ها برای نسل های پنجم کشور
  • توسعه ارتباطات ، اقتصاد دیجیتال دیجیتال ایران
  • مدیریت و شفافیت مبتنی بر داده بهترین نوع مدیریت افراد است
  • Ranjbarzadeh: سرانجام اینترنت باعث آسیب جدی به تجارت اینترنت شد
  • وزیر ارتباطات: پروژه های امسال برای یک صنعت فضایی بزرگ به پایان می رسد
  • توسعه ارتباطات ، اقتصاد دیجیتال دیجیتال ایران
  • کشف برنامه های ارتباطات ملی در روز ارتباطات جهانی
  • چرا اینترنت در طول برق کند می شود؟
  • ویدیو/ پزشکان: مدیریت بدون اطلاعات و داده های دقیق ، سرگردان
  • کیفیت خواسته های وزارت ارتباطات
  • وزیر ارتباطات: پروژه های امسال برای یک صنعت فضایی بزرگ به پایان می رسد
  • ما تحت وزن قلدری قرار نخواهیم گرفت/دستاوردهای علمی را رها نخواهیم کرد
  • اگر می خواهیم مشکلات را حل کنیم ، به داده نیاز داریم
  • حضور رئیس جمهور در مراسم افتتاح ICT
  • کاشت نبض یک گل – isna
  • چالش های ویدئویی/ پنهان در قلب فیبر
  • منشور ایرانی برای تغییر روابط عمومی
  • مهمترین موانع برای توسعه فیبر در کشور/ برای محتوای ایران باید جابجا شود
  • صفحه درخواست شده شما پیدا نشده است.
  • وزیر ارتباطات در مورد تأخیر اینترنت در هنگام وقفه در منبع تغذیه توضیح داد
  • حراج فرکانس 5G هفته آینده برگزار می شود
  • شفافیت بیشتر در مورد توهمات و محتوای مضر هوش مصنوعی از Open II
  • نیاز به استفاده از فناوری های پیشرفته برای دستیابی به عدالت دیجیتال
  • حمله سایبری علیه ارز پایه و سهام کوین
  • بزرگترین آشفتگی مغناطیسی در جهان توسط پست در کهکشان ارسال شد
  • روز ارتباطات جهانی ؛ امکان بررسی صنعت فناوری اطلاعات
  • جمعیت کاربران اینترنت چقدر افزایش می یابد؟

[xero_seo]

دسته ها

  • اخبار
  • دسته‌بندی نشده
  • About
  • Advertise
  • Careers
  • Contact

کلیه حقوق برای مجله خبری اقتصاد ارتباطات محفوظ است.

بدون نتیجه
مشاهده تمام نتایج
  • Home

کلیه حقوق برای مجله خبری اقتصاد ارتباطات محفوظ است.