آمار وخیم است. سال گذشته در برخی کشورها فقط نیمی از مردم کتاب می خوانند. اما واقعیت از این هم تلخ تر است. هوش مصنوعی آموزشدیده بر روی میلیونها کتاب اکنون با ارائه خلاصههای فوری به کاربران، انگیزه مطالعه را از بین میبرد. اما اگر نسل بعدی کتاب نخواند و سپس نویسندگان دست از نوشتن بردارند، مدلهای هوش مصنوعی در آینده از کجا یاد خواهند گرفت؟ آیا هوش مصنوعی خودش را می کشد؟
به گزارش ایسنا، در هفته ای که گذشت، پوسترهای «پیاده روی کتاب»، «پاییز کتاب» پشت ویترین کتابفروشی ها و… برای نسلی که امروز در چت ربات های هوش مصنوعی به دنبال پاسخ هستند و نه در کتاب ها، یادآوری بود برای گذراندن وقت با دوست عزیزی که دیگر مثل گذشته محبوبیتی ندارد.
گزارش های اخیر تصویر نگران کننده ای را برای آینده کتاب ترسیم می کند. محققان دانشگاه های معتبر آمریکایی و اروپایی هشدار می دهند که ما شاهد یک پارادوکس تاریخی هستیم: فناوری که برای رشد خود به کتاب نیاز داشت، اکنون همان منبع حیاتی را تخلیه می کند.
سقوط آزاد خواندن
وضعیت کتابخوانی در ایران چندان امیدوارکننده نیست و جالبتر اینکه حتی مقامات رسمی هم نمی توانند رقم دقیقی ارائه دهند.
ابراهیم حیدری دبیر سی و سومین دوره از هفته کتاب در نشست خبری 20 آبان 1404 اعلام کرد:آخرین نظرسنجی سرانه که برای سال 2018 اعلام شد، 12.2 دقیقه بود.وی افزود: موج بعدی که در سال 1402 ساخته شد و قرار بود در سال 1403 منتشر شود، هنوز منتشر نشده است.
این یعنی آخرین آمار رسمی از شش سال پیش. 12.2 دقیقه در روز حیدری تصریح کرد: «صدا و سیما با شاخص های مختلف تا 30 دقیقه آمارسازی کرده اند» که نشان دهنده عدم شفافیت در سنجش این شاخص است.
آزاده نظربلند، دبیرکل نهاد کتابخانه های عمومی کشور نیز در همین نشست با بیان اینکه سرانه مطالعه عنصری تک بعدی نیست که تنها برگرفته از اطلاعات و آمار نهاد کتابخانه های عمومی کشور باشد، گفت: مطالعه در این زمینه تنها به صورت تک بعدی نیست. در موسسه بالاخره آماری از تعداد اعضای فعال، تعداد کتاب ها و تعداد کتاب های امانت گرفته شده داریم. اما اینکه چقدر این امر منجر به خواندن می شود، مشخص نیست.
این در حالی است که سید عباس صالحی، وزیر فرهنگ و ارشاد اسلامی در سال 1396 اعلام کرد: ایرانیان روزانه 13 دقیقه وقت خود را صرف مطالعه کتاب می کنند. کشوری مانند ایران با چنین فرهنگ غنی و تمدن طولانی لیاقت این وضعیت را ندارد.
اما نائومی بارون، استاد زبانشناسی در دانشگاه آمریکایی که سالها در مورد تأثیر فناوری بر مطالعه تحقیق کرده است، هشدار میدهد: “طوفانی عالی برای مطالعه در راه است. هوش مصنوعی در زمانی ظهور کرده است که کودکان و بزرگسالان زمان کمتری را برای خواندن کتاب صرف میکنند.”
ارزیابی ملی پیشرفت تحصیلی نشان می دهد که تعداد دانش آموزان کلاس چهارمی که تقریباً هر روز برای تفریح مطالعه می کنند از 53 درصد در سال 1984 به 39 درصد در سال 2022 کاهش یافته است. از 35 درصد در سال 1984 به تنها 14 درصد در سال 2023.
در انگلستان، نظرسنجی موسسه ملی سوادآموزی در سال 2024 نشان داد که تنها یک سوم از افراد 8 تا 18 ساله از خواندن در اوقات فراغت خود لذت می برند. نسبت به سال قبل نزدیک به 9 واحد درصد کاهش داشته است.

تهران، خیابان الخبال، سنگفرش کتاب – آبان ماه 1404
پارادوکس برای غول های فناوری و کتاب
حالا هوش مصنوعی وارد معادله شده است. همان هوش مصنوعی که برای رشد به کتاب نیاز داشت. بیایید به معروف ترین آنها نگاه کنیم مدلهای هوش مصنوعی باید چند کتاب و داده یاد بگیرند:
GPT-4 (OpenAI): بر اساس اطلاعات فاش شده، GPT-4 با 1.8 تریلیون پارامتر ساخته شده است. این یعنی 10 برابر بزرگتر از GPT-3. این مدل بر روی 13 تریلیون توکن (واحد متن) آموزش داده شد. برخی از این داده ها از مجموعه داده Books3 می آید که شامل متن بیش از 170000 کتاب است. منابع دیگر عبارتند از LibGen (بیش از 4 میلیون کتاب) و همه GitHub. هزینه آموزش این مدل؟ بیش از 100 میلیون دلار.
کلود (انتروپیک): Entropic در مورد جزئیات فنی ابر صحبت های زیادی کرده است، اما اسناد دادگاه این راز را فاش می کند. در شکایت علیه Entropic، مشخص شد که این شرکت میلیونها کتاب فیزیکی خریداری کرده، آنها را اسکن کرده (با حذف سرعت صحافی) و با نرمافزار OCR به متن دیجیتال تبدیل کرده است. هر کتاب به صورت دستی توسط مهندسان بررسی و درجه بندی شد. ابر احتمالاً بیش از 175 میلیارد پارامتر دارد و بر روی 5 تا 15 تریلیون کلمه آموزش داده شده است.
هوش مصنوعی متا و بلومبرگ: این شرکت ها همچنین از همان مجموعه داده Books3 برای آموزش مدل های LLaMA و BloombergGPT خود استفاده کردند.
پل ترمبلی (نویسنده و معلم آمریکایی) و مونا اواد (نویسنده کانادایی-آمریکایی) در ژوئیه 2023 علیه OpenAI شکایت کردند. آنها ادعا کردند که ChatGPT توانسته است “خلاصه های بسیار دقیق” از کتاب های آنها را ارائه دهد. سندی که نشان می دهد مدل این شرکت روی آثار آنها آموزش دیده است.
اما اینجاست که داستان عجیب می شود: همان ابزاری که با خوردن کتاب بزرگ شد، اکنون خواندن را غیر ضروری می کند. بارون در تحقیق خود می نویسد: “امروز می توانید با خواندن خلاصه داستان و مضامین کلیدی با هوش مصنوعی، رمان کلاس خود را پشت سر بگذارید. این نوع فرصت انگیزه افراد را برای خواندن خود ضعیف می کند.”
این در حالی است که قاضی ویلیام آلسوپ در دادگاه فدرال در ژوئن 2025 در مورد پرونده Entropic گفت: “شکایت نویسندگان تفاوتی با این ادعا ندارد که آموزش نوشتن به دانش آموزان منجر به انفجار آثار رقیب می شود.” دادگاه آموزش هوش مصنوعی را “به طور قابل توجهی متحول کننده” خواند و در نهایت به نفع Anthropic رای داد!

اگر نسل بعدی کتاب نخواند چه؟
برخی پیشبینیها حاکی از آن است که تا سال آینده، حدود 90 درصد از کتابهای منتشر شده در جهان تا حدودی تحت تأثیر هوش مصنوعی قرار خواهند گرفت. از نوشتن و ویرایش گرفته تا بازاریابی و توزیع. اما اگر مردم کتاب نخوانند، نویسندگان آینده کمتر خواهند بود. و اگر کتاب جدید کمتر منتشر شود، نسل بعدی هوش مصنوعی بر اساس چه داده هایی آموزش می بیند؟
آیا باید بر روی خروجی های مدل های امروزی آموزش داده شود؟ محققین این سناریو نام بردند “فروپاشی مدل” آنها در حال یادگیری هستند وقتی هوش مصنوعی بر روی داده هایی که تولید می کند آموزش ببیند، کیفیت نتایج به تدریج کاهش می یابد.. مانند کپی کردن، کیفیت هر بار پایین تر است.
سال گذشته، انجمن نویسندگان آمریکا فاش کرد که هارپر کالینز با مایکروسافت قرارداد داشته است. پنج هزار دلار برای هر عنوان کتاب غیرداستانی و سه سال حق استفاده به عنوان داده آموزشی.
این عدد بسیار مهم است. چرا از آنجا که Anthropic (خالق Cloud AI) در دادگاه در سال 2023 استدلال کرد که بازار داده های آموزشی اصلا وجود ندارد. استفان پترسون، اقتصاددان در همان شرکت مینویسد: «تحلیلهای اقتصادی نشان میدهد که یک بازار رقابتی فرضی برای مجوزهایی که دادههای مربوط به آموزش مدلهای زبان پیشرفته را پوشش میدهند، غیرعملی است. اما معامله هارپر کالینز این استدلال را تضعیف کرد. حالا یک عدد روی میز است و نویسندگان می توانند ضرر واقعی را ثابت کنند.
برایان کیسی و مارک لملی، محققین قانون مالکیت فکری، در مجله حقوق تگزاس می نویسند: “مجموعه داده ها آنقدر بزرگ هستند که هیچ گزینه معقولی برای مجوز همه داده ها وجود ندارد. بنابراین حل و فصل یک ادعای حق چاپ به این معنا نیست که صاحبان حق چاپ پول دریافت می کنند، بلکه به این معنی است که اصلا استفاده نمی شود!”
در نهایت، در حالی که دادگاه ها همچنان به پرونده های میلیارد دلاری رسیدگی می کنند، از Getty Images v. Stability AI گرفته تا The New York Times v. OpenAI. آینده فرهنگ کتابخوانی در یک دوراهی حساس قرار دارد.
در ایران نیز به نظر می رسد که بررسی سرانه فراتر نمی رود. در همین حال، ChatGPT با 300 میلیون کاربر فعال ماهانه و بیش از یک میلیارد بازدید وب سایت، کتاب ها را در اختیار گرفته است!
شاید راه حل پیدا کردن تعادلی باشد که هم نویسندگان را تشویق به ایجاد محتوای با کیفیت کند و هم به نوآوری هوش مصنوعی لطمه ای وارد نکند. اما تا آن زمان، هوش مصنوعی همچنان از همان منبعی پشتیبانی میکند که باعث میشود آنها نامحبوب و شاید ناکارآمد باشند. به عنوان موجودی که ناخواسته، شاید ناخودآگاه به سوی نابودی کشیده می شود.
اما سوال اصلی که پاسخ آن را در آینده بهتر می توان مشخص کرد این است که آیا شاهد خودکشی تدریجی هوش مصنوعی هستیم؟ یا بالاخره بشریت راهی برای حفظ هر دو (کتاب و هوش مصنوعی) پیدا خواهد کرد؟
(می توانید نظرات خود را در این مورد در بخش نظرات به اشتراک بگذارید.)

برخی منابع
https://www.tehrantimes.com/news/426873/ایرانیان-وزیر-فرهنگ-روز-13-دقیقه-در-روز-خوانند-هستند.
https://theconversation.com/ai-is-making-reading-books-feel-obsolete-and-students-have-a-lot-to-lose-262680
https://en.wikipedia.org/wiki/GPT-4
https://the-decoder.com/gpt-4-architecture-datasets-costs-and-more-leaked
https://www.kdnuggets.com/2023/07/gpt4-details-leaked.html
https://www.llmrumors.com/news/anthropic-data-pipeline-book-scanning
https://creativecommons.org/2024/04/08/exploring-a-books-data-commons-for-ai-training
https://www.techpolicy.press/how-the-emerging-market-for-ai-training-data-is-eroding-big-techs-fair-use-copyright-defense
https://academic.oup.com/jiplp/article/20/3/182/7922541
https://www.skadden.com/insights/publications/2025/05/copyright-office-report
https://www.demandsage.com/chatbot-statistics
https://www.proprofschat.com/blog/chatbot-statistics
https://newbookrecommendation.com/impact-of-ai-on-the-book-publishing-industry-statistics-and-trends-for-2024
https://isbndb.com/blog/ai-and-machine-learning-in-the-book-industry
https://themuslimtimes.info/2025/11/04/rise-of-ai-written-books-on-amazon-2023-2024
انتهای پیام
منبع خبر: https://www.isna.ir/news/1404083019255/%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C-%D8%AE%D9%88%D8%AF%DA%A9%D8%B4%DB%8C-%D9%85%DB%8C-%DA%A9%D9%86%D8%AF

