ردپای هوش مصنوعی در میلیونها مقاله علمی
بررسی گسترده گروهی از پژوهشگران آمریکایی و آلمانی نشان میدهد که هوش مصنوعی در نوشتن میلیونها مقاله علمی نقش داشته است.
احتمالاً شما هم ناخواسته با محتوای آنلاین جذابی روبهرو شدهاید که به طور کامل یا جزئی توسط نسخهای از یک مدل زبانی بزرگ ایجاد شده است. از آنجا که منابع هوش مصنوعی مانند «چتجیپیتی»(ChatGPT) و «جمینای»(Gemini) در تولید نوشتار با کیفیت نزدیک به توانایی نوشتاری انسان مهارت بیشتری پیدا میکنند، تشخیص بین نوشتار کاملاً انسانی از محتوایی که با مدلهای زبانی بزرگ اصلاح شده یا به طور کامل توسط این مدلها تولید شده، دشوارتر شده است.
به نقل از فیز، افزایش ناگهانی تعداد نویسندگان مشکوک هوش مصنوعی، نگرانیهایی را در جامعه دانشگاهی ایجاد کرده مبنی بر این که محتوای تولیدشده توسط هوش مصنوعی، بیسروصدا در حال ورود به نشریات تحت داوری دقیق است.
گروهی از پژوهشگران آمریکایی و آلمانی برای آشکار کردن میزان گستردگی محتوای مدلهای زبانی بزرگ در نگارش آکادمیک، بیش از ۱۵ میلیون چکیده را از مقالههای زیستپزشکی موجود در پایگاه «پاپمد»(PubMed) تحلیل کردند تا مشخص کنند که آیا مدلهای زبانی بزرگ تأثیر قابل توجهی را بر انتخاب کلمات خاص در مقالههای منتشرشده در مجلات داشتهاند یا خیر.
بررسی این گروه پژوهشی نشان داد که از زمان ظهور مدلهای زبانی بزرگ، افزایش قابل توجهی در فراوانی انتخاب واژههای خاص در مقالههای دانشگاهی وجود داشته است. دادههای این پژوهش نشان میدهند که حداقل ۱۳.۵ درصد از مقالههای منتشرشده در سال ۲۰۲۴ با مقداری پردازش از سوی مدلهای زبانی بزرگ نوشته شدهاند.
از زمان انتشار چتجیپیتی در حدود کمتر از سه سال پیش، شیوع محتوای هوش مصنوعی و مدلهای زبانی بزرگ در وب به شدت افزایش یافته و نگرانیهایی را درباره دقت و صحت برخی از پژوهشها ایجاد کرده است. با وجود این، تلاشهای گذشته برای تعیین کمیت افزایش نقش مدلهای زبانی بزرگ در نگارش آکادمیک به دلیل اتکای آنها به مجموعههایی از متنهای تولیدشده توسط انسان و هوش مصنوعی محدود شده بود. این گروه پژوهشی خاطرنشان کردند که چنین وضعیتی میتواند سوگیریهایی را ایجاد کند زیرا مستلزم فرضیاتی درباره مدلهایی است که دانشمندان برای نگارش با کمک مدلهای زبانی بزرگ خود استفاده میکنند و این که دقیقاً چگونه آنها را به نوشتن ترغیب میکنند.
پژوهشگران در تلاش برای اجتناب از این محدودیتها، تغییرات در استفاده بیش از اندازه از کلمات خاص را پیش و پس از انتشار عمومی چتجیپیتی بررسی کردند تا هرگونه روند آشکار را کشف کنند. این گروه پژوهشی، بررسیهای خود را براساس پژوهش پیشین بهداشت عمومی درباره کووید-۱۹ مدلسازی کردند که توانست با مقایسه مرگ و میر پیش و پس از همهگیری، تأثیر کووید-۱۹ را بر مرگ و میر نشان دهد.
این پژوهش جدید با بهکارگیری همان رویکرد پیش و پس، الگوهای استفاده بیش از اندازه از کلمات را پیش از ظهور مدلهای زبانی بزرگ و پس از آن تحلیل کرد. پژوهشگران دریافتند که پس از انتشار مدلهای زبانی بزرگ، تغییر قابل توجهی از استفاده بیش از اندازه از واژههای محتوایی به سوی کاربرد بیش از اندازه از انتخاب واژههای گلچینشده وجود داشته است.
همچنین این گروه پژوهشی، تفاوتهای قابل توجهی را در استفاده از مدلهای زبانی بزرگ بین حوزههای پژوهشی، کشورها و مکانهای برگزاری شناسایی کردند.
این پژوهش در مجله «Science Advances» به چاپ رسید.
نظر شما